最新消息:关注人工智能 AI赋能新媒体运营

宇树开源OmniXtreme架构,流匹配技术实现人形机器人高动态动作突破

科技资讯 admin 浏览

宇树科技开源OmniXtreme:让人形机器人在春晚跳后空翻

3月5日,宇树科技(Unitree)正式开源了名为OmniXtreme的人形机器人运动控制架构,并同步发布了由公司创始人王兴兴亲自撰写的完整技术论文。这不是一次普通的代码发布——这是中国团队首次在公开领域,实现人形机器人在高动态、高复杂度场景下稳定完成后空翻、武术套路、街舞动作等极限动作的完整技术方案。

过去几年,我们见过太多机器人“表演”翻跟头,但大多依赖预设轨迹、外力辅助,甚至剪辑合成。而OmniXtreme不一样——它让G1机器人在没有任何外部支撑、完全自主决策的情况下,一次又一次地完成后空翻,成功率高达96.36%。这不是偶然,而是系统性突破。

两步训练法:先“学懂”,再“适应”

OmniXtreme的核心,是两个看似简单却极其务实的训练阶段。

第一阶段,他们没用传统的强化学习“硬训”成百上千个动作,而是用了一种叫“流匹配预训练”的方法。简单说,就是把全球顶尖的武术、街舞、体操动作数据“喂”给模型,让它自己学会这些动作背后的运动规律——就像一个舞者先看大量视频,悟出节奏和发力方式,而不是机械模仿每一个关节角度。

第二阶段更关键:机器人不是在理想环境中运行的。电机有极限、电池会发热、再生制动会反向充电。OmniXtreme加入了一个“执行器感知”模块,让机器人在执行动作时,实时感知自己的电机温度、转速、扭矩是否接近物理边界。一旦发现快超标,它会自动微调动作——不是停,而是“改一下”,确保动作完成的同时,不烧电机、不掉电。

这不是实验室里的理想模型,这是能扛住春晚现场灯光、噪音、地面不平的实战系统。

10毫秒响应,比人类眨眼还快

你可能没意识到,一个后空翻需要机器人在0.5秒内完成几十个精细动作调整。OmniXtreme的端到端推理延迟压缩到了10毫秒——比人类眨眼还快。这意味着,机器人不是“按剧本走”,而是能根据地面反馈、身体晃动实时修正,哪怕脚下一滑,也能在半空中调整重心,稳稳落地。

这套系统已经在Unitree G1上跑通,所有代码、模型权重、训练数据格式全部开源。没有隐藏条款,没有商业限制。开发者可以直接下载,在自己的机器人上复现后空翻,也可以基于它开发更复杂的动作序列。

为什么这次不一样?

过去,人形机器人做动作,靠的是“专家写脚本”;现在,OmniXtreme让机器人“自己学”。

它不依赖高精度传感器阵列,不靠云端算力,不需人工干预——用的是消费级硬件,跑在本地嵌入式系统上。这说明,真正的通用运动能力,不再属于百万美元的实验室原型,而是可以被普通团队复用、迭代、创新的开源工具。

王兴兴在论文结尾写了一句话:“我们不是在造一个会翻跟头的机器人,而是在造一个能理解身体、适应环境的智能体。”

今天,这个智能体,开源了。

QQ20260305-112924.png