最新消息:关注人工智能 AI赋能新媒体运营

优必选开源Thinker大模型,驱动工业人形机器人新突破

科技资讯 admin 浏览

Thinker:优必选开源的机器人“大脑”,让工业人形机器人真正看懂世界

在工业机器人越来越依赖视觉与空间感知的今天,优必选正式开源了他们的全新大模型——Thinker。这不是又一个参数堆砌的AI模型,而是一个专为机器人设计、能真正“看懂”环境、做出实时反应的智能系统。它解决的,是当前人形机器人在真实场景中经常“看错、想慢、做不准”的老问题。

过去,机器人训练依赖海量互联网数据,但这些数据大多是为手机拍照、网页识别准备的,和机器人要面对的工厂流水线、仓储货架、倾斜地面、反光金属完全不是一回事。数据多,但没用。Thinker 的突破,是从源头重构数据链:它不靠“堆数据”,而是靠“挑数据”。原始200亿条数据,经过自动筛选、去噪、重标注,最终只保留1000万条高质量样本——相当于从一仓库杂货里,精准挑出1000件能用的零件。结果?模型训练更快,推理更准,对复杂环境的适应能力直接提升。

image.png

99%的标注成本被砍掉,机器人自己学会“看图说话”

人工标注机器人视觉数据有多贵?一个熟练工程师盯着视频一帧一帧打标,一天最多处理几百帧。一条完整任务链,可能需要数万小时人工。Thinker 没有走这条路。它用“弱监督+自监督+少量人工校验”三步法,让模型自己找规律、猜意图、提线索。比如,机器人看到一个螺丝松动的工件,系统会自动标记“需要拧紧”,再由工程师抽查1%的样本确认——其余99%全靠模型自己完成。

这套体系已在优必选的Alpha系列机器人上跑通。在某汽车厂的装配线上,机器人原本需要人工反复调试才能完成插接线缆任务,现在用Thinker训练后,首次部署成功率从42%提升到89%,调试时间从3天缩短到4小时。这不是实验室数据,是真实产线的反馈。

image.png

开源不是口号,是给开发者一套“能用的工具箱”

Thinker 不是封闭的黑盒。优必选已将模型权重、训练代码、数据处理脚本、评估基准全部开源在GitHub,并提供详细的部署文档和工业场景示例。你不需要顶级算力,一台搭载RTX 4090的工控机就能跑通基础推理。社区里已有开发者用它改造了AGV小车的避障逻辑,还有团队把它移植到国产开源机器人平台OpenManus上,实现“手眼协同”抓取异形零件。

更重要的是,Thinker 的“标注-训练-反馈”闭环机制是开放的。你可以在自己的工厂采集数据,上传到平台,系统会自动帮你清洗、标注、训练,再把优化后的模型推回你的机器人。这不是“我给你一个模型”,而是“我们一起让机器人变聪明”。

为什么这次不一样?

过去几年,大模型在机器人领域屡屡被质疑“华而不实”——跑得慢、耗电高、离线用不了。Thinker 的设计从一开始就没打算在云端跑。它轻量化、低延迟,推理响应控制在200毫秒内,完全满足工业场景对实时性的硬要求。同时,模型支持边缘部署,断网也能跑,不怕工厂网络波动。

优必选没有吹“通用人工智能”,他们只做一件事:让机器人在真实世界里,少出错、多干活。Thinker 的价值,不在于参数有多高,而在于它让一个普通工程师,能用三个月时间,把一台旧机器人改造成能独立完成复杂任务的新助手。

现在,这套系统已经开放给全球开发者。如果你正在为机器人视觉不准发愁,或者想让工厂里的机器人“更懂人”,Thinker,可能是你等了太久的那把钥匙。