具身智能离“真·机器人时代”还有多远?王兴兴的最新判断
2026年3月17日,亚布力论坛现场,宇树科技创始人王兴兴没讲宏大愿景,也没画饼。他只说了一句话:“具身智能的‘ChatGPT时刻’,还差两三年。”
这不是悲观,是见过太多“PPT机器人”之后的清醒。他口中的“ChatGPT时刻”,定义很具体:一个机器人,面对一个从没去过的家、没碰过的工具、没听过的指令,只要有人用语言告诉它“把茶杯拿到沙发上”,它能80%的概率自己完成——不靠预设程序,不靠人工遥控,不靠反复训练。
听起来像科幻?可你想想,ChatGPT刚出来那会儿,谁也没想到它能瞬间改变搜索、写作、编程。王兴兴说,具身智能要的,就是这样一个“从不会到会”的质变点。
从“能走”到“能干”,中间隔着一座山
过去一年,国内机器人公司融资不断,展会里人形机器人频频亮相,跳舞、拿杯子、开门,看起来很酷。但王兴兴看的是另一面:这些动作,90%是在实验室里,重复上百次练出来的。一旦环境换掉——地板变地毯、杯子换成玻璃杯、指令改成“顺手把垃圾桶也带出去”——机器人就懵了。
真正的挑战不在电机有多猛、电池有多久,而在“大脑”怎么理解世界。你的一句“把桌上的东西收一收”,对人是常识,对机器人却是复杂推理:哪些是“东西”?“收”是放哪儿?要不要分轻重?有没有危险?
现在的模型,还在学“怎么走稳”。而真正能用语言指挥的,还在实验室里磕数据。王兴兴去年9月说“2026年底能自主干活”,年底改口“一两年内有希望”,今年1月更直接:“能做出真正机器人大模型的人,该拿诺贝尔奖。”——这话不是吹,是真觉得,这个突破,比当年的Transformer还难。
谁在悄悄突破?不是大厂,是小团队
你可能没听过,但2025年底,深圳一家只有30人的初创公司,让机器人在真实家庭环境中,用语音指令完成了洗碗、叠衣服、给宠物倒粮——全程无预编程,只靠一个开源模型微调。视频传开后,谷歌、英伟达的工程师都去蹲点。
这不是个例。北京、杭州、苏州,一批小团队正用“低成本+真实场景”打法,绕开大厂的高算力陷阱。他们不追求炫技,只求一件事:让机器人在乱糟糟的客厅里,听懂“帮我拿一下遥控器,别碰那盆绿植”。
硬件也在跟上。国产伺服电机成本三年降了60%,柔性手爪、触觉传感器、轻量化关节,不再是进口货的专利。但光有好身体没用——没有能“看懂生活”的大脑,机器人永远是高级玩具。
我们等的,不是会跳舞的机器人,是能当帮手的“人”
很多人以为,具身智能爆发,是机器人走进家门跳舞、陪你聊天。王兴兴说,真正改变生活的,是它能默默帮你做那些你懒得干、但每天都要做的事。
早上起床,它已经把咖啡煮好,衣服熨好,快递放在玄关;你出门前说一句“记得给阳台花浇水”,它知道今天没雨,水要少点;你半夜起来找药,它能认出你拿的是降压药,而不是维生素。
这不是未来。这是2028年可能发生的现实。王兴兴说,如果算法再有突破,比如像Transformer那样出现一个“通用物理推理框架”,那这个时间可能提前到2027年。但如果没有,那就老老实实等两三年。
别信那些“明年量产”的宣传。真正的技术,从不靠PPT推动。它藏在实验室的凌晨三点,在一次又一次失败的抓取里,在一个被摔坏的关节和重新写的代码里。
我们等的,不是机器人,是一个能听懂你、替你分担生活的人。