最新消息:关注人工智能 AI赋能新媒体运营

通用人形机器人:从科幻走向现实的艰辛之路

科技智能 admin 浏览 评论
通用人形机器人:从科幻走向现实的艰辛之路

机器人首次登台亮相是在 1921 年元旦的第二天。早在全世界第一次看到乔治·卢卡斯的机器人之前半个多世纪,一群银色人形机器人大军就登上了捷克斯洛伐克第一共和国的舞台。从各方面来看,它们都是人形的:两只手臂、两条腿、一个头——所有人形该有的样子都齐全了。?

卡雷尔·恰佩克(Karel ?apek)的剧作《R.U.R》(《罗素姆万能机器人》)非常受欢迎。它被翻译成几十种语言,在欧洲和北美各地演出。然而,这部作品最持久的影响力在于它提出了「机器人」这个词。在过去的一个世纪里,这个词的含义已经发生了很大变化,因为恰佩克的机器人更像是有机生物体,而不是机器。?

不过,数十年来的科幻小说作品确保了大众对机器人的形象并没有偏离它的起源太远。对于许多人来说,人形仍然是机器人理想的典範——只是现有的科技水準还没有达到那种境界。本周早些时候,NVIDIA在其 GTC 开发者大会上举办了自己的机器人舞台秀,首席执行长黄仁勛被六个人形机器人的形象簇拥着走上舞台。?

儘虽然通用人形机器人的概念实际上比「机器人「这个词还要早出现,但直到最近,实现这一概念的想法仍显得完全遥不可及。我们还远未达到那一步,但第一次,人形机器人出现在了可预见的未来。?

延伸阅读:机器人看影片10小时就学会煮咖啡!2040年前,机器人能成功挑战史蒂夫·沃兹尼克的咖啡测试吗?延伸阅读:只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型

什么是「通用人形机器人」?

图片来源:NVIDIA ▲ 图片来源:NVIDIA

在我们深入讨论之前,让我们先釐清两个关键定义。当我们谈论「通用人形机器人」时,事实上这两个词对不同人有不同的含义。在大多数对话中,人们对这两个词的理解就像「哈利波特」系列中的佩妮姨妈说的那样:「我看到它就认得出来」。?

为了方便本文的讨论,我将通用机器人定义为能够快速习得技能并基本上完成人类能完成的任何任务的机器人。这里的一个大问题在于,多用途机器人并不会在一夜之间突然变成通用机器人。?

由于这是一个渐进的过程,因此很难确切地说出系统在什么时候跨越了那个临界点。对于后一点,可能会让人有点陷入哲学的陷阱,但为了让本文保持适中的篇幅,我将继续讨论另一个术语。?

当我把 Reflex Robotics 的系统称为人形机器人时,我收到了一些 (大部分是善意的) 批评。人们指出一个显而易见的的事实,那就是这个机器人没有腿。暂且撇开并非所有的人类都有腿这一点,我仍然可以称这个系统为「人形机器人」,更準确地说,是「轮式人形机器人」。依我看来,它足够接近人类的形态,可以归入人形机器人的範畴。?

前阵子,Agility 公司有人对我称Digit为「可以说是个类人形机器人」的说法提出异议,认为这没什么可争论的。很明显,这个机器人不像其他一些机器人那样忠实地尝试重现人类的形态。不过我承认,我可能有点偏见,因为我一直追蹤了这个机器人,从其前身 Cassie 演变而来的过程,Cassie 更像是一只没有头的鸵鸟 (老实说,我们都经历过尴尬的时期)。?

我经常考虑的另一个因素是类人形态用于执行类人任务的程度。这个元素并不是绝对必要的,但它是人形机器人的一个重要精神理念。毕竟,人形机器人的支持者会很快指出这样一个事实,即我们已经围绕人类建造了我们的世界,因此建造人形机器人在这世界中工作是有意义的。?

适应性是另一个用于捍卫双足人形机器人部署的关键点。机器人几十年来一直在工厂工作,而且它们绝大多数都是单一用途的。也就是说,它们是为了非常好地重複做一件特定的事情而被製造的。这就是为什么自动化如此适合製造业——那里存在着大量的统一性和重複性,尤其是在装配线的世界里。?

棕地和绿地

图片来源: Brian Heater ▲ 图片来源: Brian Heater

「绿地」和「棕地」这两个术语在过去几十年里一直在各个领域被普遍使用。前者是较早出现的一个术语,用来描述未开发的土地 (就是字面上意思,一片绿色的田野)。为了与早期术语形成对比,后来出现了「棕地」一词,指的是在现有场地上的开发。在仓库的世界里,这就好比从头开始建造一些东西,还是利用现有的一些东西进行改造上的差别。?

这两者都有利弊。棕地通常更省时省钱,因为它们不需要从头开始,而绿地则有机会完全按照规格建造一个场地。如果拥有无限的资源,大多数公司会选择绿地。想像一下,一个区域有了从头开始便针对自动化系统进行的空间布局,性能会有多好。这对大多数组织者来说都是一个遥不可及的梦想,因此,当需要进行自动化时,大多数公司会寻求棕地解决方案——尤其是在他们刚开始涉足机器人领域的时候更是如此。?

考虑到大多数仓库都是现有场地 (brownfield) 改造的,那么为这些空间设计的机器人也一样,这一点就不足为奇了。人形机器人完美地符合这一类别——事实上,在许多方面,它们可以说是最适合现有场地的解决方案之一。这可以追溯到之前关于为其环境建造人形机器人的论点。你可以放心地假设大多数现有场地的工厂在设计时都考虑到了人类工人。这通常会带来一些障碍,例如楼梯,这些障碍会对轮式机器人构成挑战。这一障碍的大小最终取决于许多因素,包括布局和工作流程。?

循序渐进

图片来源:Figure ▲ 图片来源:Figure

儘管有人可能会说我泼冷水,但我非常赞成设定现实的期望值。我从事这份工作已经很长时间了,也经历过相当多的炒作週期。在一定程度上,它们确实有用,可以用来吸引投资者和客户的兴趣,但很容易陷入过度承诺的陷阱。这既包括对未来功能的承诺,也包括示範影片。

上个月,我以一个挑衅的标题「如何为了乐趣和利益而假造机器人示範影片」撰写了一篇关于后者的文章。文中俏皮地讨论了这一点。实现伪造的方法有很多,包括隐藏的远端操控和创造性的剪辑。我听说过一些公司会加快影片播放速度,却没有披露相关资讯。事实上,人形机器人公司 1X 的名字就来源于此——他们所有的示範都以 1 倍速运行。?

业内大多数人都同意,对于这类产品,披露资讯很重要,甚至是必需的,但目前并没有严格的标準。可以说,如果此类影片在说服投资者投入鉅资方面发挥了作用,那么就会涉足法律灰色地带。至少,它们在公众中设定了过于不实际的期望——尤其是那些倾向于将夸大其辞的高管的话当作圭臬的人。?

这只会损害那些在我们所在的现实中一直勤奋工作的人。很容易看出,当系统无法达到那些期望时,希望很快就会消失,这很容易理解。?

现实中部署的时间表主要受制于两个约束因素。第一个是机电一体化的:即硬体的能力。第二个是软体和人工智慧。暂且不去争论机器人的人工通用智慧 (AGI)的哲学辩论问题,我们可以肯定地说,进展一直是而且将继续是渐进的。?

正如黄仁勋上周在 GTC 上说的那样,「如果我们将 AGI 指定为非常具体的东西,一套软体程式可以做得非常好,或者可能比大多数人好 8%。 我相信我们将在五年内实现它。」? 这正是我从该领域大多数专家那里听到的乐观估计。5 到 10 年的时间跨度似乎比较常见。?

在达到任何类似 AGI 的能力之前,人形机器人将像它们更传统的同行一样,首先作为单一用途的系统开始运作。小型试验专案旨在证明这些系统能够大规模地完成一项任务,然后再进行下一项任务。大多数人都在关注搬运货箱作为最容易实现的目标。当然,普通? Kiva/Locus AMR 可以整天搬运货箱,但这些系统缺乏移动机械手,无法自行装卸负载。这就是机器人手臂和末端执行器发挥作用的地方,无论它们是否连接到看起来像人类的东西上。?

德克斯特公司 (Dexterity) 的创始工程师罗伯特·桑 (Robert Sun) 上周在亚特兰大举行的 Modex 展会上与我交谈时提出了一个有趣的观点:人形机器人可以为实现无人值守 (完全自动化) 仓库和工厂提供一个巧妙的权宜之计。一旦全面自动化到位,你就不一定需要人形机器人的灵活性。但我们能合理地期望这些系统及时全面投入营运吗??

桑说:「我认为人形机器人可以成为物流和仓储工作向机器人工作过渡的良好切入点,因为我们现在没有人类可以胜任,所以我们可以让人形机器人先上。最终,我们将转向这种自动化的无人工厂。然后,人形机器人非常难操作的问题就使得它们很难在过渡期发挥作用。」?

延伸阅读:Figure 01人型机器人即将进驻BMW工厂,挑战传统造车模式

带我去试验项目

图片来源:Apptronik/Mercedes ▲ 图片来源:Apptronik/Mercedes

人形机器人技术目前的状态可以用一个词来概括:试运行。这是一个重要的里程碑,但它不一定能告诉我们所有资讯。试运行公告的形式是新闻稿,宣布潜在合作伙伴关係的早期阶段。双方都喜欢这样的公告。?

对于新创公司来说,它们代表了真实的可证明的兴趣。对于大型公司而言,它们向股东表明公司正在与最先进的技术合作。然而,很少提到具体数字。这些数字通常会在我们开始讨论採购订单时才会出现(即使这样,也经常不会)。?

过去一年里,已经有许多这样的合作宣布。BMW正在与 Figure 合作,而梅赛德斯则选择了 Apptronik。Agility 公司再次领先于其他公司,完成了与亚马逊的试运行项目——不过,我们仍在等待下一步的消息。值得一提的是,儘管通用系统拥有长期前景,但几乎所有业内人士都从相同的基本功能开始着手研发,这一点尤其说明问题。?

屹立的双足

图片来源: Brian Heater ▲ 图片来源: Brian Heater

对于任何拥有智慧型手机的人来说,目前通往人工通用智慧的最清晰路径应该看起来很熟悉。波士顿动力公司 (Boston Dynamics) 的 Spot 机器狗的部署提供了一个清晰的现实世界案例,展示了应用商店模式如何适用于工业机器人。虽然机器人学习领域正在进行许多引人注目的工作,但我们距离能够大规模地发现新任务和即时纠正错误的系统还很远。如果只有机器人製造商能像手机製造商一样利用协力厂商开发者就好了。?

最近几个月,人们对人形机器人的兴趣大幅增加,但就我个人而言,自去年年底以来,我的兴趣指针并没有太大变化。我们已经看到了一些绝对酷炫的展示,生成式人工智慧也展现了前景广阔的未来。OpenAI 显然在押注,先是投资了 1X,最近又投资了 Figure。?

许多聪明的人都对人形机器人抱有信心,但也还有很多人持怀疑态度。然而,有一件事我可以自信地说,无论未来工厂是否会大规模部署人形机器人,所有这些工作都会取得一些成果。即使是我採访过对此最持怀疑的机器人专家,他们也指出了美国太空总署 (NASA) 的登月模型,当年的登月竞赛促进了许多产品的发明,这些产品如今正被用于我们的地球上。?

在机器人学习、移动操作和移动 (以及其他领域) 方面,我们将继续看到突破性的进展,这些突破将以某种方式影响自动化在我们日常生活中的作用。

延伸阅读:NVIDIA发布新的机器人通用基础模型 Project GR00T、Isaac 机器人平台也升级延伸阅读:首个由GPT-4驱动的人形机器人「Alter3」!无需程式设计+零样本学习,还可根据口头回馈调整行为

 

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论