谷歌为Alphabet的辅助机器人增加了人工智能语言技能以更好地理解人类

时间:2024-11-12 11:13:38 来源:
导读 谷歌的母公司Alphabet正在将其最雄心勃勃的两个研究项目——机器人技术和人工智能语言理解——结合在一起,试图制造出能够理解自然语言命令...

谷歌的母公司Alphabet正在将其最雄心勃勃的两个研究项目——机器人技术和人工智能语言理解——结合在一起,试图制造出能够理解自然语言命令的“辅助机器人”。

自2019年以来,Alphabet一直在开发可以执行简单任务的机器人,例如取饮料和清洁表面。这个EverydayRobots项目仍处于起步阶段-机器人速度缓慢且犹豫不决-但机器人现在已经升级:谷歌的大型语言模型(LLM)PaLM改进了语言理解。

大多数机器人只响应简短的指令,比如“给我拿一瓶水”。但是像GPT-3和谷歌的MuM这样的LLM能够更好地解析更多倾斜命令背后的意图。在Google的示例中,您可能会告诉EverydayRobots原型之一“我把饮料洒了,你能帮忙吗?”机器人通过可能动作的内部列表过滤此指令,并将其解释为“从厨房给我拿海绵”。

是的,对于“智能”机器人来说,这是一个低标准,但它绝对仍然是一个进步!如果那个机器人看到你洒了一杯饮料,听到你大喊“哦,天哪,我的愚蠢饮料”然后帮忙,那将是真正聪明的事情。

谷歌将由此产生的系统命名为PaLM-SayCan,这个名称捕捉了该模型如何将LLM的语言理解技能(“Say”)与其机器人的“可供性基础”(即“Can”——通过可能的动作过滤指令)相结合。

谷歌表示,通过将PaLM-SayCan集成到其机器人中,机器人能够在84%的时间内计划对101条用户指令的正确响应,并在74%的时间内成功执行这些指令。这是一个可靠的命中率,但这些数字应该加一点盐。我们没有101个命令的完整列表,因此不清楚这些指令的限制程度。他们真的捕捉到了我们期望真正的家庭助手机器人能够理解的语言的全部广度和复杂性吗?这不太可能。

那是因为这对谷歌和其他从事家用机器人工作的人来说是一个巨大的挑战:现实生活非常混乱。我们想问一个真正的家用机器人有太多复杂的命令,从“清理我刚刚洒在沙发下的麦片”到“炒洋葱做面酱”(这两个命令都包含大量暗示知识,从如何清理谷物,到冰箱里的洋葱在哪里以及如何准备它们,等等)。

这就是为什么本世纪唯一取得哪怕一点点成功的家用机器人——机器人真空吸尘器——在生活中只有一个目的:吸尘。

随着人工智能在视觉和导航等技能方面的改进,我们现在看到新型机器人进入市场,但这些机器人的功能仍然有目的地受到限制。例如,看看LabradorSystems的Retrieverbot。它基本上是一个带轮子的架子,可以将物品从房子的一个部分移动到另一个部分。这个简单的概念肯定有很大的潜力——猎犬机器人可能对行动不便的人非常有用——但我们距离梦想中的无所不能机器人管家还有很长的路要走。

标签: