谷歌DeepMind的一组研究科学家设计了一个名为SayTap的大型语言模型,可以将人类对狗的各种指令转化为四足犬形机器人可以理解的格式。这个模型使得机器狗能够理解基本的指令,比如向前走和向后走,以及更具情境性和复杂的概念,比如追捕松鼠或在热地面上快速奔跑。
为了实现这一目标,DeepMind的研究人员为四足机器狗指定了一个期望的“脚接触模式”,其中1代表着脚着地,0代表脚在空中。然后,这些输入被映射到机器狗的四条腿上,以不同的组合方式教授机器狗如何行走、小跑或原地跳跃。研究人员表示,这些脚接触模式的组合为“自然语言用户指令和运动控制器之间的新接口”。例如,在下面的视频中,一位研究人员要求机器狗“慢慢小跑向前”。底部的方框显示了一个计算机模型将这个英文指令转化为与任务相关的二进制代码。然后,这些代码被发送给机器狗,它会像一只听话的好孩子一样忠实地执行。
根据研究人员的说法,成功执行像“向前移动”这样的基本指令并不算很先进。更有趣的是,他们指出了SayTap处理“非结构化和模糊指令”的能力。通过简短的提示,研究人员成功地命令机器狗在听到“我们要去野餐”时跳上跳下。在另一个测试中,当主持人告诉机器狗“地面很烫时,请表现得像是地面很烫”,机器狗知道要快速奔跑起来。在可能是最有趣的例子中,当被告知远离松鼠时,机器狗甚至慢慢地后退。很多真正的狗主人都希望能有这种程度的服从。
研究人员在最近的一篇博文中写道:“SayTap将期望的脚接触模式引入作为自然语言和低层控制器之间的新接口。这个新接口简单灵活,而且它使机器人能够遵循直接的指令和那些并没有明确说明机器人应该如何反应的指令。”

文章评论