机器人 Darwin 行走时身体仍会摇摇晃晃,有时候还会跌倒,但它跟大多数机器人不一样,它会从错误中学习(这点跟人类很像),飞快地调整技术。

它的踉跄学步导致新一代自动机器人的产生,不需要人类重新设定程序,它可以适应变动的环境和新的情境。这些机器人能进行救援或清理受灾区等危险作业,或者成为家务或包裹递送小帮手。

带领 Darwin 研究计划的加州大学柏克莱分校博士后研究员 Igor Mordatch 表示:「自动机器人能接受更高程度的目标,找出完成的方法。那将会是一股极为强大的力量。」

机器人的学习方式

Darwin 从两个 GPU 加速深度学习网络取得它所需要的知识,深度学习技术透过多层模拟神经网络,利用模仿人脑的算法进行「学习」。这些神经网络的学习方式跟人类一样,强化或弱化神经元之间的链结以回应反馈内容。

Darwin 的学习分为两个阶段:在模拟和在实际环境里。当成学习基础的 Mordatch 创造出模拟机器人 Darwin 实体(长度、周长等)的模型,还有指定部分基本环境特征(象是地毯或粗糙地形),就是没教机器人怎么走路。

在模拟环境里,机器人利用已获得的知识来找出动作的正确顺序,象是如何将腿摆放到定位以走到特定位置,或是如何扭动身躯以便从倾斜的姿势立直身子。

在无人教导的情况下,机器人运用深度学习技术从地板上站起来。

迅速学习

在第二阶段里,Darwin 把在模拟环境里习得的内容用在实际环境里。这里情况就变得有点复杂,Darwin 得立即判断在崎岖地面上保持平衡,或是扭动脚踝过多的时候就会跌倒,得重新再站起来一次。

Mordatch 说:「就算我们尽量逼真模拟真实环境,两者还是有所差异,而那正是我们需要迅速让机器人进行学习的原因。」

要学习如此复杂的内容,得借重 GPU 的力量。

「如果我们透过 CPU 来训练机器人,需要一周的时间;但使用 GPU 的话,只要三小时就好了。」Mordatch 说,他使用托管在 Amazon 云端环境里的 GPU 来进行训练。

深度学习技术及大脑

Mordatch 服务于加州大学柏克莱分校机器人技术助理教授 Pieter Abbeel 的实验室,在 Mordatch 继续进行 Darwin 研究案的同时,也将深度学习技术用于建立人体模型。他跟来自史丹福大学的研究人员组成团队,研究人脑如何创造出动作。

这项知识总有一天能够让医界进一步预测部分手术会如何影响到病患的行动。