来自美国、德国、日本等地的强队齐聚一堂,训练、较劲和证明自己是世上最厉害的队伍。

他们不是在里约热内卢为了四年一度的赛事而较劲,而是前往今年在德国莱比锡举行的“Robocup 2016”活动现场,参加亚马逊仓库捡货赛(Amazon Picking Challenge)。今年是第二年举行这项赛事,考验无人操作机器人如何找出捡货和装货的方法。

这项竞赛象征将采用 GPU 技术的深度学习用在仓储和工厂自动化作业上的风向标。在前十名的队伍里有五支队伍皆采用深度学习技术,其中包括前两名的队伍。

Amazon Robotics 公司研究与先进发展部门经理 Joey Durham 说:“今年有许多队伍都使用深度学习的神经网络来辨识物体,跟去年的情况有极大的不同。”

仓储自动化的未来

Amazon 在其遍及全球的巨型仓库里早就使用物流机器人来搬运货架上的物品,降低碰撞到物品的机会,这些物品接下来将运送给数百万名顾客。不过辨识、拾取物品进行包装、运送和装箱,还是得靠大量的人工作业。

为了以自动化方式来进行这些工作,以及为机器人产学两界搭起桥梁,Amazon 举办了亚马逊仓库捡货赛,参赛队伍得使用会自动辨识、拾捡和装载物体的机器人,终极目标是从众多未分类的物品中完成这些工作。

来自荷兰的台夫特理工大学队在捡货和堆赛里夺冠

来自荷兰的台夫特理工大学(TU Delft)队与隶属于该校的新创公司 Delft Robotics 合作,在捡货和装货两项竞赛皆获得第一。该队能在仅短短的150毫秒里便侦测到物体。

TU Delft 队使用 NVIDIA TITAN X GPU 与约两万帧图片来训练一项“基础”模型,再据此针对“箱”和“袋”建立模型。他们使用 PyFaster-RCNN 来训练自家的深度学习系统,而这套系统采用 Caffe 架构,并使用 NVIDIA cuDNN 进行硬件加速作业。

“在这次活动结束后,Delft Robotics 目前正努力落实获得的 GPU 运算相关知识,并且将这些算法用在工业系统里。”Delft Robotics 公司计算机视觉程序设计师 Hans Gaiser 说。

德国的 UBonn Snatches 队在装箱赛中获得第二名

来自德国波昂大学的 NimbRo 队则是在装货赛中获得第二名。该队结合红外线照射的深度预估结果与两具 Intel RealSense SR300 深度摄影机,还利用两具整合式 full-HD 彩色摄影机来测量稠密立体深度。

NimbRo 队使用热门的影像辨识基准 ImageNet challenge 进行训练,并且为亚马逊仓库捡货赛对相当少量的影像加上备注。该队使用搭载四具 NVIDIA GeForce GTX TITAN X GPUs 的 Supermicro GPU 工作站进行训练和记忆作业。

日本的 PFN 队在捡货赛中获得第二名

来自日本的 Preferred Networks 与工业自动化巨子发那科(FANUC)合作,在捡货赛中获得第二名。他们使用卷积神经网络来处理两项相异的作业:使用 Intel RealSense SR300 摄影机产生的 RGBD 资料与 NVIDIA GeForce GTX 870M 笔记型计算机 GPU,以每帧图片 0.1 秒的速度进行影像分割,较在 CPU 上分割每帧图片 0.2 秒的速度更快。

Preferred Networks 部署采用 CUDA 与 cuDNN 技术的深度学习架构 Chainer,使用十万张以 Blender 进行 3D 渲染(同样在 GPU 的加持下)的图片和 1,500 张人工加注的图片,进行为期两天的训练。