最牛抓取机器人：X射线“看透”物体堆，还能适应不同环境

智东西 04-09 1696

前言：

今天大家对“3opt算法”都比较看重，我们都想要了解一些“3opt算法”的相关内容。那么小编同时在网摘上搜集了一些关于“3opt算法””的相关知识，希望各位老铁们能喜欢，看官们一起来学习一下吧！

智东西（公众号：zhidxcom）

编 | 董温淑

智东西1月14日消息，近日，谷歌和加州大学伯克利分校的研究人员在论文预印本网站arXiv上发表了两篇论文，描述了两项新的人工智能（AI）技术，使机器人能更好地适应从未见过的新环境、完成行抓取、捡拾、丢弃等任务。

第一项研究介绍了X射线机器搜索方案，能提高机器人识别目标物体的准确率。第二项研究介绍了一个适应训练算法，能提升机器人在不同环境中抓取目标物体的能力。

在实验环境中，机器人模型的抓取准确率达到82%！在模拟真实环境条件下，该机器人模型的抓取准确率也可以达到最高90%。

一、用X射线“透视”物体堆，抓取准确率比基线策略高15%

在电子商务、货仓货物装卸、家庭服务等场景中部署机器人可以节省人力资源、提升人类生活质量。但是，现有的机器人模型普遍不够智能，无法准确找到用户指定的物体，面对堆放的物体时尤其如此。

谷歌和加州大学伯克利分校的研究人员认为，集成X射线模块可以让机器人“透视”物体堆，提升机器人识别准确率。

这项研究名为《X射线：通过最小化学习占有率进行机器搜索（X-Ray：Mechanical Search for an Occluded Object by Minimizing Support of Learned Occupancy Distributions）》

论文链接：

1、分布率学习+X射线，让机器人“看透”物体堆

在这项研究中，研究人员让机器人模型记忆目标对象的外型，再让其用X射线照射堆放的物体，找出物体堆内部与目标对象外型最像的物体。

实验中，研究人员先训练机器人学习物体的分布情况，用3D物体模型模拟真实物体的堆放。

研究人员从开源数据网站Thingiverse（共有1296个3D CAD模型）中取样，选择出10个体积相等、尺寸不同的盒子作为目标物（长宽比从1:1到10:1不等）。为了使目标物更容易被遮挡，选取出的10个盒子厚度较小。

每一个目标物体都单独生成一个含有10000张图像的数据集，10个目标物体最后总共生成了100000张图像。为了对机器人学习情况进行验证，研究人员将每个10000张增强深度图像的数据集划分为训练集和测试集。其中，约8000张图片被用于训练，剩余约2000张则用于验证测试。

利用训练集，研究人员训练出一个基于ResNet-50模型的全卷积神经网络，训练时间约为2.5个小时。

接下来，用测试集验证模型对占有率分布的学习情况。

用平衡精度（Bal.Acc.，Balanced accuracy）和并交比（IoU，Intersection over Unio）来度量网络的学习情况。Bal.Acc.和IoU数值越大，代表学习效果越好。

表格第一列为模型在测试集中的表现，模型对长宽比1:1的盒子的分布率预测最为准确，Bal.Acc.和IoU值分别达到了98%和0.91。

除了长方体盒子，研究人员还选取了4个不规则物体作为目标对象进行示例预测。结果显示，模型能预测出前3个物体（盖子、多米诺骨牌、长笛）的分布情况。

基于对占有率分布预测的学习，研究人员为机器人集成X射线模块，让机器人“透视”物体堆、找出与目标物体外型最相似的物体。

实验过程中，先把物体堆的RGBD图像（通过X射线照射得到）和目标物体外型输入模型。模型根据RGBD图像预测物体堆内部分布情况，找出外型“像”目标物体的物体，并部署一个最简单的抓取动作。

2、被遮挡物体也能认出来

实验结果显示，不论目标物体是被完全遮挡还是部分遮挡，机器人都能通过判断物体形状把它识别出来。

上行目标物体被完全遮挡，下行目标物体被部分遮挡

研究人员比较了X射线策略与两个基线模型的抓取结果。X射线方案在82%的情况下成功抓取出目标对象，比表现最佳的基线策略还高15%。

二、进行模型适应训练，机器人抓取准确率最高达98%

通过第一项研究，机器人的抓取准确率有所提高，但实际应用场景与实验室模拟环境有很大差别。为了提升机器人在货仓、家庭等不同工作环境中的稳健性，研究人员对其进行了适应性训练。

这项研究名为《基于视觉的端到端机器人控制的高效适应训练（Efficient Adaptation for End-to-End Vision-Based Robotic Manipulation）》

论文链接：

1、预训练+改变实验条件，提升机器人环境适应性

首先，研究人员对抓取机器人模型进行预训练，选用QT-Opt算法，训练分两步进行。

第一步，在离线状态下训练机器人模型进行580000次抓取（约花费6000个小时）；

第二步，在线条件下，训练该模型对同一组对象进行28000次抓取。

经过两步训练，机器人模型在实验室模拟环境的抓取准确率能达到96%。

然后，研究人员模拟出5种真实环境，记录机器人在这5种环境中的抓取准确率。

5种环境分别为：棋盘背景、强光照射、将夹钳伸出1cm、将夹钳偏移10cm、用透明瓶子做目标物。

与基础策略相比，机器人在研究人员新设置的5种环境中的抓取准确率均有所下降，将夹钳偏移10cm时准确率下降最多（下降了39%）。

接下来，研究人员利用5种仿真环境中的训练数据，结合基本训练集，对模型进行微调。

2、准确率回升，最高可达98%

最终，经过1～4个小时的学习，机器人模型的抓取准确率回升。在基础条件下，抓取准确率达到98%；在棋盘格背景条件下，抓取准确率最高，达到90%。

论文还指出，随着训练时间继续加长，机器人的表现会更好。

结语：下一步将实现自动化

谷歌和加州大学伯克利分校的研究人员利用X射线机器搜索策略及一系列模型适应性训练方法，研发出一款环境适应性较高的抓取机器人。相比于已有的机器人模型，这款机器人更能适应实际应用的要求。

研究人员还表示，将在未来继续探索，下一个目标是提高机器人自动化程度，使其能够在无人监督的情况下完成任务。

文章来源：VentureBeat，arXiv

本文地址：http://www.longkongtuishu.com/cacf7BA1sDVMFDlA.html

标签： #3opt算法