让机器人通过观察人类的操作来学会操作新的物体
- 格式:doc
- 大小:18.00 KB
- 文档页数:4
让机器人通过观察人类的操作来学会操作新的物体
模仿能力是智能重要的组成部分,人和动物常常通过观察其他个体来学习新的技能。那么我们能不能将这种能力赋予机器人呢?是否可以像下图一样,让机器人通过观察人类的操作来学会操作新的物体呢?
机器人在观察人类行为后学会了将桃子放到了红色的碗里
如果拥有这样的能力,将极大地简化部署机器人完成新任务的过程。我们只需要展示给机器人需要进行的任务,而无须进行遥操作或设计复杂的奖励函数。很多工作探索了机器人可以从本身的专业经验中很好的学习,这样的学习方式称为模仿学习。
然而基于视觉技能的模仿学习需要大量专业的示范数据。例如利用原始像素输入来靠近单一固定物体的任务就需要200次表现良好的示范才能达到。如果只提供一个示范样本,要完成这样的模仿对于机器人来说十分困难。
除此之外,如果机器人需要模仿人类的示范的特定操作技能还需要面临额外的挑战。除了机械臂与人类手臂的构造差异外,在人类示范和机器人示范之间建立起正确的对应关系是一件十分困难的事情。这并不仅仅是对运动简单的跟踪和重映射,其中最主要的部分在于运动对环境中物体的影响,并且我们需要建立一个以这种相互作用为中心的对应关系。为了使得机器人可以模仿视频中人类的技能,可以结合一系列先验经验而不是从零开始学习。通过结合先前的经验,机器人可以迅速学会对于新物体的操作而在域的移动中保持不变性,就像在观察了人类的示范后机器人可以在不同背景和视角下学会操纵物体。研究人员的目标是通过从示范数据中学会学习,来实现少样本的模仿和域不变性。这种被称为元学习的技术是赋予机器人通过观察模仿人类的关键。
One-Shot模仿学习
那么如何利用元学习来帮助机器人快速的适应不同的物体呢?研究人员们采用结合元学习和模仿学习的方式来实现一次模仿学习。关键的想法在于给机器人提供某一特定任务的当个示范,机器人就能迅速的识别任务,并在不同的情形下成功解决。早先的一个工作通