APP下载

脸书步行机器人全靠学习即时适应真实世界路况,该技术能降低机器人生产成本

消息来源:baojiabao.com 作者: 发布时间:2024-05-19

报价宝综合消息脸书步行机器人全靠学习即时适应真实世界路况,该技术能降低机器人生产成本

来自脸书、柏克莱大学和卡内基美隆大学的研究人员,开发了一种称为RMA(Rapid Motor Adaptation)的技术,能够让有腿可行走的机器人,即时且智慧地适应地形和路面材质,在各种路况中行走。RMA采用两种子系统组合,其一是以增强学习训练的基本政策,另一个则是经监督式学习训练的适应性模组,该方法展示了智慧代理在不使用视觉输入的情况下,有能力适应环境,像是突然增加负重,或是在不同摩擦力的路面行走。

人类可以轻松地在岩石、泥泞、厚地毯,甚至是跳床上行走,透过调整肌肉和脚踝角度适应各种路况,甚至可以携带各种形状、大小和重量的物体。而机器人要拥有跟人类一样的行走能力,也需要适应各种表面的能力,并且可以携带各种物体,即便过去从未接触过这些条件,机器人要能避免跌倒,在数分之一秒内快速反应。

脸书RMA机器人行走能力全靠学习而来

研究人员提到,有腿的步行机器人到目前为止,开发人员需要依照环境,以几乎完全人工撰写程式码的方式,来指引机器人在环境中移动,但是要真正适应现实世界无限变化的唯一方法,便是要教机器人,能以类似人类的方式学习适应,要赋予机器人这种适应现实世界能力,需要在虚拟世界中,经过数百万次的模拟训练。

RMA是第一个完全基于学习的系统,透过探索和世界互动,使得机器人可以从头开始适应环境,RMA使用端到端学习,直接输出关节位置,不依赖预定义的腿部运动或是其他控制原语。然而,这些先在虚拟环境中模拟学习的机器人,在部署到现实世界的时候,会出现许多挑战,模拟器中的模型与实际机器人通常会有些微不同,像是在发送讯号到驱动器时,可能存在微小的延迟,又或是脚上的磨损可能让路面走起来不那么滑,甚至是关节的角度可能偏离百分之一度。

研究人员提到,物理世界本身就存在复杂性,在自由空间中运动的刚体,无法在模拟器中被精确捕捉,特别像是床垫或是泥巴表面,在接触的时候会变形。在模拟中的标准化环境,到了现实世界变得多样且复杂,当考虑到室内或是室外环境的时候更是如此,现实世界的环境条件不停改变,这也让步行机器人掌握现实环境更加困难。

RMA技术由两异步运作的子系统组合而成

RMA使用两个子系统来克服这些挑战,分别是基本政策和适应模组。基本政策在增强学习中模拟学习,使用精心设置的环境资讯,像是模拟更滑或是较不滑的地面,以及不同坡度的斜坡等,使得机器人可以在不同的外在因素中,学习正确地控制身体。

但是无法只用基本政策来部署机器人,因为在训练基本政策的时候,无法得知机器人在现实世界时,所会遭遇到的外在因素,所以必须仰赖机器人,自学在自己动作下所产生的资讯。研究人员提到,关节实际运动和命令的预期运动,两者存在的差异取决于外在因素,像是位于机器人腿部的障碍物,会阻挡机器人的腿无法移动,但也会提供有关地面高度的资讯,同样,柔软的表面,腿会因为下沉延伸的更远,而在坚硬的表面反应又不同。

因此机器人遇到模拟之外的外在因素,就必须要使用由监督式学习所训练的适应模组,以根据机器人最新的历史状态来进行预测。透过结合基本政策和适应模组,机器人可以在数分之一秒的时间,快速适应新条件。这两个子系统可以平行并且以异步的方式顺畅运作,基础政策运算较快,自适应模组运算较慢,以异步的节奏执行两个子系统,可让机器人使用小型机载电脑运算RMA,基础政策可以让机器人以较高的频率行走,而自适应模组则可以在准备好时,以较低的频率发送指令。

实验证明,支援RMA的机器人可以成功穿越几个具有挑战性的环境,像是沙滩、泥泞、高草或是泥土堆,性能比没有支援RMA的机器人好上许多,而且甚至等于或优于人工编写控制器的Unitree机器人。RMA机器人在这些路况环境中试验没有失败过,而下楼梯的成功率达到70%,穿过鹅卵石等难走的地面,成功率也达到80%。RMA机器人也能够以很高的成功率,负荷与自身体重相当的物体行走。

RMA机器人展示了先进的机器人技术,可以在现实世界中部署新型、高性能且适应性强的步行机器人,同时也展示了人工智能技术正改变机器人领域的研究,完全依赖学习的机器人,可以使用更便宜更不精确的硬件,这将能够大幅降低机器人的成本。

2021-07-13 11:15:00

相关文章