抓握物体对人类来说是很简单的工作,要教会机器人却相当不容易,Google先是发表不需要人工设定轨迹,就能抓取特定物体的研究,现在还要让机器人行为更像人,可以让机器人从一大群杂乱的物体中,像人一样捞出目标物,或是推开阻碍抓取目标的物体,再进行抓取物体。透过称为QT-Opt的算法,可以使用较少的训练资料就能达到更好的成效,由于真实的机器人资料难以收集,因此这对于机器人学习是很令人振奋的事。
目前机器人系统都只能在生产线上建置产品,这类受控环境中执行重复性任务的工作。而要机器人观察周围环境并决定出最佳行动方案,同时对于意想不到的结果做出反应,Google提到,要教机器人这种概括不同现实世界物体和情境的能力非常困难。
目前有两种工具可以提供机器人类似的能力,第一种是深度学习,可以处理非结构化现实场景,另一种则是增强学习,让机器人拥有更长期的推理,并展现强大的顺序决策能力。Google表示,结合这两项技术可以让机器人自行从经验中不断的学习,而不需要手动工程控制机器人的基本运动。但即便有了这个方向,前进的路途仍然充满挑战,真实世界物体具有各种不同的外观以及物理特性,即便是接触力细微的不同,都会让预测物体移动变的困难,甚至可能造成视觉上的阻挡。此外,机器人感测器的资料噪声很多,同时也增加了资料应用的复杂度。
这些原因使得要发展出一个通用型的解决方案变得不容易,除非有足够的时间收集多样的训练资料,但由于收集机器人的训练资料非常困难,促使了研究团队往开发更强大的学习算法前进,最好能够重复使用过去的经验,直接从大型资料集中获得必要的资源。但是这些还不够,机器人还需要能推断行为带来的长期后果,这对于掌握技能至关重要,
Google为此使用了新政策(Off-policy)增强学习,这个设计能让学习算法从大量过去多元的互动中,获取有用的经验,Google使用拟合深度Q-learning算法结合大规模分散式最佳化,发展出称为QT-Opt的算法,这个分散式学习算法支援连续动作空间,非常适合用来解决机器人的问题。
Google使用收集来的资料,在不需要实际控制机器人的情况下离线训练模型,模型训练完成后再部署到真实机器人上进行微调,而在执行QT-Opt算法的同时,也能累积更多可用于训练模型的离线资料。为了将这个算法用于机器人抓握,Google以7个真实机器人,在4个月内运行800小时,而且为了加速资料收集,他们先使用人工设计的政策,在15-30%的运行时间都能成功执行任务后,再将资料收集切换到训练模式。该政策是拍照并回传机械手臂的动作,离线资料包含抓取一千种不同物体的资讯。
由于跨机器人的抓取经验可以互相分享,7个机器人共享58万次的大型抓握资料集,最后研究团队获得了一个真实世界机器人的抓握政策,从数量上来看,QT-Opt算法在没看过的物体进行700次的抓握,达96%的成功率,比先前监督学习抓握法的成功率78%,错误率下降了5倍。
当一群物体组成一个闭锁环状时,机器人自动发展出在捡取特定物体之前,先推开其他物体,再进行抓取。另外,当机器人第一次尝试抓取物体失败时,会改变方向重新定位后,再次进行抓取直到成功。当机器人要从一大群物体中抓取特定物体时,会先在物体中捞一捞,直到可以抓住目标为止。而且当人们故意将机器人抓住的物体拍落时,机器人也会自动重新定位后,再次捡起物体。
而这些类似人类操作物体的行为都不是人工设计的,而是系统以QT-Opt自我监督训练下学习的。Google还提到,QT-Opt能够使用更少的训练资料,达到更好的训练成效,这对于训练瓶颈通常在于收集训练资料的机器人研究,是一件令人兴奋的发现。而QT-Opt是一种通用的增强学习方法,用途并不仅限于机器人抓握,未来他们还会继续使用在其他机器人研究上。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万92023-12-28 19:41:57
- 吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市 预售价格22.99万元2023-12-28 19:30:28
- 日本丰田汽车厂11月全球产量创新高2023-12-28 19:26:02
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09