
对增强学习(RL)代理来说,奖励机制是学习的重要手段,但设计奖励机制往往耗时耗钱,也容易发生人为错误。于是,Google Brain联手多伦多大学和Vector研究院,以3种常见的人类学习机制vs传统RL的任务奖励机制,来分析AI是否更接近人类。
Danijar Hafner
重点新闻(0108~0114)
增强学习 奖励机制 Google Brain
不求奖励的RL代理就更像人类吗?Google Brain告诉你
对增强学习(RL)代理来说,奖励机制是学习的重要手段,用来鼓励代理探索环境、从尝试错误中找出最佳解法。增强学习的著名案例,包括打败人类围棋冠军的AlphaGo、自学三种棋类且达超人等级的AlphaZero、破解50年蛋白质结构预测难题的AlphaFold,以及近日登上Nature期刊、靠自学精通多种游戏的MuZero。通常,RL被视为迈向通用AI的关键。
但要设计RL代理的任务奖励机制,往往耗时、耗钱,也容易发生人为错误。因此,Google Brain联手多伦多大学和Vector研究院,透过评估3种常见的学习动机机制,来探讨AI是否能像人类婴儿般,只靠内在目标(Intrinsic objective)就能探索世界、找出最佳解法。
这3种机制包含输入熵(Input entropy)、资讯获取(Information gain)、赋权(Empowerment),其中,输入熵是鼓励RL代理接收不常见、稀有的输入值,而资讯获取是用来鼓励代理找出环境规则,赋权则鼓励RL代理,尽可能运用自己对环境或输入值的影响。为评估,团队先建立含不同环境和行为的资料集,再回头计算RL代理的目标值。团队以1亿帧Atari游戏环境画面来训练7种代理(如随机、无指令、近端策略优化(PPO)、随机网络蒸馏(RND)等),并分为有奖励和无奖励两组,而在3D游戏Minecraft中,则用了1,200万帧环境影像来训练。
团队发现,在所有的测试中,3种机制与人类行为的相关性,高于与任务奖励机制的相关性。这说明,如果要让AI更像人类,就得采取接近人类的学习方法。团队同时也指明,目前关于AI可学习的人类行为资料过少,希望能再增加。该研究的资料集和程式码,已于共同作者Danijar Hafner的网站上释出。(详全文)
通用AI 自然语言理解 DeBERTa
离通用AI更近了!微软新一代自然语言理解模型超过人类表现
微软最近揭露一套改良的大型自然语言预训练模型DeBERTa,一样采Transformer架构,具15亿个参数、48个Transformer层,更在自然语言理解基准测试SuperGLUE上超越人类的89.9分,以90.3分拿下第一名。
自Google两年多前发布Transformer超大自然语言预训练模型BERT以来,就陆续出现各种变形,比如TinyBERT、DistilBERT、ALBERT,以及微软的RoBERTa、UniLM。这次,微软改良BERT和RoBERTa,将改良版命名为DeBERTa。DeBERTa有三大新特点,包括分解式注意力机制(Disentangled attention)、强化的遮罩解码器(Mask decoder),还有虚拟对抗训练的微调方法。
有别于BERT只用单一个向量来表示一个字,微软的分解式注意力机制利用两个向量来代表一个字,这两个向量分别代表字的内容与位置。而强化的遮罩解码器,来用来表达一个字的绝对位置,最后,用于微调的虚拟对抗训练方法,则能加强模型泛化能力。微软指出,DeBERTa超越人类的表现,代表离通用AI又更进一步了。未来,微软除了释出具15亿参数的DeBERTa及其程式码,还会将模型整合到微软图灵自然语言表达模型的下一个版本Turing NLRv4中,来支援微软的各种产品。(详全文)
AI监管 法规制定 Open Loop
如何监管AI?脸书发起Open Loop计划,号召全球决策者和科技公司加入
脸书日前发起Open Loop计划,要号召世界各国的政策制定者与科技公司加入,来协助制订AI科技应用的策略。脸书表示,AI技术很难让人全然了解,它对社会的影响也不易掌握,因此需要一个国际组织来研议、提出相关政策的建议。
顾名思义,Open Loop计划是要为政策制定者与政策执行者,建立一个协作、稳健的回馈回路(Loop)。也就是说,Open Loop的目标,是要在新法律规范颁布前,先设计原型并进行模拟测试,来让利害关系人了解现实世界可能发生的状况。脸书强调,政策制定者可与脸书在内的科技公司协作,建立实用的治理框架、讨论出最佳的AI法律规范。(详全文)
微软 医疗对话机器人 Azure Health Bot
微软把AI医疗对话机器人服务搬上Azure云端了!
微软近日释出Azure版的医疗聊天机器人服务Azure Healthcare Bot,用户可在Azure云端使用Healthcare Bot服务,而原有的Healthcare Bot用户,也可将服务直接搬上云。
在疫情期间,微软Healthcare Bot获美国疾管署等医疗机构使用,来回答COVID-19相关问题。现在,微软宣布将Healthcare Bot搬迁到Azure云端服务上,利用云端基础设施来强化Healthcare Bot能力,比如让开发人员以内建的医疗数据库和自然语言理解能力,来大规模建立、部署AI对话系统。Azure Health Bot目前在美东与西欧地区上线,未来还会在8个地区上线。(详全文)
JupyterLab 3.0 视觉化除错 扩充
JupyterLab新版解决扩充套件的重置痛点
热门资料科学工具JupyterLab日前推出第3版,更新了预设的视觉化除错器,并加入目录扩充套件,让使用者查看内容更容易,此外还提供发布扩充套件的新方法。
Jupyter Notebook提供网页互动式运算环境,而JupyterLab是Jupyter Notebook的进阶版,是Jupyter专案的新一代UI,提供文字编辑器、浏览器和终端等功能。JupyterLab 3.0预设提供视觉化除错器,让开发者可在笔记本单元和源代码档案下中断点,还能检视变数、浏览回呼堆叠等各种功能。此外,新版还包括目录扩充套件,用户可在JupyterLab中,使用如Word文件般的目录功能。最后,JupyterLab扩充套件能以预建置的扩充套件发布,这项更新是要解决过去用户,在使用新的扩充套件,就需要重新建置JupyterLab或是安装Node.js的问题。(详全文)
程式语言 Python TIOBE
4度夺冠!Python拿下TIOBE年度程式语言奖
TIOBE近日发布2021年1月的热门程式语言排行榜,首席执行官Paul Jansen指出,Python在2020年的TIOBE Index成长2.01%,是所有程式语言之冠,拿下TIOBE年度程式语言奖第一名。其他得奖的语言包括C、Groovy和R,成长分别为1.66%、1.23%和1.10%。
Python近年表现亮眼,从早期作为Perl的竞争对手,被系统管理员用来编写脚本,到如今已成为资料科学和机器学习领域中最受欢迎的语言。Python这几年持续挑战Java第2名的位置,Paul Jansen表示,Python很快就会取代Java,且会坐稳第2的宝座。他分析,开发者采用Python的两大原因,无非是容易学习且高生产率,而这两特质对于程式设计供不应求的现况非常重要。(详全文)
图片来源/Danijar Hafner、微软、JupyterLab
AI趋势近期新闻
1. AI Labs招募新血!聚焦医疗影像、基因、无人机和NLP等AI领域
2. 国际新创Ninu在CES亮相AI香水App,可自行设计专属香水
3. 拿捏广告预算好难?Appier用AI自动分配热门平台广告预算
资料来源:iThome整理,2021年1月
相关文章
YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作2023-12-27 18:34:43
刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人2023-09-26 21:55:08
WebOS新系统:Palm Pre手机最新款高价登港2023-06-23 15:39:14
帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应2023-06-22 09:36:10
蔚来全系产品降价3万 取消免费换电 换一次电池180元2023-06-12 17:27:49
电商平台三巨头开打最大规模折扣 价格战再次打响2023-03-05 18:58:40
爱立信节省成本裁员四千人 爱立信全球员工总数五分之一2023-02-24 22:27:29
蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭2023-02-23 16:18:14
联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出2023-02-18 12:45:25
蓝色光标2022营收亏损18亿 客户预算减少明显2023-02-18 12:40:08
三星工厂或将80%生产转至越南 因本地劳动力成本上升2023-02-17 23:09:16
香港八达通卡如何激活?没用失效过期余额怎么办2023-02-17 18:34:51
中兴通讯被曝将裁员20% 称只裁国外的2023-02-17 18:33:26
苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出2023-02-17 16:57:22
突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌2023-02-16 14:31:19
三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?2023-02-14 00:53:17
Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要2023-02-14 00:32:08
谷歌google计划重返进入中国市场?但结果可能令你失望2023-02-13 16:57:15
Zoom紧急裁员1300人 佔员工总数15%2023-02-08 14:59:11
最新资讯
炒港股要补交多少税?我也接到催交补税特别行动的电话了2025-07-23 17:36:43
淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款2024-10-01 13:01:28
哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰2024-10-01 11:22:38
白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时2024-09-27 09:10:44
北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑2024-06-28 10:07:40
手机
中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15