APP下载

AI趋势周报第138期:DeepMind新方法可自动产生强化学习算法

消息来源:baojiabao.com 作者: 发布时间:2024-06-17

报价宝综合消息AI趋势周报第138期:DeepMind新方法可自动产生强化学习算法

DeepMind设计一套元学习架构,可产出强化学习算法,改善AI代理人的参数。

图片来源: 

DeepMind

重点新闻(0717~0723)

DeepMind     强化学习     算法生成  

DeepMind设计新方法,来自动产生强化学习算法

DeepMind近日在一篇论文中,揭露自行设计的后设学习(Meta learning)新方法,透过与环境互动,来产出更合适的强化学习算法。团队指出,强化学习能更新AI代理人(Agent)的参数,让代理人表现更好,但这种更新通常得根据好几年的研究,以人工方式从多种规则中,找出最佳规则。

DeepMind认为,自动从数据中找出新规则,能产出更有效率的算法,或是更贴近特定环境。虽然已有相关研究来探讨自动找规则,但仍无法解决一个问题,也就是找出强化学习基本概念的替代方法,比如价值函数或时间差分学习(TD Learning)。于是,DeepMind设计一套后设学习方法,借着与环境互动来找出更新的规则,包括代理人该预测什么(即价值函数)及如何从中学习(也就是自助抽样法Bootstrap)。该方法的产出值就是一套强化学习算法,DeepMind称之为习得策略梯度(LPG)。后来,DeepMind用简单的玩具环境来训练LPG,结果发现训练出的算法,能泛化应用到复杂的Atari游戏,并达到非平凡(Non trivial)表现。DeeepMind认为,这个新方法有潜力从数据中,自动产生通用的强化学习算法。(详全文)

  零售业     资料保护    微软  

瞄准零售资料保护需求,微软更新AI防诈欺应用程序

微软在今年开发者大会中宣布更新Dynamics 365 Fraud Prevention防诈欺应用程序,并提供预览版给用户。微软在今年5月推出防诈欺应用程序,专门锁定零售业者,要来解决使用者账号建立和管理问题,防止使用者恶意建立假账号,趁交易时获取机密资料。这次更新可分为两部分,首先是账户防护(Account Protection)功能,可追踪异常的账户活动、侦测假账户,也能让零售商自定义评估细节,比如名称、API路径,以及特定事件的有效负载。再来是损失预防(Loss Prevention)功能,可根据全通路的购买纪录,利用AI来侦测恶意退货或不合理折扣等异常模式,让零售商以此来降低损失。(详全文)

  皮克斯     GAN     超高分辨率  

皮克斯用GAN来产生超高分辨率电影画面

知名动画电影公司皮克斯(Pixar)技术总监Vaibhav Vavilala日前揭露如何以对抗生成网络(GAN),来解决动画影视业常面对的高清问题。他指出,为打造更好的视觉体验,皮克斯常需渲染超高分辨率(如2K或4K)的动画。但这个做法耗时又耗成本,因为,光是渲染1帧2K超高分辨率的画面,就耗费50个GPU小时,对90分钟的电影来说,团队每秒需渲染24帧,如果是4K分辨率,成本和时间就加倍了。

为解决问题,Vavilala决定先让动画团队以较低的分辨率来制作电影,再透过ML系统来提高分辨率。不过,要教ML系统正确填入光影和颜色并不容易,所以Vavilala决定用善于生成的GAN。于是,他先设置了PyTorch开发环境,然后用皮克斯近期电影中,高、低分辨率的影像来训练模型。他指出,后来,制作团队用这套系统,来把1K的画面提高至2K品质,可以降低自家算图农场5成至7成的处理成本。(详全文)

  AI超级电脑   Nvidia       佛罗里达大学 

Nvidia联手佛罗里达大学,要打造学术界最快AI超级电脑

Nvidia近日联手佛罗里达大学(UF),宣布要一起开发学术界最快的AI超级电脑计划。进一步来说,Nvidia将以超级电脑DGX SuperPOD架构,来强化UF现有的超级电脑HiPerGator,效能将达700 Petaflops,预计明年正式上线。

UF指出,这套优化过的超级电脑,可为师生提供更好的AI运算工具,来帮助跨领域的研究如人口老化、个人化医疗、都市交通和食物安全等。(详全文)

 

  机器学习     手术排程    中国附医  

预计年底上线!中国附医要靠ML精准预测422种手术时间

中国附医开发一套手术排程模型,可根据病患状况,来准确预测手术所需的时间,目前已可预测25个科别、共422种手术的时间。这套模型能让医院能掌握手术室使用时间、提高利用率。中国附医预计在今年底,将这套模型实际用于临床手术排程。

为训练模型,团队收集了中国附医2017年至2019年、共17万笔EMR资料,也从70种参数中,选出重要的24种。接着,团队用清洗过的11万笔资料来训练模型,再利用今年3、4月收集的7千多笔资料,来测试模型。团队发现,XGBoost表现最好,其R2决定系数值可达0.85,已达临床可用的程度。现在,团队正将这套模型打造成一套手术排程系统,要在今年底前,实际应用于中国附医的临床手术排程。(详全文)

Cloud 护理工作    医疗语音平台    恩主公医院 

听懂中英夹杂和专业术语,恩主公医院医疗语音平台95%准确率上线

恩主公医院日前揭露一款临床医疗语音平台,历经两年开发,不仅能听懂护理专业术语,还能辨识中英夹杂语句。这款平台搭配小型耳机和麦克风,护理师可以口说方式,来记录护理工作内容、调阅资料,不必像过去,照护完患者后,还要回到护理站花2个小时输入护理纪录。

这套系统由恩主公医院和纬创科技共同打造,为训练语音辨识系统,纬创收集了2万多条词汇,接着与恩主公医院设计了1,000个句子,由医院8位护理人员来念这些句子,再将这些语音用来训练系统。完成后,这个平台部署到医院系统,让护理人员直接在病床旁边打开护理车上的系统,透过语音指令选择要输入的字段,再说出照护资讯,系统就能自动输入到字段中。(详全文)

AWS    低阶基础设施     Copliot  

不需手动管理低阶基础设施!AWS推出命令列工具Copilot

AWS释出新的ECS命令列工具AWS Copilot,用户不再需要手动管理低阶的基础设施,就能在ECS上部署应用程序。AWS指出,要建立云端应用程序架构,需考虑许多元件,比如VPC子网络、负载平衡器、部署工作流程和应用程序的永久储存等。

而Copilot可处理这些细节,使用者只需提供Dockerfile,再加上几个指令,Copilot就能在AWS上建立、启动容器,并配置负载平衡器,甚至能建立CI/CD工作流程,当开发者将新的程式码提交到储存库时,自动重新部署应用程序新版本。(详全文)

3D姿势     运动员      纽约时报  

用AI捕捉运动员3D姿势,赛事报导更精准

为改善体育赛事的报导方式,纽约时报用AI开发一套3D姿势量测模型,从连拍相片中计算出体操选手的3D骨架,撷取肉眼容易漏看的姿势细节,让记者有更完整的资料,来报导运动员表现。

进一步来说,在比赛现场,纽约时报摄影师会从多个角度拍摄运动员,并用机器学习算出每个影格中的运动员2D姿势,再以相机参数和三角化算法,从2D姿势回推3D姿势,系统可从3D姿势序列计算出旋转速度、跳跃高度等评分指标。(详全文)

摄影/王若朴

图片来源/中国附医、微软、Nvidia、AWS、纽约时报

 AI趋势近期新闻 

1. 纬创集团携手微软成立创新产品办公室,两年将投五千万元研发AI新产品

2. Google发布电商推荐工具公开预览版

3. Roomality使用AI打造出人工窗景

4. Amazon推出深度学习语音模组Alexa Conversations公测版,开发所需的程式码更少了!

资料来源:iThome整理,2020年7月

2020-07-23 14:48:00

相关文章