AI趋势周报第138期：DeepMind新方法可自动产生强化学习算法最新消息

DeepMind设计一套元学习架构，可产出强化学习算法，改善AI代理人的参数。

图片来源:

DeepMind

重点新闻(0717～0723)

DeepMind 强化学习 算法生成

DeepMind设计新方法，来自动产生强化学习算法

DeepMind近日在一篇论文中，揭露自行设计的后设学习（Meta learning）新方法，透过与环境互动，来产出更合适的强化学习算法。团队指出，强化学习能更新AI代理人（Agent）的参数，让代理人表现更好，但这种更新通常得根据好几年的研究，以人工方式从多种规则中，找出最佳规则。

DeepMind认为，自动从数据中找出新规则，能产出更有效率的算法，或是更贴近特定环境。虽然已有相关研究来探讨自动找规则，但仍无法解决一个问题，也就是找出强化学习基本概念的替代方法，比如价值函数或时间差分学习（TD Learning）。于是，DeepMind设计一套后设学习方法，借着与环境互动来找出更新的规则，包括代理人该预测什么（即价值函数）及如何从中学习（也就是自助抽样法Bootstrap）。该方法的产出值就是一套强化学习算法，DeepMind称之为习得策略梯度（LPG）。后来，DeepMind用简单的玩具环境来训练LPG，结果发现训练出的算法，能泛化应用到复杂的Atari游戏，并达到非平凡（Non trivial）表现。DeeepMind认为，这个新方法有潜力从数据中，自动产生通用的强化学习算法。（详全文）

零售业 资料保护 微软

瞄准零售资料保护需求，微软更新AI防诈欺应用程序

微软在今年开发者大会中宣布更新Dynamics 365 Fraud Prevention防诈欺应用程序，并提供预览版给用户。微软在今年5月推出防诈欺应用程序，专门锁定零售业者，要来解决使用者账号建立和管理问题，防止使用者恶意建立假账号，趁交易时获取机密资料。这次更新可分为两部分，首先是账户防护（Account Protection）功能，可追踪异常的账户活动、侦测假账户，也能让零售商自定义评估细节，比如名称、API路径，以及特定事件的有效负载。再来是损失预防（Loss Prevention）功能，可根据全通路的购买纪录，利用AI来侦测恶意退货或不合理折扣等异常模式，让零售商以此来降低损失。（详全文）

皮克斯 GAN 超高分辨率

皮克斯用GAN来产生超高分辨率电影画面

知名动画电影公司皮克斯（Pixar）技术总监Vaibhav Vavilala日前揭露如何以对抗生成网络（GAN），来解决动画影视业常面对的高清问题。他指出，为打造更好的视觉体验，皮克斯常需渲染超高分辨率（如2K或4K）的动画。但这个做法耗时又耗成本，因为，光是渲染1帧2K超高分辨率的画面，就耗费50个GPU小时，对90分钟的电影来说，团队每秒需渲染24帧，如果是4K分辨率，成本和时间就加倍了。

为解决问题，Vavilala决定先让动画团队以较低的分辨率来制作电影，再透过ML系统来提高分辨率。不过，要教ML系统正确填入光影和颜色并不容易，所以Vavilala决定用善于生成的GAN。于是，他先设置了PyTorch开发环境，然后用皮克斯近期电影中，高、低分辨率的影像来训练模型。他指出，后来，制作团队用这套系统，来把1K的画面提高至2K品质，可以降低自家算图农场5成至7成的处理成本。（详全文）

AI超级电脑 Nvidia 佛罗里达大学

Nvidia联手佛罗里达大学，要打造学术界最快AI超级电脑

Nvidia近日联手佛罗里达大学（UF），宣布要一起开发学术界最快的AI超级电脑计划。进一步来说，Nvidia将以超级电脑DGX SuperPOD架构，来强化UF现有的超级电脑HiPerGator，效能将达700 Petaflops，预计明年正式上线。

UF指出，这套优化过的超级电脑，可为师生提供更好的AI运算工具，来帮助跨领域的研究如人口老化、个人化医疗、都市交通和食物安全等。（详全文）

机器学习 手术排程 中国附医

预计年底上线！中国附医要靠ML精准预测422种手术时间

中国附医开发一套手术排程模型，可根据病患状况，来准确预测手术所需的时间，目前已可预测25个科别、共422种手术的时间。这套模型能让医院能掌握手术室使用时间、提高利用率。中国附医预计在今年底，将这套模型实际用于临床手术排程。

为训练模型，团队收集了中国附医2017年至2019年、共17万笔EMR资料，也从70种参数中，选出重要的24种。接着，团队用清洗过的11万笔资料来训练模型，再利用今年3、4月收集的7千多笔资料，来测试模型。团队发现，XGBoost表现最好，其R2决定系数值可达0.85，已达临床可用的程度。现在，团队正将这套模型打造成一套手术排程系统，要在今年底前，实际应用于中国附医的临床手术排程。（详全文）

Cloud 护理工作 医疗语音平台 恩主公医院

听懂中英夹杂和专业术语，恩主公医院医疗语音平台95%准确率上线

恩主公医院日前揭露一款临床医疗语音平台，历经两年开发，不仅能听懂护理专业术语，还能辨识中英夹杂语句。这款平台搭配小型耳机和麦克风，护理师可以口说方式，来记录护理工作内容、调阅资料，不必像过去，照护完患者后，还要回到护理站花2个小时输入护理纪录。

这套系统由恩主公医院和纬创科技共同打造，为训练语音辨识系统，纬创收集了2万多条词汇，接着与恩主公医院设计了1,000个句子，由医院8位护理人员来念这些句子，再将这些语音用来训练系统。完成后，这个平台部署到医院系统，让护理人员直接在病床旁边打开护理车上的系统，透过语音指令选择要输入的字段，再说出照护资讯，系统就能自动输入到字段中。（详全文）

AWS 低阶基础设施 Copliot

不需手动管理低阶基础设施！AWS推出命令列工具Copilot

AWS释出新的ECS命令列工具AWS Copilot，用户不再需要手动管理低阶的基础设施，就能在ECS上部署应用程序。AWS指出，要建立云端应用程序架构，需考虑许多元件，比如VPC子网络、负载平衡器、部署工作流程和应用程序的永久储存等。

而Copilot可处理这些细节，使用者只需提供Dockerfile，再加上几个指令，Copilot就能在AWS上建立、启动容器，并配置负载平衡器，甚至能建立CI/CD工作流程，当开发者将新的程式码提交到储存库时，自动重新部署应用程序新版本。（详全文）

3D姿势 运动员 纽约时报

用AI捕捉运动员3D姿势，赛事报导更精准

为改善体育赛事的报导方式，纽约时报用AI开发一套3D姿势量测模型，从连拍相片中计算出体操选手的3D骨架，撷取肉眼容易漏看的姿势细节，让记者有更完整的资料，来报导运动员表现。

进一步来说，在比赛现场，纽约时报摄影师会从多个角度拍摄运动员，并用机器学习算出每个影格中的运动员2D姿势，再以相机参数和三角化算法，从2D姿势回推3D姿势，系统可从3D姿势序列计算出旋转速度、跳跃高度等评分指标。（详全文）

摄影／王若朴

图片来源／中国附医、微软、Nvidia、AWS、纽约时报

AI趋势近期新闻

1. 纬创集团携手微软成立创新产品办公室，两年将投五千万元研发AI新产品