AI趋势周报第152期：马赛克处理就能藏住秘密吗？荷兰资安顾问AI解码工具还原给你看最新消息

荷兰一位资安顾问开发一套AI工具Depix，利用线性盒滤波器的特性，可将图片中被马赛克的文字还原。

图片来源:

Sipke Mellema

重点新闻(1211～1217)

马赛克 Depix 线性盒滤波器

马赛克处理就能藏住秘密吗？荷兰资安顾问AI解码工具还原给你看

为隐藏敏感资讯，许多人将图片中的密码或敏感字眼以马赛克来遮掩，降低原本文字的分辨率。但近日荷兰一位资安顾问Sipke Mellema开发一套AI工具Depix，可将马赛克后的文字还原，而这套工具上传至GitHub才一个多礼拜，就获得11K颗星星。

Sipke Mellema指出，一般图片的文字马赛克是以线性盒滤波器（Linear box filter）方法来处理，也就是将想遮掩的长方形文字区域，以该区的平均像素值来模糊化。而Spike Mellema的破解方法，就是针对线性盒滤波器设计。他解释，线性盒滤波器属于确定性算法，也就是说，将同样的值打马赛克，就等于将同样的区域打马赛克，而以同样的区域位置来模糊化同样的文字，就等于相同的区域值。

要用Depix来还原文字不难，首先，使用者得将图片中的马赛克文字区域，以单一个长方形局部截图出来，接着再透过德布鲁因序列（De Bruijn Squence）产生器，产出预期的文字序列，以相同字体（包括颜色、大小等）贴到一个编辑器。再来，再将贴上的文字序列截图，最后执行python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png即可。最后，Spike Mellema也建议使用者不该以马赛克方式来处理敏感资讯，因为这还是不够安全。（详全文）

医疗影像AI 影像标注 花莲慈济

动动手指就能标注！花慈将模型训练整合临床工作流程，让医生无痛训练AI

花莲慈济医院日前展示一套医疗影像标注App，将原本耗时耗力的AI医疗影像标注作业，整合至医生临床工作流程，让医生在替患者看诊或巡房期间，可直接在工作专用的平板上进行肝脏肿瘤的影像标注，教AI准确揪出微小的肝脏病灶。

花莲慈济医院今年6月开始发展AI，首先瞄准肝脏肿瘤辨识。他们找来开发自家行动医疗资讯系统（Mobile HIS）App的厂商商之器，在原有的Mobile HIS基础上，再整合院内医疗传输系统（PACS）、Nvidia新一代超级电脑DGX算力和NGC平台上的医疗AI模型资源，新增一项AI辅助标注功能至Mobile HIS App中，让医生可在病患拍完医疗影像后，同步在App上开启影像，来查看AI模型所标注的肝脏肿瘤位置是否正确，并以手动修正。而AI就靠修正后的结果，来自我学习、自我改善。

这个方法，有别于传统医生须坐在桌机前，以鼠标圈选病灶的工作模式。花莲慈济医院接下来，还计划在影像标注中，导入NGC平台上的更多类型的医疗AI模型，来发展不同疾病的AI侦测模型。（详全文）

资料湖 临床资料 FHIR

临床资料乱糟糟？AWS HealthLake资料湖能自动辨识还转换为国际标准FHIR格式来统整

AWS日前在自家re:Invent大会上，推出医疗产业专用的云端资料湖服务HealthLake预览版，可用来集中医药机构各种孤立资料源和不同格式的资料，还能以机器学习自动将资料正规化，并储存为国际医疗资料交换标准FHIR格式档案，省下人工清理资料的繁琐过程。

AWS表示，HealthLake瞄准临床资料非结构化且一致性低的痛点，让使用者可用来储存、标注和标准化这些资料。医院得先将资料从本地系统复制一份到AWS上，资料湖会透过理解医学词汇的NLP算法，来辨识资料内容，并为事件按时序加索引，再加入标准化标签（如医药、条件、诊断和疗程），以方便未来搜寻。此外，这些资讯会按FHIR产业格式架构，便于和其他单位或第三方应用互通、分享，也方便病患查询电子病历。（详全文）

骨髓抹片 数位病理 云象

骨髓抹片细胞分类全自动！云象将骨髓抹片AI整合显微镜自动操作

台湾数位病理新创云象科技不只与台大医院联手，打造全球第一套骨髓抹片细胞分类AI，现在还进一步将这套准确率为94％的AI与显微镜硬件整合，成为一套自动骨髓抹片AI系统HemaAuto，不仅能辨识15种骨髓细胞，还将骨髓细胞分类作业全程自动化，将显微镜选取最佳视野、切换倍率、滴油、骨髓细胞对焦、取像，再到后台AI的细胞分类、计数和摘要报告的产出，都完全自动化。

进一步来说，这套骨髓抹片AI由台大医院血液科团队和云象历时三年开发，双方也借此打造了60多万颗骨髓细胞标注数据库。现在，这套AI系统让医检师不必再手动操作显微镜，不需在高低倍率间切换、寻找最佳视野。因为HemaAuto透过算法来搜寻最佳视野，并预判该视野内的有效细胞数量，再以最佳路径规划来移动显微镜头并拍照取景。云象指出，未来使用者可一次放入多张玻片，系统可先完成所有取像和预判。（详全文）

Alexa 即时翻译 机器翻译

支援数十种语言，Alexa也能即时翻译

Amazon日前宣布Alexa新增即时翻译功能Live Translation，借由语音辨识和机器翻译两种技术来翻译不同语言的对话，目前可支援英文、法文、西班牙语、印度话、巴西葡萄牙语、德语和意大利语。这个新功能类似Google助理的翻译模式，可在行动装置上即时支援数十种语言的多轮对话。Amazon指出，即时翻译新功能以Alexa的多语言模型为基础，可让Echo装置同时说出和辨识多种语言。

在使用上，用户只需说“Alexa，翻译法文”，它就会在英文和法文间翻译。在翻译期间，Echo装置会发出哔哔声来指示何时该换另一种语言说话，此外，Echo装置还会搭配Echo Show屏幕，来显示对话的逐字稿记录。（详全文）

模型训练 SageMaker 函式库加速

TB级资料集也不用等太久！AWS机器学习平台SageMaker靠新函式库加速模型训练

AWS宣布自家机器学习平台SageMaker开始支援一套新资料平行运算函式库SDP，专门用来加速模型训练时间，就算开发者用的是TB级的资料集也能缩短不少时间。

AWS指出，资料集和模型越来越复杂，专门处理大规模分散式训练的开发者就得花更多时间和硬件资源来训练模型，即便采用AWS EC2 p3或p4这类GPU执行个体服务也是。为解决问题，AWS设计出可支援TensorFlow和PyTorch两种框架的SDP，用来缩短分散式训练时间和降低运算成本。AWS指出，SDP可将Mask-RCNN的训练时间，从去年纪录的26分钟缩短为今年的6分45秒。目前，SDP已在全球上线。（详全文）

Google 动作辨识 口语表达障碍

你的眼睛会说话，Google用ML打造Look to Speak程式

Google以机器学习打造一款Look to Speak应用程序，是专门为口语表达困难的使用者所设计的手机App，可透过Android手机追踪使用者眼球的移动，并选出所要表达的句子、再由手机App朗读出来。

有别于传统方法，Look to Speak程式先列出常见句子，使用者靠眼球在手机屏幕上下左右方移动，再透过机器学习模型辨识，来帮助使用者选定想要表达的句子，甚至能客制化句子。最后，App还会将句子大声朗读，让使用者的沟通更顺畅。目前，Look to Speak支援Android 9.0及以上版本。（详全文）

资料增强 GAN ADA

AI训练资料不够吗？Nvidia新GAN技术可砍20倍训练资料量

Nvidia日前发表一项以GAN为基础的资料增强技术ADA，可在训练过程中自动调整训练资料，来降低过度拟合（Overfitting）的状况，也就是避免产生与输入值过度相近的资料；与此同时，ADA还可大幅减少训练AI模型所需的资料量。

Nvidia也将ADA用于自家对抗生成网络StyleGAN2上，他们发现，原本需要上万张图画训练，才能产出近似原历史画作的StyleGAN2，在ADA的帮助下，只需要不到1,500张就可产出同精准度的艺术作品，让AI模型训练资料量减少了10至20倍。Nvidia指出，ADA除了可用于艺术创作，未来还希望用于医疗保健业，比如针对罕见疾病，来产生相关的训练资料，供AI模型训练。（详全文）