图/IBM提供
IBM首次揭露一项结合AI、云端及自动化技术的创新服务RoboRXN,主要用于化学实验场域,来找出一种新兴化学分子(molecule)的潜在制程。IBM苏黎世研究院经理暨杰出研究员Teodoro Laino表示,这项技术已经实际用于COVID-19的新药制程研究中,用来缩短新药从研发到上市的时间,IBM也现场展示了新分子3-Bromobenzylamine的自动化合成过程,这是IBM今年4月找出的3,000种潜在治疗药物小分子之一,预计在年底揭露更多研究成果。
过去要发现一项新材料并成功上市,需要数年到数十年的时间,比如在研发尼龙(Nylon)这项材料时,花费了10年才正式投入市场,而研发维生素B12(vitamin B12)更是花了12年,所需的人力多达上百名,投入的成本更估计高达1,000万美元。为了解决研发时间过长的问题,Teodoro Laino表示,IBM研发了RoboRXN技术,若结合超级电脑或量子电脑的运算力,就可能将新药、新材料从研发到上市的时间缩短到1年,投入成本降至100万美元,对于具有急迫性的新药研究,能带来更大的效益。
IBM提供了一个新药化学合成全自动的云端服务,化学家只要先上云提供设计好或过去找出来的新型分子结构,这个平台可以自动用AI模型,找出该分子结构最可能由那些常见的化学分子组成、及其合成步骤,也就是运用AI进行逆合成分析(retrosynthesis)的作法,再进一步,自动将合成方法转换成控制指令,送给可远端操控实验室的机器,自动合成出这个新型分子,等于从分子结构分析、生产制程预测到最后真的生产出实际的化学成品,这套云端服务可以全程自动化完成。
RoboRXN服务的云端软件界面。
这项技术的应用场景,在于当化学家提出了一种新颖的分子结构后,可以透过RoboRXN提供的逆合成分析技术,再不需人工干预的条件下,在几秒钟到几分钟之间,分析出该分子可以由哪些市售材料合成,甚至远端操控机器来自动化合成。IBM苏黎世研究院认知健康照护与生命科学领域的研究员Matteo Manica表示,这项技术并非用于找到新分子或新药的结构,而是用来加速新分子制程研究。
靠AI预测新分子制程,就像分析苹果派的原料与烹饪过程
IBM发表RoboRXN时,也进一步解释了以AI进行逆合成分析的技术概念。
IBM苏黎世研究院博士前研究员Philippe Schwaller指出,市面上有一些逆合成分析工具,仰赖专家手动订定分析规则,这种基于规则来进行逆合成分析的方法,会随着文献资料量倍增,而逐渐不够全面,因为专家的知识经验也有限。换句话说,在软件中手动添加规则的方式,反而局限了逆合成分析的结果。
IBM苏黎世研究院提出的论文指出,为了解决这个问题,许多专家近年来也提出了多种新分析方法,大致可归纳为基于图形(Graph-based)或基于序列(Sequence-based)两大类,而IBM正是采用了基于序列的方法,将化学反应的分子结构转换为简化分子线性输入规范(SMILES)的表现形式,也就是将分子化合物及其合成分子,分别以文字序列来表示,如此一来,就能把“分子化合物由哪些分子合成?”的预测问题,视为自然语言(NL)问题,因为“分子化合物”对应到“哪些合成分子”的问题,就类似于“英文句子”对应到“哪句中文翻译”的问题。
应用了这个概念,IBM设计了一组深度学习Seq2seq模型,借此来预测出新分子所需的分子组合,就像是预测一个苹果派用到的食材原料有哪些,比如切片苹果、面团、糖、蛋液、牛奶、肉桂等,而面团又需要用奶油、面粉来制作。
第一个AI模型,会预测新分子可能的组成成分。
接着,IBM也开发了第二个AI模型,基于第一个AI模型的分析结果(苹果派原料),进一步找出其烹饪步骤,比如应加入哪些特定分量的食材、混合并搅拌均匀,再放入烤箱烘烤,控制烘烤温度与时间,最后取出苹果派完成制作。对应到分子的制程,则是透过AI模型,来预测新分子的合成步骤。
第二个AI模型,主要用于分析新分子的合成步骤。
而IBM应用于第二个AI模型的技术,更被刊登在科学期刊Nature Communications中,其中提到,第二个AI模型背后,IBM其实还预训练了一个的NLP模型,以人工标注的方式来进行训练与调教。这个NLP模型,能用来分析各论文、专利等非结构化的文本内容,从中自动萃取出中简化的化学反应步骤,再以此来训练第二个AI模型,使其拥有预测分子合成步骤的能力。
IBM苏黎世研究院研究员Alain Vaucher指出,NLP模型的最大作用,就是将数百万个文本内容,转换为第二种AI模型容易学习的资料格式,再由第二个AI模型预测出一系列化学反应步骤,来指示机器或化学家执行。
第三个AI模型,也就是隐藏在第二个AI模型后的NLP模型,主要将文本资料内容转换为标准化的资料格式,提供第二个AI模型使用。
Teodoro Laino也补充说明,AI模型的正确率取决于资料集的使用,比如IBM运用公开、可取得的通用化学反应资料集,所训练的模型准确率可达90%,整个AI系统的训练资料量更超过200万笔。但这套AI模型也无法预测出所有分子的合成方法,遇到瓶颈时,使用者可以重新训练AI,让AI学习新的化学反应与合成方法,来提高模型表现。
自动将合成步骤转译为机器语言,云端抛送指令给机器执行
经过AI预测出新分子的制程后,下一步,则是要将AI预测结果转化为机器指令,来自动化合成新分子。为此,IBM也设计了一个硬件翻译器,把人工可读的合成步骤,自动转换为机器可读的格式,以此命令机器执行合成任务。
不过,目前自动化合成技术仍有局限,Teodoro Laino表示,从执行面来看,现有的合成技术局限于不超过4~5个步骤的合成任务,过多步骤或涉及提纯(purification)技术的步骤,目前仍无法支援。比如IBM发表会现场实际以3-Bromobenzylamine为例,来展示其自动化合成的过程,涉及的步骤仅有7项,以添加、混合、搅拌、冷却、萃取及温度控制等步骤为主。如下所示:
IBM发表会现场实际以3-Bromobenzylamine为例,来展示其自动化合成的过程,过程中仅花费1小时即合成完成。
位于IBM研究院中的自动化机器设备。
为了让遍布全球的化学家都能使用这项服务,IBM也将整套RoboRXN技术设计为云端服务,让分散各地的化学家,能在IBM化学平台(IBM RXN for Chemistry)中共同协作,这项服务也尤其能在疫情期派上用场,让研究员能不受在家工作的限制,持续透过云端工具进行研究。
Teodoro Laino也提到,这套技术也能部署在用户的私有云中,可以让有资安疑虑的研究单位在地部署。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万92023-12-28 19:41:57
- 吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市 预售价格22.99万元2023-12-28 19:30:28
- 日本丰田汽车厂11月全球产量创新高2023-12-28 19:26:02
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09