AI可正确预测反映产率有望用于新药研发
川沙总部
人为智能(AI)是近年来的爆款话题。在医药行业,关于AI能否有效设计新药的争论也从未停息。近日,颁发在顶尖学术期刊《科学》上的一项钻研,则让我们看到了积极的一面:来自普林斯顿大学(Princeton University)和默沙东钻研尝试室(Merck Research Laboratories)的化学家们开发了一款人为智能,能够精准地预测化学反映的产率,这有望在新药开发上得到宽泛的利用。
从性质上看,新药的合成与造作是化学反映;Ъ颐俏说玫较胍姆肿,必须以相宜的比例参与正确的原料,并提供适当的反映前提。这听起来固然很单一,但让机械来预测和设计高产率的化学反映却并不容易。一个典型的化学反映必要有大量分歧的化学分子参加。而每一个额表分子的参与,城市为推算增长一个维度。即便对于近年阐发出彩的人为智能,化学家们也不是很确定它是否能胜任这项工作。
为了让机械学会设计高产率的化学反映,我们必要援手它成立一个多维度的模型。但从汗青上看,这一向是个瓶颈。其背后的原因在于这个模型过于复杂,而我们能用来训练这个模型的数据却远远不够。幸好,随着默沙东在机械人系统上的大量投入,此刻我们能在短短几天内,实现数千个化学反映。这产生了大量能够用来训练AI的数据。
▲默沙东钻研尝试室的Spencer Dreher博士(图片起源:默沙东官方网站)
“我极度欣喜地看到,我们产生的数据质量很高,能用于成立有效的模型。”默沙东钻研尝试室的Spencer Dreher博士说路。
在获得了这些数据,并利用法式对每一个输入进模型的化学品进行定量标注后,钻研人员们考量了多种统计学模型的正确率。有趣的是,行业中常用的线性回归模型在这一工作的执行上阐发并不好,而阐发最好的是一类叫做“随机丛林”(random forest)的模型。此类模型能从训练数据库中随机提取出幼量的样本,构建决定树(decision tree),而每一棵决定树都能对特定的化学反映产率进行预测。这些预测会被综合评估,产生一个总体的预测产率。了局批注,这款模型能很好地对训练数据之表的化学反映进行产率的预测。
▲“随机丛林”模型阐发最佳(图片起源:《科学》)
▲该模型能够正确预测产率(图片起源:《科学》)
“只有几百个反映数据,我们就能正确地用模型预测产率;Ъ颐巧踔炼疾槐匾等说脑,自己就能实现这些反映。」剽项钻研的第一作者Derek Ahneman博士说路。
▲普林斯顿大学的Abigail Doyle教授(图片起源:普林斯顿大学)
“我们开发的这款软件能合用于任何反映或任何底物类型,”该钻研的通讯作者之一,普林斯顿大学的Abigail Doyle教授说路:“我们但愿人们能将这一工具利用于其他反映之中。”
参考资料:
[1] Chemists harness artificial intelligence to predict the future of chemical reactions
[2] Predicting reaction performance in C–N cross-coupling using machine learning

分享到: