药学院侯廷军教授团队运用新型AI算法构建更精准的化合物毒性预测模型

来源:医药学部 发布日期:2021-05-31 访问次数:214

202157日,浙江大学药学院侯廷军教授团队在Journal of Medicinal Chemistry上在线报道了他们最新的研究成果-“多任务图注意力框架(Multi-task Graph Attention frameworkMGA)”(图1),用于化合物毒性预测。研究团队发展的新型AI算法,通过同时学习大量毒性任务,提升了毒性模型的预测精度,并能够帮助揭示化合物结构与化合物毒性之间的关系。

药物的发现和开发是一个周期长、投资高、风险高的过程,而安全性是阻碍潜在候选药物进入市场的主要因素。研究表明,药物安全性导致药物开发失败率为30%,甚至使一些已上市的药物退出市场。因此,在药物开发的早期阶段确定药物毒性和不良的药物相互作用是非常重要的。尽管已经开发了一些体内和体外方法来探索药物毒性和药物-药物相互作用,但是这些方法仍然是耗时较长且昂贵的。而通过计算模型进行毒性预测,由于其绿色、快速、廉价和准确的优点已得到了更广泛的应用。

近年来,基于机器学习的毒性预测研究取得了很大的进步,但仍然面临着两个主要的挑战,一是部分毒性数据集的质量不高,规模不大;二是难以揭示化合物结构同毒性之间的关系。针对以上挑战,浙江大学侯廷军教授团队、中南大学曹东升教授团队和腾讯量子实验室谢昌谕博士合作开发了多任务图注意力框架(Multi-task Graph Attention frameworkMGA),用以从大量的毒性数据中挖掘毒性信息,并构建更精准的毒性预测模型。

  

1.AMGA框架。BMGA用于毒性预测实例。

MGA多任务图注意框架是一种可以同时学习回归和分类毒性任务的多任务图神经网络框架,按功能分为四个部分:输入、深度毒性提取器DTE、毒性指纹生成器DFT-G和毒性预测器TPMGA的输入是由原子表征和化学键表征组成的分子图。DTE由两个图神经网络层组成,可以从分子碎片中提取通用的毒性表征。DFP-G可以为不同的毒性任务分配不同的分子碎片权重,然后根据特定的毒性任务从通用毒性表征生成定制化的毒性指纹。最后,TP根据定制化的毒性指纹预测相应的化学毒性。

MGA31个毒性任务中表现出了优异的预测精度。此外,MGA能够通过DTE来提取通用毒性特征,并通过TFP-G生成定制化毒性指纹,同时通过分析TFP-G中各注意力层的相似性能揭示不同毒性任务间的相关性。TFP-G中的注意力层能够赋予环状分子碎片不同权重,而容易导致毒性的环状分子碎片则表现出了更高的权重。

该论文第一作者是浙江大学博士研究生吴振兴,浙江大学侯廷军教授为最后通讯作者,中南大学曹东升教授和腾讯量子实验室谢昌谕博士为共同通讯作者。

  

论文链接:https://pubs.acs.org/doi/pdf/10.1021/acs.jmedchem.1c00421