逆合成路线规划人工智能算法成果在百度飞桨平台发布

来源:上海高等研究院发布时间:2023-02-07浏览次数:10

近日,浙江大学上海高等研究院常务副院长吴飞教授团队最新科研成果逆合成路线规划算法PMSRGRASP在国产深度学习平台百度飞桨发布。在上海人工智能创新中心及百度的支持与资助下,与香港城市大学计算机系助理教授魏颖进行合作,攻克了单步/多步逆合成中表示、搜索和预测等难点问题,目前成果通过百度螺旋桨平台正式对外提供服务。


(访问地址:https://paddlehelix.baidu.com/detail/retrosynthesis



单步逆合成的预训练模型(PMSR,Pre-trained Model for Single-stepRetrosynthesis) 基于Transformersequence-to-sequence,将输入的目标产物转化为SMILES字符串,模型直接生成生产该产物的反应前体分子的SMILES字符串。为保障预测目标分子在自然界存在,并且遵循原子守恒原则与反应规则,团队设计了三个有针对性的预训练任务——分子恢复(Molecule RecoveryMR),反应物生成(Auto-RegressionAR)和对比分类(Contrastive ClassificationCC)来强化模型对化学规则的理解,该预训练策略使得单步逆合成算法表现在下游的三个数据集上都取得了显著的提升。该模型同时生成所有反应所需要的前体和详细的反应条件信息,能够进行反应验证,并在公开的benchmark数据集上取得了超过过去所有方法的精度,通过实验证明了其在不同领域的有机反应数据上具有较好的泛化性能,为多步逆合成任务打下了良好的基础。


多步逆合成预测基于强化学习(actor-critic)模型、蒙特卡罗树搜索和强化学习算法(TD3)设计算法框架(GRASPGoal-dRivenActor-critic retroSynthetic Planning )。预测过程中输入目标分子和策略偏好的编码信息,生成对应的候选反应的嵌入式表征,通过与单步逆合成模型输出的反应集进行K-NN的计算得到对应的真实候选反应,并通过正向判别模型得到反应的可行性置信度。之后,对候选反应形成的路线会通过对应的评价手段(如路线是否抵达原料库,路线的长度,路线的可行性,是否符合策略需求等等)生成具体评分,结合反应表征、目标分子和策略编码来拟合最终得分。通过大量的路线搜索和路线评价学习过程,模型能够通过学习自身的搜索结果来提升搜索效率和质量,形成无需人为干预的自我训练闭环,发现比静态数据集更高质量的路线,从而打破人为标注数据的瓶颈。此外,搜索框架能够通过兼顾不同的合成策略来生成多样化的路线,并在此过程中学习路线的策略信息(如路线用到的反应类型,中间体分子等),通过多元化的信息来增加路线的区分度,提高路线的多样性。使用系统的化学家能够通过提前设定模型搜索的策略偏好来获得不同的路线结果,从而满足不同领域的逆合成任务需求。


浙江大学上海高等研究院百度深度合作已久,双方共建飞桨联合创新实验室,全面推动产学研合作,创新技术转化,产业应用,在围绕“计算+”的科学研究与人工智能产学研用生态建设方面达成多项合作,以更好地联合双方优势推进上海及长三角地区产业智能化进程。为更好地推动国产AI技术和生态的发展,吴飞教授团队与百度密切合作,基于百度飞桨平台进行算法模型迁移,将逆合成路线规划技术成果融入百度的螺旋桨(PaddleHelix)项目,成为百度生物计算平台下重要的一个模块,目前逆合成系统已经上线试用,并将不断进行版本的更新迭代,后续也将发表更多逆合成相关论文成果,助力国产AI技术的推广应用和生态繁荣发展。


相关成果论文


1Yinjie Jiang, Yemin Yu, Ming Kong, Yu Mei, Luotian Yuan, Zhengxing Huang, Kun Kuang, Zhihua Wang, Huaxiu Yao, James Zou, Connor W. Coley, Ying Wei, Artificial Intelligence for Retrosynthesis Prediction, Engineering, 2022


2Yemin Yu, Ying Wei, Kun Kuang, Zhengxing Huang, Huaxiu Yao, Fei Wu, GRASP: Navigating Retrosynthetic Planning with Goal-driven Policy, NeurIPS 2022


3Yinjie Jiang, Zhengyu Chen, Kun Kuang, Luotian Yuan, Xinhai Ye, Zhihua Wang, Fei Wu, Ying Wei, The Role of Deconfounding in Meta-learning, ICML 2022


4Yinjie Jiang, Ying Wei, Zhengxing Huang, Fei Wu, Kun Kuang, Zhihua Wang, Learning Chemical Rules of Retrosynthesis with Pre-training, AAAI 2023