2023年7月7日上午,浙江大学上海高等研究院联合复旦大学复杂体系多尺度研究院、上海人工智能实验室计算生物创新中心,于上海世博中心成功举办论坛AI for Science: Computational Biology/科学中的人工智能:计算生物学。
作为生物医药研发的重要理论基础,计算生物学成为人工智能发展的重要应用场景之一。AlphaFold2和ChatGPT的出现标志着基于人工智能的算法在部分指标上已超过传统计算方法,除蛋白质结构预测外其应用更广泛涵盖多个生物医药研究领域,包括高通量药物分子筛选、药物靶点挖掘、药物分子性质预测等。
借此契机,浙江大学上海高等研究院联合多家国内顶尖计算生物学研究中心,举办学术论坛AI for Science: Computational Biology/科学中的人工智能:计算生物学。诺贝尔奖得主迈克尔∙莱维特(Michael Levitt)、中国科学院深圳先进技术研究院合成生物研究所研究员张增辉(John Zhang)、北京大学化学与分子工程学院教授盖峰(Feng Gai)、中国科技大学生命科学学院教授刘海燕(Haiyan Liu)、麦吉尔大学生物工程系教授夏煜(Brandon Xia)、复旦大学教授、复旦大学多尺度复杂系统研究院院长马剑鹏(Jianpeng Ma)做主旨演讲,石溪大学教授汪劲(Jin Wang)、深圳湾实验室研究员周耀旗(Yaoqi Zhou)、碳硅智慧CEO邓亚峰、图灵量子算法总监赵翔参与圆桌讨论,石溪大学教授汪劲、浙江大学求是讲席教授、浙江大学上海高等研究院院长周如鸿(Ruhong Zhou)分别主持了主旨演讲和圆桌讨论。浙江大学上海高等研究院副院长罗坤及多家头部药企、人工智能科技公司出席会议。
汪劲教授以严谨的开场主持拉开会议帷幕。汪劲教授指出,计算生物学标志着生物学从描述性研究发展到定量分析,综合了计算机科学、生物、大数据、应用数学、化学和基因学等相关学科。计算生物学的蓬勃发展亟需研究人员和产业专家展开更多交流与合作。
论坛首场学术演讲来自迈克尔∙莱维特教授。莱维特教授阐释了生物智能(Biological Intelligence)、人类智能(Human Intelligence)和机器智能(Machine Intelligence)对科学技术创新的影响。莱维特教授回顾了通过模拟蛋白质折叠来研究其结构和功能的历史,介绍了这个独特过程如何为计算机辅助药物设计提供关键的理论基础。接下来,莱维特教授讲解了人工智能的生物学基础,以及如何利用神经网络进行学习。他指出,人工智能的许多理念和算法,都源于对生物系统的理解和模拟,神经网络的设计和运行也是根据生物神经网络的工作原理来构建和优化的。最后,莱维特教授强调了生物、人类和计算机三者之间的紧密联系。他认为,我们应该把这三者看作是一个整体,通过深入理解和探索它们之间的关系,开发出更多高效的方法和工具,推动科学技术的发展。
马剑鹏教授为大会带来了题为“计算结构生物学:算法到应用”的学术报告。他详细介绍了研究团队从全新目标蛋白发现,到计算结构预测、实验结构测定、专用模拟算法开发,再到药物设计等系列环节的优势能力,强调了技术平台支撑对这一过程的重要性。他指出,蛋白质结构的柔性是提高结构解析分辨率的一大瓶颈,需要科研人员进行更深入的研究和挖掘。针对这一国际难题,马教授强调通过运用自主开发的智能算法解析信噪比较差的实验数据,实现直接抽取动态信息,构建三维蛋白质结构,极大提高蛋白质结构解析的效率和精度。 在如今计算机硬件设备采购受限的形势下,自主算法充分彰显“算力不足算法补”的重要意义。
张增辉教授和观众分享了关于TCR-MHC-抗原肽复合物突变的研究进展。张教授详尽地介绍了多种自由能计算方法,解释了这些计算方法在研究蛋白质交互和理解免疫反应过程中的重要性,为复杂的生物学问题提供了新的解决路径。张教授还解读了量子化学(QM)方法在提高预测蛋白质相互作用能量的准确度上的应用,特别是如何克服QM的尺度问题。
盖峰教授为观众带来了题为“淀粉样纤维结构和动力学的光谱研究”的学术报告。讲座中,盖教授深度探讨了超快振动光谱和位点特异性振动探针相结合的策略。他认为这种策略对于理解生物问题,尤其是淀粉样纤维结构和动力学的研究中具有重大意义。盖教授还从实验的角度出发,讲述了人工智能如何赋能光谱研究,提升科研工作的效率和精度。他的理念开启了人工智能在生物实验研究中的新视野,预示未来科学研究中可能出现的创新趋势。
刘海燕教授向观众阐释了深度学习在蛋白质设计中的应用,介绍了多种基于数据驱动的创新方式来设计新型蛋白质结构和序列。刘教授指出,目前来看,首先设计主链,然后进行序列选择的方法是进行蛋白质从头设计的有效方法。刘教授深入讲述了深度学习如何弥补传统的基于能量函数的设计方法的不足,帮助科学家在数据密集的情况下更精准地进行预测和设计。最后,刘教授介绍说,他们所训练的模型在序列选择和主链生成等方面的设计结果已得到了实验验证。该研究成果显示了深度学习在生物医药领域的巨大潜力。
论坛下半场由周如鸿教授主持。
夏煜教授向观众介绍了生物网络的多尺度建模。他指出,系统生物学通过描述细胞内蛋白质和其他生物分子之间的相互作用网络,构建生物系统的全景图。其后,夏教授阐述了蛋白质进化速度和所在位点的物理性质之间的关联性。他进一步解释了蛋白质内部、外部和界面的结构与功能存在着明显差异,且面临着不同的进化压力。夏教授通过构建蛋白质相互作用网络模型,比较人类蛋白质相互作用界面及其与病毒蛋白质相互作用的界面,发现病毒蛋白质能够通过精准挑选位点来“模仿”人类蛋白质,并以较快的速度进化。这些研究成果为我们理解病毒如何利用人类蛋白质进行复制繁殖,以及如何设计新的抗病毒策略提供了新的视角。夏教授的讲座不仅有助于听众深入理解多尺度生物网络建模,也展示了相关研究在生物科学研究中的价值。
特邀报告过后,石溪大学教授汪劲、深圳湾实验室研究员周耀旗、碳硅智慧CEO邓亚峰、图灵量子算法总监赵翔参与圆桌讨论。这场富有洞察力的讨论分享了深刻的见解,体现了学者们对于这一领域严谨的研究态度。汪教授和周教授阐述了结构预测对新药研发的重要性,并结合自身研究经验,解释了人工智能和计算技术的发展如何推动药物筛选过程。此外,邓先生和赵博士分别从算法和量子计算的角度出发,分享了他们在企业和科研界合作中累积的宝贵经验。圆桌嘉宾、特邀报告人和现场观众频繁互动,分享见解。不同学科和背景的观点在现场碰撞融合,气氛热烈,为学术界和产业界提供了交流平台。