浙江日报 数字报纸


00008版:前沿

AI找药
助力新药研发
“摸黑”前行

  如果把人类与疾病的较量比作一场战斗,那么人类“弹药库”里的武器——药物的储备还非常贫乏,对于大部分的疾病,人类还在苦苦寻找有效的药物。

  浙江大学药学院侯廷军教授与控制学院贺诗波教授合作,尝试将知识图谱、推荐算法等人工智能技术用于药物研发。他们设计出一款名为“药靶图谱推荐系统”的算法,可用于药物与靶点相互作用的预测。在接近真实应用的测试场景中,“药靶图谱推荐系统”与已有的预测模型进行了一次全面比拼,取得亮眼成绩。

  药物研发的一个中心内容是药物分子与靶点蛋白之间的相互作用。寻找靶点对应的药物分子、评估药效、判断毒副作用……都是围绕着这对“主角”的相互作用展开的。2017年发表在Nature杂志的一篇报道称,有望成为药物的候选小分子的数量大约为10(60)个,是整个银河系原子数量总和10(54)的100万倍。面对这浩渺无边的“银河系”寻药之旅,依托于生物实验的传统方法显然难以穷尽各种可能。

  “我们需要建立一个有效的网络模型,把这些异构的信息链接起来,其中各种生物信息是网络上的一个个节点,而数据之间的关系是网络上的一条条‘边’ 。”该项目合作者之一、浙大控制学院陈积明教授说,生物信息领域的海量信息,有的可能是噪声的,有的可能是冗余的,希望设计这一系统能更好地将信息加以组织,从而把未知的线索挖掘出来。

  这一预测系统就是“药靶图谱推荐系统”,它将知识图谱和推荐系统两种人工智技术相结合,“消化”能力更强了。这好比是警察抓小偷,过去的方法我们或许只能通过长相或者指纹来判断,而现代技术让我们记录到诸如通话记录、行动轨迹等周边信息,有效利用这些信息,在不知道小偷长相的情况下,也一样能锁定目标。

  “药靶图谱推荐系统”首先通过知识图谱表征方法学习图谱中各种药物相关概念,然后通过神经因子分解机集成知识图谱中所学到的多组学信息和药物与蛋白的结构表征信息 ,最后输出它的预测结果——药物和靶点相互作用的概率排序。

  药物、疾病、生命的相关数据库可能存放于世界任何角落,研究人员坐在计算机前就能远程访问它们,让自己训练的算法系统进行“学习”与“演练”。那么,“药靶图谱推荐系统”的表现如何呢?

  四个公开的基准数据集成为“题库”与“赛场”,研究者将“药靶图谱推荐系统”与现有的三种预测模型以及传统的方法进行了一次全面的模拟竞赛。为了让比赛更贴近真实场景,研究将场景细分为三个场景:热启动(靶点和化合物信息都是已知的);对于药物的冷启动(根据已知的靶标蛋白信息寻找未知药物分子),对于蛋白的冷启动(未知靶标蛋白信息的情况下寻找药物分子)。

  在前两项比赛中,人工智能算法与传统算法不相上下,甚至有时人工智能的算法略逊传统方法一些。而到了第三场景,“药靶图谱推荐系统”以领先30%的优势赢得了比赛。“这提示我们,恰恰是在从未知寻找未知,人类现有手段还有诸多束缚的领域,人工智能大有用武之地。”叶青说。

  侯廷军教授认为,这关键的一局,体现了人工智能在面对未知领域的能力和优越性。从“未知”寻找“未知”,恰恰是未来人类药物研发中面临的主要场景。贺诗波教授说,采用人工智能进行复杂异构网络挖掘还有许多有趣的事可以做。比如,他们正在与腾讯实验室合作,致力于乙肝药物的虚拟筛选以及药物协同作用的研究。“知识图谱的运用,一方面是增加了信息的维度,另一方面可以增强算法系统的可解释性和可信度。”


浙江日报 前沿 00008 AI找药
助力新药研发
“摸黑”前行
2021-12-10 23474179 2 2021年12月10日 星期五