投稿问答最小化  关闭

万维书刊APP下载

药物靶点交互预测相关研究

2022/12/27 11:33:09  阅读:130 发布者:

以下文章来源于北邮 GAMMA Lab ,作者翟新龙

本文旨在简要总结近期的药物靶点交互预测方法,带领读者了解药物靶点交互预测的基本定义和最新进展。

1 简介

药物(drug)广义上指可以对人或其他机体产生已知生物效应的物质,主要是用以改变人类、动植物、微生物的生理功能和生化代谢,达到治疗、预防、诊断疾病的医学目的。目前,大部分种类的药物为小分子化合物。虽然现有的各种药物已经帮助人类战胜了一种又一种的疾病,但当我们面对新出现的疾病,或是想要攻克未曾战胜过的疑难杂症,研发一款新药一般需要超过十年的时间和25亿美金的资金。

药物研发是一个漫长的过程。其初步阶段需要从海量的化合物中寻找可能与靶点(target)(一般为蛋白质,也可以是基因等)产生交互的某些化合物作为药物的候选。这一过程即可能耗费数年时间。因此若能较为准确快速地对某一化合物及一靶点进行交互预测(drug target interaction prediction)可大大加速药物研发进程,节省成本。

形式化地,若某一药物记为,某一靶点记为,其中则药物靶点交互预测一般是要求得一个能预测药物靶点间交互可能性或强度的函数:

目前,基于机器学习的药物靶点交互预测可以利用两方面的信息。一方面是药物和靶点自身的信息。例如,药物的分子式,SMILES序列等,靶点蛋白质的氨基酸残基序列,空间结构等。

另一方面是药物、靶点之间及其与其他对象间的关联信息。这里的其他对象可以是一切与药物或靶点有关系的对象,如药物的副作用,药物可以治疗的某种疾病,与蛋白质关联的某种基因等等。可以进一步把这些对象组织成一张异质图,从而更好地对药物和靶点之间的关系进行挖掘。

下文介绍的两篇文章,正是分别从这两个方面入手进行药物靶点预测的。

2 方法介绍

2.1 MolTrans: Molecular Interaction Transformer for drug-target interaction prediction (Bioinform 2021)

原文:https://academic.oup.com/bioinformatics/article/37/6/830/5929692

MolTrans是一个基于化合物和蛋白质自身信息进行交互预测的模型。它提出了利用无标签数据的子结构模式挖掘算法和适用于该问题的Transformer,获得了更准确和可解释的 DTI 预测。其具体步骤可分为以下三步:

使用大量无标签数据对化合物和蛋白质进行解构得到一系列子结构

使用增强的transformer学习含有上下文信息的子结构表示

将药物蛋白质对中的子结构进行两两交互,将交互分数构成一个矩阵,再利用CNN计算最终的药物蛋白质对的交互得分。

2.2 NeoDTI: neural integration of neighbor information from a heterogeneous network for discovering new drugtarget interactions (Bioinform 2019)

原文:https://academic.oup.com/bioinformatics/article/35/1/104/5047760?ref=https://githubhelp.com

NeoDTI则是一个基于化合物和靶点及其和其他一系列对象间的关联信息进行交互预测的模型。它是一种非线性端到端学习模型,整合了由各种对象构成的异质网络中的信息,并自动学习药物和目标的拓扑保持表示,以获得更好的药物靶点交互预测。其具体步骤可分为以下两步:

利用邻域信息聚合更新节点嵌入,使得异质信息网络中每个节点通过将其邻域信息与其自身特征相结合来生成新的特征表示。

利用节点嵌入的拓扑保持学习强制节点的嵌入保持拓扑结构,这对于提取单个节点的拓扑特征以进行准确的 DTI 预测起到关键作用。

3 总结

相较于传统方法,利用机器学习进行药物靶点交互预测具有高效、灵活的优点。但机器学习模型往往缺乏可解释性。如何设计出具有一定可解释性的模型以让人类专家更方便地监督、利用机器学习模型,并能更好地融合更多方面的信息,是该领域值得探索的方向。

转自:arXiv每日学术速递”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com