投稿问答最小化  关闭

万维书刊APP下载

《科学》连发两文!一秒设计全新蛋白质,AI 带来又一革命性突破

2022/9/26 15:03:55  阅读:121 发布者:

AlphaFold 横空出世以来,人工智能(AI)已经彻底革新了结构生物学的研究现状。DeepMind 公司开发的 AlphaFold 破解了持续半世纪的蛋白质折叠问题,并且已经预测出地球上几乎所有已知蛋白质结构;而在华盛顿大学,David Baker 教授团队设计出能够预测蛋白质复合体结构的 RosettaFold 工具后,正在攻克另一道天堑:从头设计功能性蛋白质分子。

在近期的《科学》上,Baker 教授团队连发两篇论文,呈现了 AI 设计蛋白质的最新突破:相比于传统手段,机器学习可以更加精准、快速地设计蛋白质分子,将设计蛋白质的时间长度从「月」缩短至「秒」。这项突破有望在全新疫苗、药物与治疗手段开发等领域带来新的革命。

Baker 教授团队意识到 RosettaFold 可以用来模拟多种相互作用蛋白的组装过程时,他们相信可以据此设计出能自我组装成纳米颗粒的蛋白质。但实际情况却是,他们设计的蛋白质却无法顺利折叠,不具备正常的功能。

如何解决所谓的蛋白质逆折叠问题,也就是根据给定的蛋白质结构,确定折叠成该结构的氨基酸序列?Baker 实验室的答案是一种全新的深度学习工具:ProteinMPNNProteinMPNN 借鉴了图像识别使用的神经网络,能够明确与特定结构相对应的序列。

在最新研究中,Baker 教授团队将设计功能性蛋白质的挑战分解为 3 个部分,并且分别设计了解决方案。

ProteinMPNN 设计出的蛋白质更可能按预期折叠(图片来源:Ian Haydon, UW Medicine Institute for Protein Design

首先,是需要形成全新的蛋白质构型。在稍早前的一篇《科学》论文中,Baker 教授团队指出,AI 可以通过两种思路从头设计蛋白质。

其中一种是基于「幻想」hallucination),简单来说,就是基于简单的提示实现输出:通过在所有可能的序列中进行搜索,来选择具有预期功能的序列。第二种是「修复」inpainting),就类似于搜索栏的文字自动补齐功能。

▲「幻想」蛋白质示意图(图片来源:Sergey Ovchinnikov

第二个挑战是,如何加速生产蛋白质的过程。为此,研究团队设计了一种用于生成氨基酸序列的新算法。在一篇《科学》论文中, ProteinMPNN 能以大约 1 秒的速度运行、设计蛋白质,相当于已有工具的至少 200 倍,运算结果也更优

「当我们拥有海量数据时,训练神经网络很容易;但对于蛋白质,我们无法得到足够的样本。因此我们必须明确,这些分子中的哪些特征是最重要的。这有点像试错的过程。」Baker 实验室的博士后 Justas Dauparas 说。

第三个挑战则是生成的序列的功能性。为此,研究团队使用 AlphaFold 来独立评估,他们设计的氨基酸序列能否按预期的方式折叠。

ProteinMPNN 的作用是设计蛋白质,而 AlphaFold 是预测蛋白质结构。」Baker 教授说。

而在同期《科学》的另一篇论文,Baker 教授团队证实,新型机器学习工具的联合使用能可靠地生成全新的功能性蛋白质。研究发现,使用 ProteinMPNN 生成的蛋白质更可能按预期计划折叠,因而他们可以用这些工具创造出非常复杂的蛋白质复合体

▲研究设计了前所未有的纳米环形结构(图片来源:Ian Haydon, UW Medicine Institute for Protein Design

借助 ProteinMPNN,研究团队使用冷冻电子显微镜等手段确定了 30 种全新的蛋白质结构,并且设计出前所未有的纳米环形结构。研究团队认为,这种环形结构可用于定制化的纳米机器,未来或许可以在医药领域大展身手

Baker 教授表示,接下来几个月他们的目标是:提升这些工具的功能性,打造更具动态化、功能更强的蛋白质。又一次,结构生物学被带入一个全新的时代。

转自:“丁香学术”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com