投稿问答最小化  关闭

万维书刊APP下载

同期两篇Nature论文,打开潘多拉魔盒,AlphaFold照亮蛋白质宇宙

2023/9/22 10:16:37  阅读:37 发布者:

2021716日,谷歌旗下的DeepMind团队在 Nature 发表论文,发布了开源了基于人工智能(AI)的蛋白质结构预测工具——AlphaFold2AlphaFold2仅通过氨基酸序列就能以前所未有的准确度预测蛋白质三维结构。

此后,DeepMind和欧洲生物信息学研究所(EMBL-EBI)合作,创建基于AlphaFold的蛋白质结构数据库。一年后的2022728日,DeepMind宣布,AlphaFold预测了地球上几乎所有已知蛋白质的结构,这些蛋白质来自具有基因组数据的生物,目前AlphaFold数据库中已经积累了约2.14亿个蛋白质结构。

2023913日,Nature 期刊同期发表了两篇研究论文,这两项研究利用AlphaFold蛋白质结构数据库,让我们得以探索此前未知的蛋白质宇宙,通过分析比较蛋白质结构,发现了蛋白质中前所未见的新形状,揭示了蛋白质之间意想不到的联系,给黑暗中的“蛋白质宇宙”带来光亮。

蛋白质结构簇

基于革命性的AlphaFold,科学家们得以快速积累了超过2亿个蛋白质结构,这一数据库资源非常方便,但通常人们只关注其中具体某个单一蛋白的结构,或是某个蛋白家族的结构。

而对首尔国立大学的计算生物学家 Martin Steinegger 来说,他感兴趣的是绘制整个数据库中蛋白质之间的关系。为了实现这一目标,他与苏黎世联邦理工学院的计算生物学家 Pedro Beltrao 合作,他们开发了一种基于结构对齐的聚类算法——Foldseek cluster,可以根据蛋白质形状的相似性,快速比较AlphaFold蛋白质结构数据库中的每个结构。

使用这一新算法,他们在AlphaFold蛋白质结构数据库中识别了230多万个形状相似的蛋白质簇。该研究以:Clustering-predicted structures at the scale of the known protein universe 为题,发表在了 Nature 期刊上【1】。

研究人员通常使用由基因编码的蛋白质序列进行比较,但是蛋白质序列的变化往往比它们的结构变化更迅速,这限制了寻找非常远亲的蛋白质的能力。在这项研究中,通过基于蛋白质结构的比较,识别出的相关蛋白质簇的数量上仅使用蛋白质序列时的10倍。

在这项研究中,研究团队刚刚开始探索“蛋白质宇宙”中这些新发现的“星系”,但他们已经发现了一些令人惊讶的联系。例如,他们发现人类和其他复杂生物用来监测病毒基因组并触发快速免疫攻击的蛋白质与单细胞的细菌和古细菌的蛋白质在同一个蛋白质簇中,而—这种联系在此前并不为人所知。

论文通讯作者 Martin Steinegger 表示,对于超过三分之一的蛋白质簇,我们几乎一无所知,希望生物学家们能给处于黑暗中的蛋白质宇宙带来一些光明。

前所未见的蛋白质形状

来自巴塞尔大学的 Joana Pereira Torsten Schwede 等人采用了一种略有不同的方法来阐明蛋白质宇宙中的暗物质。该研究以:Uncovering new families and folds in the natural protein universe 为题,发表在了 Nature 期刊上【2】。

在这项研究中,研究团队探索了AlphaFold蛋白质结构数据库在多大程度上以高预测准确性从结构上阐明了天然蛋白质宇宙中的“暗物质”。

他们创建了一个注释的交互序列相似性网络,连接了AlphaFold蛋白质结构数据库中超过5000万个最准确的预测结构,然后,他们利用这些分组来识别蛋白质宇宙中最黑暗的角落。

在这项研究中,研究团队惊喜的发现一个前所未见的蛋白质形状,研究团队将其命名为——β-flower(β-花),之所以这么命名,是因为这些结构是在一种已知的蛋白质结构β-barrel(β-桶)中发现的,而且它们包含了许多发夹妆弯曲,类似于花瓣。该研究还发现,具有β-花结构的蛋白质之间有着远亲关系,但还不清楚这种结构的具体作用。

该研究还在Pfam数据库(一系列蛋白质家族的集合)中添加了多个蛋白家族,并通过实验证明其中一个蛋白家族属于一个新的翻译靶向毒素-抗毒素系统(TumE-TumA)超家族。

这项研究强调了大规模工作在识别、注释和确定新蛋白家族方面的价值。通过利用蛋白质生物信息学中最近的深度学习的革命性进展,我们能够以前所未有的规模揭示蛋白质宇宙的未知领域,为生命科学和生物技术的创新铺平道路。

论文通讯作者 Joana Pereira 表示,这项研究实际上打开了一个潘多拉魔盒,她和她的团队希望其他研究人员能够利用这项研究中的网络来查看自己感兴趣的蛋白质是如何融入更广泛的蛋白质宇宙的。

对于这两项研究,AlphaFold团队的负责人 John Jumper 表示,很高兴看到研究人员开发出新方法来探索AlphaFold所构建的蛋白质宇宙。这些研究是一个新领域的开端,在这个新领域中,蛋白质结构的研究规模是不可想象的,我希望我们能看到更多。

论文链接:

1. https://www.nature.com/articles/s41586-023-06510-w

2. https://www.nature.com/articles/s41586-023-06622-3

转自:“生物世界”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com