Cell | 中国科学院高彩霞团队利用人工智能开发出系列碱基编辑新利器
2023/7/4 14:21:57 阅读:49 发布者:
蛋白质功能的阐明及其在生物工程中的应用极大地推动了生命科学的发展。蛋白质的挖掘工作通常依赖于氨基酸序列而不是蛋白质结构。
2023年6月27日,中国科学院遗传发育所高彩霞团队在Cell 在线发表了题为“Discovery of deaminase functions by structure-based protein clustering”的研究论文,该研究使用AlphaFold2来预测并随后基于预测的结构相似性对整个蛋白质家族进行聚类。研究选择脱氨酶蛋白来分析和鉴定许多以前未知的特性。该研究发现在Ddda-like进化枝中的大多数蛋白质不是双链DNA脱氨酶。
该研究设计了最小的单链特异性胞嘧啶脱氨酶,使有效的胞嘧啶碱基编辑器(CBE)可被包装到单个腺相关病毒(AAV)中。重要的是,研究从这个分支中分析了一种脱氨酶,它在大豆植物中进行了强有力的编辑,这在以前是CBEs无法获得的。这些发现的脱氨酶,基于人工智能辅助的结构预测,极大地扩展了碱基编辑器在治疗和农业应用中的效用。
蛋白质的发现和工程极大地改变了生命科学。传统的酶挖掘仅基于序列信息,在分类和预测蛋白质功能和进化轨迹方面是有效的。然而,无论是核心氨基酸、特定基序、整体氨基酸序列身份,还是隐Markov模型(hmm),一维信息都不能完全阐明蛋白质的功能特征。
相反,由于蛋白质的功能最终是由蛋白质的三维折叠决定的,因此在蛋白质挖掘和聚类分类过程中,了解蛋白质结构将为蛋白质功能提供可靠和合理的见解。虽然公开报道的蛋白质结构的数量正在增加,但与基于氨基酸序列发现的蛋白质数量相比,这是微不足道的。最近,许多人工智能(AI)方法已经开发出来,使用1D氨基酸序列来准确预测高分辨率的3D蛋白质结构。因此,这些蛋白质结构预测方法应该能够大规模挖掘和分类具有特定功能的蛋白质。
类似脱氨酶的蛋白质催化核酸中核苷酸和碱基的脱氨。它们在防御、突变、核酸代谢和其他生物过程中发挥着重要作用,最近被开发用于可编程DNA和RNA碱基编辑器,这是一类精确的基因组编辑技术。该家族成员作为核苷酸脱氨酶和核酸脱氨酶,包括腺苷、胞苷和鸟嘌呤脱氨酶,能够作用于单链DNA (ssDNA)、双链DNA (dsDNA)、双链RNA (dsRNA)、转移RNA (tRNA)、游离核苷和其他核苷酸衍生物。在基于序列的系统发育分析中,脱氨酶的零星分布和正选择的快速进化往往混淆了不同蛋白质家族之间的关系。
基于Alphafold2预测蛋白质结构进行分类和工程设计工作流程(图源自Cell )
该研究基于Alphafold2预测的3D结构,对脱氨酶家族的蛋白质进行了蛋白质聚类分类。为了更好地区分和发现具有不同功能的脱氨酶,研究使用AlphaFold2来预测脱氨酶的结构,并随后进行结构比较,以生成更好地反映不同类型胞苷脱氨酶的脱氨酶蛋白的分类树。使用Alphafold2预测的结构,该研究能够比使用一维氨基酸序列更有效地将蛋白质分类为不同的进化支。
胞嘧啶碱基编辑器(CBEs)利用胞嘧啶脱氨酶催化C碱基到U碱基的转化,导致DNA中C、G到T、A碱基的永久编辑。碱基编辑器在治疗性基因组编辑、基础生命科学研究以及为植物培育新的精英性状方面具有巨大的潜力。以前的DNA碱基编辑器利用两种类型的胞苷脱氨酶作用于ssDNA或dsDNA。迄今为止,只有少数靶向ssDNA的载脂蛋白B、 mRNA编辑酶催化多肽(APOBEC)/激活诱导胞苷脱氨酶(AID)样脱氨酶和一种靶向dsDNA的脱氨酶(DddA)被用于生成CBEs。这些脱氨酶仍然局限于序列上下文限制、低靶标:脱靶编辑比率和大蛋白大小,这使得它们难以通过腺相关病毒(AAV)病毒载体传递。
由于未知原因,自2016年首次引入该技术以来,一些物种,如世界各地种植的主要农作物大豆,一直受到胞嘧啶碱基编辑不良的影响。因此,仍然需要健壮和更高效的CBEs来进一步扩展其效用。通过基于预测结构生成蛋白质分类,该研究开发了一套用于精确基因组编辑的ssDNA脱氨酶(Sdds)和dsDNA脱氨酶(Ddds)。研究结果显示,基于AlphaFold2预测结构的酶挖掘是一种简单、灵活和高通量的方法,可以对具有未知功能的蛋白质进行分类和工程设计。
原文链接:
https://www.cell.com/cell/fulltext/S0092-8674(23)00593-7
转自:“iNature”微信公众号
如有侵权,请联系本站删除!