Nat Biotech | AI算法预测基因编辑结果
2023/3/20 14:14:14 阅读:96 发布者:
如果短 DNA 序列能高效插入基因组,将在很大程度上影响生物技术和医学的发展进程。小段插入可以编码用于纯化和可视化的蛋白质标签,或通过改变蛋白质定位、半衰期或者相互作用来控制蛋白质功能。而引入结构元件或重组酶位点则可以改变 DNA 构象并为大规模工程提供底物。
有超过16,000种基因小片段的缺失变异与疾病存在因果关系,并且原则上可以通过插入缺失序列来恢复。一个突出的例子是囊性纤维化,其中 70%的病例是由三核苷酸 (nt) 缺失引起的。
为了能够在实践中逆转这些突变,基因组编辑必须有效、准确和安全地整合插入,避免出现意外结果和双链断裂情况。
在最新的一项研究中,剑桥大学威康基金会桑格研究所(Wellcome Trust Sanger Institute)的研究人员试图量化DNA序列长度、核苷酸组成和二级结构对插入效率的影响。他们尝试利用前导编辑技术(prime editing)开发一种新的工具,预测能提高将基因编辑的DNA序列成功插入细胞基因组的几率。研究发表在《Nature Biotechnology》杂志上,这篇名为 “Prediction of prime editing insertion efficiencies using sequence features and DNA repair determinants”的文章评估了使用前导编辑技术将数千种DNA序列引入基因组的插入情况。数据被用于训练一种机器学习模型算法,以帮助研究人员为给定的遗传缺陷设计最佳修复方案,这或许能加快前导编辑技术进入临床。
(来源文献)
prime editing技术作为一种新型的基因编辑技术,可以实现高效、准确、特异性地编辑基因组中的鸟嘌呤和胸腺嘧啶。相较于CRISPR/Cas9和TALEN等其他基因编辑技术,prime editing能实现更精准的编辑,并且不涉及外源性的DNA序列插入,因此更加安全可靠。
然而,这项技术依旧存在一些难以克服的瓶颈。其中最重要的问题之一就是插入效率的低下。插入效率是指在编辑过程中,外源DNA序列能够成功插入到目标基因组的概率。低插入效率不仅会导致基因编辑的失败,还可能会导致偶然的DNA序列插入和突变,从而对生物体造成不良影响。
因此,为了提高prime editing技术的插入效率,研究人员需要探索一些与插入效率相关的因素。研究人员基于此,开展了一项研究以开发一个预测prime editing插入效率的计算模型。
研究人员们通过将3604个不同长度的DNA序列靶向插入三种不同人类细胞系基因组中的四个不同位点,研究了影响prime编辑系统成功的因素。通过对处理过的细胞DNA进行测序,该团队能够确定哪些序列和哪些编辑系统最有效,之后开发了一种算法,可用于预测未来插入不同序列的效率。
prime插入效率的高通量测量
(来源文献)
文章第一作者Jonas Koeppel介绍:“成功编辑基因组的变量很多,但我们开始发现哪些因素提高了成功的机会。序列长度也是其中一个因素,但这并不简单,因为序列越长,插入就越困难。”
通过对各个序列的插入效率或成功率进行评估,确定每次编辑成功的共同因素。研究发现,除了序列的长度,涉及的DNA修复机制的类型也是一个关键因素。
插入长度和错配修复(mismatch repair,MMR)
影响插入效率
(来源文献)
在确认了MMR是插入效率的长度依赖性决定因素后,接下来研究人员探究了前导编辑的不同步骤如何影响文库序列的插入率。
前导编辑步骤对插入率的影响
(来源文献)
文章作者之一Juliane Weller说:“通过将这些潜在的基因编辑规律输入到机器学习算法中,我们创建了一个模型来根据它们的潜在成功率对其进行排名。我们希望这将消除基因编辑中涉及的大部分错误,并大大加快进度。
预测prime插入效率
(来源文献)
参考资料:
https://www.nature.com/articles/s41587-023-01678-y
转自:“科研腔”微信公众号
如有侵权,请联系本站删除!