投稿问答最小化  关闭

万维书刊APP下载

西班牙研究人员建立个性化SV分析软件PerSVade,助力植物学相关研究

2022/8/24 9:40:24  阅读:363 发布者:

结构变异(SVstructural variant)是指个体之间DNA的变化(通常>50bp),这些变化可以由基因组的重复、缺失或重组(倒位、易位和散布插入)而产生。在真核生物中,SV可与人类的临床表型相关,也可使植物(如水稻)在内的各种生物产生显著的种内遗传变异。尽管如此,要把SV从短读测序中调用出来,技术上仍困难重重;导致SV在大多数基因组研究被忽略了。因此,SVs在真核生物中的作用,很大程度上仍未得到探索。目前,SV的相关分析算法主要集中在人类基因组;它们是否适用于其他生物体,尚不清楚,严重阻碍了其他生物体中SV的研究。

2022816日,Genome Biology在线发表了西班牙巴塞罗那超算中心(BSC-CNS)、生物医学研究所(IRB Barcelona)和加泰罗尼亚科研与高级研究所(ICREAToni Gabaldón团队题为“PerSVade: personalized structural variant detection in any species of interest”的方法论文。该研究开发了新的个性化SV分析软件perSVade,它可根据物种的基因组测序数据及其参考基因组生成模拟基因组的SV,并以此进行参数优化,从而最大化地从测序数据中调取SV

https://doi.org/10.1186/s13059-022-02737-4

为了克服这一局限性,该研究开发了新的个性化SV分析软件perSVade。多项基准测试研究表明,gridss算法具有很高的准确性。PerSVade以短读基因组数据及其参考基因组为基础,使用gridss识别比对序列中的断点,并使用clove将这些断点归结为实际的SV(分为插入、易位、缺失、倒位和串联重复)。此外,perSVade可对SV生成相应的功能注释,为评估该基因组区域的变化和下游分析提供了帮助(Figure 1)。

perSVade的一个关键特性是其参数优化步骤,可在“optimize_parameters”模块中实现。由于不清楚在大多数物种中是否存在通用的参数,加上无法预测perSVade对不同测序格式(即不同的读取长度、覆盖率或插入大小)是否具有相同的性能;perSVade的“optimize_parameters”以参考基因组及其测序数据生成模拟基因组的SV,并为这些模拟基因组的SV选择最准确的参数(F 值)。为了解释SV形成的不同机制,模拟可从三个方面进行:(1)整个基因组中的随机位置(“随机”模拟),(2)围绕先前已知的SV区域(“已知”模拟),(3)围绕同源序列的区域(“同源”模拟)。显然,“已知”模拟和“同源”模拟要优于“随机”模拟;但不管怎么样,每一种模拟都可使参数得到优化,从而调出最可靠的结果。

为了检验参数优化步骤的作用,该研究对6种多样性真核生物(光滑念珠菌Candida glabrata,白色念珠菌Candida albicans,新型隐球菌Cryptococcus neoformans,拟南芥Arabidopsis thaliana,果蝇Drosophila melanogaster,和人Homo sapiens)分别进行了perSVade测试。结果显示,perSVade可广泛用于从各种真核生物的测序数据中调用SV;并且与默认参数相比,参数优化可大幅度提高SV的召回率(Figure 2)。

那么,不同物种间是否具有通用性参数呢?通过查看PerSVade在各物种中生成的参数,研究人员发现,它们具有明显的物种特异性。进一步通过将某一物种的参数使用在其他物种上,该研究发现这些参数并不能在其他物种中最大化的调取SV;但在其相近的物种中,仍相对有效(Figure 3)。因此,不同物种间不具有通用性的参数;要想在特定物种中最大化的调取SV,必须依赖于PerSVade的参数优化。

为了进一步验证perSVade在实际SV调用中的作用,该研究对具有已知SV的测序数据进行了测试。结果显示,由于已知SV基因组数据的F值比模拟基因组的要完低,其SV的准备性较高,但召回率较低;表明,perSVade参数优化对已知SV基因组数据中的SV调用也具有改善作用(Figure 4)。

综上所述,该研究以开发了个性化的SV分析软件perSVade,它具有自动参数优化功能,可根据物种的基因组测序数据及其参考基因组生成模拟基因组的SV,并以此进行适合于该物种的参数优化,从而保证最大限度地从基因组测序数据中调取SV。通过对6个不同真核生物(含拟南芥)的基因组测序数据进行测试,该研究表明perSVade可广泛地适用于不同的物种;为推动植物学中SV的相关研究提供了重要的分析工具。

转自:植物科学最前沿”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com