投稿问答最小化  关闭

万维书刊APP下载

四川大学余岩课题组推出系统发育基因组学数据挖掘新方法

2022/12/13 9:54:27  阅读:390 发布者:

系统发育基因组学(Phylogenomics)的核心是基于组学数据研究类群的演化关系,从而揭示基因功能、性状演化以及物种多样化形成机制等重要问题。得益于高通量测序技术(NGS)的高速发展,使用组学数据获取质体基因、低拷贝核基因等系统发育标记,研究植物各个类群间的系统发育关系已经相当普遍。被子植物353基因集(Angiosperms353 gene set, AGS) 就是这样一组通用的低拷贝基因集合,被广泛用于被子植物各个分类阶元中。获取AGS的常用技术手段包括目标富集测序(Hyb-Seq)和转录组测序(Transcriptomes)。其中,转录组测序需要新鲜的叶片,从野外获取材料的难度较高,目标基因获取率低;目标富集测序可以获取高质量的单拷贝基因,但前置实验流程复杂,且无法保证基因获取率。浅层基因组测序(genome skimming)材料获取方便、测序费用低廉,在测序深度足够时,理论上可以获取所有类型的分子标记,但由于其破碎化程度较高,尚无可靠的低拷贝基因获取方法。

为了从各种测序数据中高效准确的获取以AGS为代表的低拷贝基因,四川大学生命科学学院余岩副教授团队开发了Easy353工具包,能够直接从包括浅层基因组测序的各类高通量测序中获取AGS等低拷贝基因。该研究成果以Easy353: A tool to get Angiosperms353 genes for phylogenomic research为题,202212月在进化生物学国际顶级刊物Molecular Biology and Evolution (5-year Impact Factor: 20.074,中科院大类1)在线发表(Advance Access)Easy353是基于reference-guided策略的拼接工具,使用de Bruijn graph的算法进行有权重的从头拼接,具有极高的准确性和敏感度。该工具使用流程比较简单,研究者无需进行任何前置实验,仅仅提供同科/属的参考序列和测序的原始数据就可以直接获取各类低拷贝/单拷贝基因;为了方便研究者使用,Easy353同时支持LinuxMacOSWindows系统,并为WindowsMacOS提供了用户图形界面。该工具包可在https://github.com/plant720/Easy353上免费获取使用,其的核心功能包括:

从浅层基因组、转录组、富集测序数据中获取被子植物353基因(Easy353基础版)

从浅层基因组、重测序、转录组测序数据中获取自定义的单拷贝基因(GeneMiner扩展版)

从极低深度和质量的浅层基因组测序数据中获取叶绿体、线粒体、nrDNAITS等特定分子标记(GeneMiner扩展版)

为了评估Easy353获取AGS的能力,本研究使用了水稻(Oryza sativa)不同测序深度(1x,5x,10x,20x,50x)的模拟数据集来测试获取的序列的准确度。同时,我们使用了来自伞形科芹亚科的五个物种的浅层测序数据、转录组数据和目标富集测序数据来评估恢复的序列的长度和数量。更进一步的,为了说明获取的序列应用于系统发育研究是可行的,我们使用了茱萸属7个物种及两个外类群物种的转录组数据获取AGS,而后使用溯祖(coalescent)方法建立系统发育树,同之前的研究结果进行对比。Easy353进行以上三个测试的结果均与同类软件HybPiper进行了比较。结果表明Easy353在恢复AGS上有较多的优势,包括降低测序成本、减少组装时间、提高AGS恢复率,并能最大限度地减少错误序列的恢复。Easy353简单易用,能够让用户在较短的时间内,利用低成本低深度的数据获得高质量的系统发育标记(DNA条码),能够大幅度减少重复工作和复杂的实验,有利于研究人员开展相关工作,推动相关学科的高质量快速发展。

1. A. Easy353的用户界面. B. Easy353与同类工具在不同测序深度下的比较(数值越高越好)C. Easy与同类工具恢复的序列的错误率比较(数值越低越好).

四川大学生命科学学院余岩副教授为论文的通讯作者,张朕博士为论文的第一作者,四川大学生命科学学院硕士生谢普林、郭泳棂、北卡罗来纳州大学教堂山分校周文斌博士等共同参与了本项研究。哥伦比亚大学金建军博士和中国科学院植物研究所刘彬彬副研究员在研究过程中给予了大量的指导和帮助。该研究得到国家自然科学基金面上项目(Grant No. 32071666, 32271552) 和国家科技基础调查专项(Grant No. 2022FY101000)的资助。

软件获取:

Easy353基础版: https://github.com/plant720/Easy353

GeneMiner扩展版: https://github.com/happywithxpl/GeneMiner

论文链接:

https://doi.org/10.1093/molbev/msac261

预览链接:http://mnh.scu.edu.cn/soft/blog/Easy353/easy353.pdf

本文转载自植物科学最前沿

转自:“植物生物技术Pbj”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com