利用跨物种大规模比较转录组学分析进一步阐明基因功能、挖掘新的生物途径和解析植物进化
2022/11/11 16:31:43 阅读:1280 发布者:
可公开获得的RNA-seq数据就像开采的石油,需要经过提炼才能变得有价值。在所有植物中,目前有数百个植物物种具有可公开获得的RNA-seq数据,其数据量正以指数增长,已有超过30万个RNA测序(RNA-seq)数据。这些RNA-seq数据来源于全球数以千计的实验,其中包括了不同器官、组织、细胞类型、生物扰动和基因型的基因表达。软件工具的开发使得整合并进一步挖掘这些数据成为可能。
近日,新加坡南洋理工大学生物科学学院的Irene Julca在国际知名期刊Trends in Plant Science上发表了一篇题为“Toward kingdom-wide analyses of gene expression”的综述文章,该综述讨论了如何访问和处理RNA-seq数据,并概述了利用跨物种的分析,以整合来自不同物种的RNA-seq数据。大规模的比较转录组学分析将进一步阐明基因功能、挖掘新的生物途径和解释植物进化。
转录组学技术的快速发展大幅降低了测序成本,导致公开可获得的RNA-seq数据以接近指数的速度增长。大量的原始测序数据提交到了核苷酸序列数据库(SRA),其测序平台包括Illumina、454、IonTorrent、Complete Genomics、Pacific Biosciences (PacBio)和Oxford Nanopore (ONT)等。虽然这些数据的产生是为了解决不同的问题,但积累下来的数据可以被整合提炼,从而产生对基因功能的新见解。
在植物中,尽管大部分RNA-seq数据来自于Illumina短读测序,但来自BGISEQ、PacBio单分子实时测序(SMRT)和ONT等新测序平台的RNA-seq数据显示,在过去4年里,来自于这些测序平台的RNA-seq数据在快速增长。BGISEQ、PacBio SMRT和ONT正在成为植物转录组分析中替代Illumina的选择,以克服短读测序的技术限制。此外,ONT是唯一一种不需要逆转录或扩增直接测序RNA的商业化方法,可以识别RNA修饰。
植物的RNA-seq数据在分类学上的分布并不均匀。在植物界中只有一小部分(1.3%)植物具有RNA-seq数据。其中大部分来双子叶植物(65%)和单子叶植物(29%)。这些分类学上的空白将比较转录组学的研究局限于少数几类植物,通常为模式植物和经济植物,而忽视了其他植物中包含的巨大的信息多样性。
比较转录组学是一个不断发展的领域,它试图了解同一物种的不同样本之间或不同物种之间的转录组的变化。比较转录组学可以识别保守基因的表达模式,以鉴别在不同生物体中执行相同功能的同源物,突出对生物过程至关重要的基因,从基因表达的角度研究基因进化。跨物种的大规模比较转录组学分析比较了植物差异基因表达(DGE)、基因表达图谱、共表达网络和表达数量性状位点(eQTL)等。
大量的RNA-seq数据提供了新的令人兴奋的机会,可以对植物的分子路径进行可靠的、可重复的推断。从不同的系统发育水平对不同物种的推断进行比较,将使我们对陆地化、特殊代谢、植物-微生物相互作用、非生物胁迫抗性和其他重要特征的基因和途径有更多的了解。尽管如此,由于数据的下载、注释、质量控制和分析等看似令人生畏的任务,大多数数据都只经过原始研究的分析。然而,近期开发的先进软件工具使我们能够在不到一个月的时间内处理一种植物的所有可用数据。作者预计,未来几年将出现跨物种大规模比较转录组分析的转变,其中数百个物种数百万个基因的RNA-seq数据将通过生物信息学的整合与分析,以解释植物的分子路径与进化。
原文链接:
https://www.sciencedirect.com/science/article/pii/S1360138522002692
转自:“植物生物技术Pbj”微信公众号
如有侵权,请联系本站删除!