PBJ | 中国中医科学院中药资源中心联合中科院北京基因组研究所成功构建迄今为止物种数量最多的叶绿体基因组综合数据库!
2022/9/15 9:22:07 阅读:431 发布者:
叶绿体是植物把光能转化为化学能的重要细胞器,具有独立的基因组。自植物叶绿体基因组被发现以来,其已被广泛应用于揭示植物系统进化关系、光合作用调控机制研究、叶绿体基因工程等方面。
随着基因测序技术的发展,尽管已发布了海量的植物叶绿体基因组序列,然而如何整合应用这些数据目前面临着诸多问题:(1)不同上传者对上传序列物种、基因的命名规则缺乏统一标准; (2)许多已发布叶绿体基因组未被现有叶绿体基因组数据库收录;(3)一些已知的具有较高经济价值的物种尚未进行测序。
近日,中国中医科学院中药资源中心分子生药学创新团队联合中科院北京基因组研究所(国家生物信息中心)系统地进行了叶绿体基因组数据人工审编与分子标记开发,构建了叶绿体基因组综合数据库Chloroplast Genome Information Resource (CGIR, https://ngdc.cncb.ac.cn/cgir)。该数据库收录了来自11,946个物种的19,388条叶绿体基因组,数据整合了已发布的叶绿体基因组数据和利用全国第四次中药资源普查标本自测的718种未发表的叶绿体基因组,为迄今为止物种数量最多的叶绿体基因组数据库。为便于数据的共享应用,CGIR数据库包含了基因组(Genomes)、基因(Genes)、微卫星序列(SSRs)、DNA条形码(Barcodes), DNA特征序列(DSSs)五个模块。相关成果以Towards comprehensive integration and curation of chloroplast genomes为题发表于Plant Biotechnology Journal杂志上。
根据生物物种名录(The Catalogue of Life),CGIR首先对所收录叶绿体基因组的物种分类信息进行了审编,并依据权威植物研究机构邱园发布的世界功能植物名录(World Checklist of Useful Plant Species)对药用植物、食用植物、环境植物、能源植物、有毒植物、能源植物等进行了标注。同时,CGIR对基因名的不规范命名、异名、错误注释等情况也进行了审编。在此基础上,CGIR提供了按照纲、目、科、属、种不同分类层级浏览、下载相关数据的方法,极大地便利了用户使用。
针对分子标记开发这一叶绿体基因组最为常见的应用情景,CGIR使用生物信息学方法计算了所收录叶绿体基因组的微卫星序列、DNA条形码和DNA特征序列三种不同类型分子标记信息,以及用于silico PCR的引物,且同时开发了相应的树型视图方便用户根据分类层级信息快速寻找目标标记,简化了研究人员开发分子标记的流程。
综上,CGIR通过自主测序、整合公开基因组资源和人工数据审编向用户提供了目前为止最全面、物种数量最多的叶绿体基因组数据。经审编的物种分类、物种功能、基因名称与序列、分子标记等保证了数据的高度可靠,对植物系统发育、物种鉴定、叶绿体基因工程的发展均具有重要意义。未来,CGIR还将定期更新补充数据、不断扩展新的模块以持续推动叶绿体基因组的研究。
本研究由中国中医科学院中药资源中心、中科院北京基因组研究所(国家基因组科学数据中心)共同完成。华中一博士研究生、田冬梅工程师、蒋超副研究员,宋述慧研究员为本文共同第一作者,袁媛研究员,章张研究员和黄璐琦院士为共同通讯作者。本研究得到了科技基础资源调查专项、中国中医科学院科技创新工程项目、中央本级重大增减支项目“名贵中药资源可持续利用能力建设项目”的资助。
原文链接:
https://onlinelibrary.wiley.com/doi/abs/10.1111/pbi.13923
转自:“植物生物技术Pbj”微信公众号
如有侵权,请联系本站删除!