18年的等待,终于迎来首个水稻完整参考基因组
2023/8/18 15:38:09 阅读:31 发布者:
2023年8月7日,基因组所联合崖州湾实验室、中国水稻研究所、中国农科院作物科学研究所和扬州大学等多个单位在国际著名期刊《分子植物(Molecular Plant)》(IF:27.5)上在线发表了题为“A complete assembly of the rice Nipponbare reference genome”的研究论文,发布了水稻品种“日本晴”完整参考基因组,这是首个实现全基因组完整无缺口组装的水稻基因组。该成果是水稻基因组学研究的又一重大突破和里程碑事件,也为水稻分子育种研究奠定了重要理论基础。
水稻是重要粮食作物,其基因组组装对水稻育种有重要意义。自2005年首个水稻基因组草图(“日本晴”)发布以来,宣告水稻研究正式跨入基因组学时代,此后,”日本晴”参考基因组在2013年进一步更新,大幅改善了基因组组装结果(IRGSP-1.0)和基因注释(MSU7, RAP-DB),成为水稻的标准参考基因组并一直沿用至今。
然而,由于当时测序技术的限制,IRGSP-1.0对复杂结构区域的组装存在不足,在基因组中一共遗留了72个较大的缺口(包括19个端粒),167个微小的缺口和779个未知碱基,估计占整个基因组总长的3%左右。
近年来,随着基因组测序和组装技术的发展,多个水稻品种基因组的大部分染色体实现了T2T的完整无缺口组装,但仍然存在2-5个端粒缺失的情况。除已发表的玉米Mo17基因组以外,目前还没有一个复杂动植物基因组实现全基因组所有染色体端粒到端粒的完整无缺口组装。
“日本晴”完整基因组组装AGIS-1.0及其新增序列组成
该研究以水稻”日本晴”为材料,利用约~220X 的超长ONT和~80X 的 Pacbio HiFi 测序数据,结合Hi-C和Illumina测序数据进行辅助调整和矫正,完成了”日本晴”参考基因组的完整组装(T2T-NIP/AGIS-1.0),其中AGIS-1.0为Agricultural Genomics Institute at Shenzhen简写,也是首次以中国的研究所命名的水稻参考基因组版本。基因组大小为 385.7 Mb,每条染色体的端粒到端粒均由一条完整连续的序列组成,碱基精确度超99.9999%。最新的组装新增了12.5Mb的基因组序列,主要解锁了水稻基因组中结构最为复杂的rDNA序列、着丝粒区域、复杂TE序列和端粒区域等。得益于基因组完整性的提升,AGIS-1.0修正了多个由于缺口导致的基因结构错误,并在过去高质量注释的基础上增加了 1,324 个蛋白编码基因,其中非rDNA区域314个基因。
以AGIS-1.0为参考基因组的重测序数据比对
为进一步评估AGIS-1.0的应用潜力,该研究利用水稻多个群体的基因组重测序和ONT数据分别以AGIS-1.0和IRGSP-1.0为参考基因组开展群体变异分析。结果表明,与IRGSP-1.0相比,以AGIS-1.0为参考基因组的reads使用率和比对准确率均有明显提升,尤其是在重复序列导致的多拷贝基因区域的比对质量显著改善,大幅降低了假阳性比对。基于与AGIS-1.0的高质量比对,检测获得的SNV和SV数量与IRGSP-1.0相比均有微小的下降,其中杂合变异位点数量均表现减少但纯合变异位点数量表现一致增加,表明这些数量变化来源于AGIS-1.0中重复序列比对结果的改善,进一步支持了新参考基因组的群体变异分析更加准确,假阳性变异明显减少。在此基础上,进一步开展了GWAS分析,也取得了良好的预期结果。该研究建立了在线数据库(http://www.ricesuperpir.com/web/nip)以提供AGIS-1.0的基因组浏览器及其基因组注释的友好访问服务。
基因组所商连光研究员、贺文闯助理研究员、硕士研究生王天依、博士后杨映雪、生信工程师许强、硕士研究生赵贤嘉为该论文共同第一作者,钱前院士、商连光研究员和潘玮华研究员为论文的共同通讯作者。该研究得到国家自然科学基金基础科学中心、广东省自然科学杰出青年基金、中国农科院青年创新专项和海南省院士创新平台科研项目资金资助。
原文链接(点击阅读原文可直接跳转):
https://www.cell.com/molecular-plant/fulltext/S1674-2052(23)00219-8
转自:“iPlants”微信公众号
如有侵权,请联系本站删除!