投稿问答最小化  关闭

万维书刊APP下载

里程碑,12.28Gb!上海辰山植物园等公布凤丹牡丹基因组,双子叶植物中最大基因组

2022/12/13 8:57:08  阅读:169 发布者:

20221128日,上海辰山植物园联合华大基因在国际著名期刊Nature Communications上发表了题为“Genomic basis of the giga-chromosomes and giga-genome of tree peony Paeonia ostii”(凤丹牡丹超大染色体及巨大基因组的遗传机制)的牡丹基因组学最新研究成果(点击页面左下方“阅读原文”可查看)。

该研究成功破解了凤丹牡丹高质量染色体水平的基因组遗传密码及其超大染色体形成与维持的潜在分子机制。这是迄今世界上已经测序的陆地植物中最大染色体(1.78-2.56Gb),也是已测序双子叶植物中最大基因组(12.28Gb)之一。此研究成果不仅将牡丹科学研究带入了真正的基因组时代,而且也开启了牡丹分子育种及优质特异基因鉴定和功能解析与产业利用的新纪元;是牡丹科学研究领域里程碑式的标志性成果,也是植物基因组学领域(巨大基因组和超大染色体研究)中最重要的突破性研究进展之一。

1 凤丹牡丹超大染色体及巨大基因组特征图

01

历经十年艰辛探索,

成功破解高复杂超大凤丹牡丹基因组遗传密码

牡丹基因组之复杂及破解难度之大,既在研究人员初始预料之中,但历经十年艰辛探索的周期之长却又极大的超出预料之外。这十年来,既是基因组科学及测序组装技术飞速发展的十年,也是凤丹基因组艰辛探索、逐步解析复杂谜团之旅。

对凤丹牡丹基因组,研究团队采用了逐级梯度建库策略(150\300\500\800bp2k\5k\10k\20k\40k文库)及短读长测序技术(2.97Gb),结合长读长测序技术(PacBio平台 643.76Gb)和精准染色体构象捕获技术(Hi-C数据2.50Tb);在测序组装分析过程中,研究团队不断进行适用于牡丹复杂基因组特点的技术创新,并及时借鉴学习基因组学领域众多前沿技术,历经数百次/种软件测试、开发及应用分析和反复优化组装,曾先后形成过5个定型组装版本和3次完整(人工辅助)注释的拟发表版本。

本文最终发表凤丹基因组成熟版本为12.28GbContig N50=228KbScaffold N50=2.43Mb),其中11.49Gb(约93.5%)成功组装到5条超大染色体(1.78-2.56Gb),这也是迄今人类已经测序陆地植物中最大的染色体。此版本中共注释基因73,177条,高置信基因集59,768条,有54,451条锚定在5条不同染色体上。

02

逆转录转座子爆发式插入基因间区产生了牡丹超大染色体和巨大基因组

研究结果表明:在凤丹基因组中,约有33,0511条假基因和15,238个基因家族,即据我们所知,牡丹基因组中假基因和基因家族的数量是迄今已经测序的植物中最多的物种。这些大量假基因的产生可能与LTR在基因组的大量扩增相关。与其它具有巨大基因组的单子叶植物大多经历了全基因组加倍事件相比,凤丹基因组似乎没有经历过其谱系特定的全基因组复制;而在短时间内(约200万年)其基因间区的逆转录转座子(以Del为代表的 LTR)爆炸性扩张是促成了其超大基因组和超大染色体的形成的可能机制。通过对16种代表性植物基因组中LTR的重新注释,本研究还提出了逆转录转座子Del家族相对于其它LTR亚家族在牡丹基因组中大量扩增及产生的可能机制,与其结构域的完整性(酶活性)相关。深入综合分析牡丹全基因组甲基化简化测序、组蛋白甲基化测序数据与LTR数据的结果表明,虽然牡丹拥有双子叶被子植物(迄今已测序)中最大的基因组和超级巨大的染色体,但其大部分功能基因依然可以正常的表达和转录,其原因就是大量的LTR是插入在远离功能区的基因间区。

2 凤丹牡丹中大量LTR爆发式插入基因组基因间区产生了超大基因组/染色体

03

凤丹牡丹千兆超大染色体的进化与形成机制

本研究采用被子植物12种代表性物种的系统进化分析结果,进一步明确了牡丹(芍药科)的系统位置处于核心双子叶植物基部的虎耳草目(Saxifragales),大约出现在109百万年前。4DTV进化分析表明以凤丹牡丹为代表的芍药科植物与葡萄等核心真双子叶植物可能共同经历了其祖先130百万年前的6倍化事件(γ)。同时,祖先染色推断与进化分析表明,牡丹基因组是通过祖先染色体(7条基数)至少经过4次断裂和20次融合等一系列复杂进化事件后才形成的当前牡丹类群中的5条染色体基数。研究表明:牡丹基因组中约有208个组蛋白编码基因(H1H2AH2BH3H4),结合重新分析已发表的大量基因组数据,我们深入讨论了牡丹超大染色体的形成和维持所涉及的可能因素,本文中首次明确提出了牡丹这五种组蛋白编码基因的扩张(特别是H2A.WH3.1)可能有助于维持其超级巨大的千兆染色体的初步科学猜想,且组蛋白数目与维持植物较大染色体相关的这一机制也可能存在普遍性,进一步的深入研究和更直接的证据仍在持续进行之中。

3 凤丹染色体进化形成与维持机制

04

全基因组关联分析揭示了牡丹高不饱和脂肪酸之谜

同时,凤丹牡丹及其它芍药科植物还以其种子油而著称,其中富含不饱和脂肪酸,例如α-亚麻酸(ALA)。研究团队对448个种质进行了简化基因组测序和全基因组关联分析(GWAS),并结合了种子时序发育转录组等技术,研究揭示了牡丹种子高效积累不饱和脂肪酸的重要机制,即其虽然与大多数陆地植物同样保守的脂肪酸生物合成途径,但是在通路中的每个关键节点至少有一个高表达基因在行使功能,进而保障了牡丹ALA等的大量积累;本研究还进一步鉴定了(包括SADFAD2等)多个候选油脂合成基因,可能在其种子高水平的ALA合成中发挥重要作用。

本研究还系统解析了陆地植物中ALA合成关键环节(从亚油酸LA到α亚麻酸ALA)中FAD3FAD7/8基因的进化历史,首次揭示了其在被子植物早期发生过一次基因复制事件及其重要意义。

4 GWAS揭示的牡丹高ALA合成相关的候选基因(SADFAD2

05

栽培牡丹雄蕊瓣化的分子机制与人工驯化对牡丹花多样的贡献

凤丹牡丹(P. ostii)同时也是一种重要的观赏植物,是栽培牡丹(P. suffruticosa)的重要祖先亲本之一,本研究发现:花发育(器官身份决定基因)A类基因AP1的异位表达和C类基因AG在部分雄蕊中的表达减少可能有助于雄蕊瓣化的形成。同时,在栽培牡丹的长期栽培驯化过程中,决定花多样性的多个花器官发育基因明显受到人工选择压力。

本研究进一步提出了牡丹花型发育的多样性模式假说,即在祖先亲本牡丹(P. ostii)的“花发育ABCE经典模型”(Strict ABCE Model)和栽培牡丹(P. suffruticosa)中的“不严格的花发育边界消退模型”(Unstrict ABCE Model),结合选择分析结果,提出了牡丹花发育模式转变的进化驱动力就是栽培牡丹千百年来的人工驯化过程。这一研究发现,还进一步丰富了植物花发育研究的进化模式,即人工选择可能会打破前人研究表明的种子植物中花发育器官基因渠道化的方向性进化模式。该结果不但挖掘了栽培牡丹花多样性的多个候选基因,为进一步培育更优质和更高观赏价值牡丹提供了理论依据和基因资源。

5 牡丹花多样性及雄蕊瓣化的分子机制

总之,本研究成功破解了凤丹牡丹超大基因组/染色体的遗传密码,揭示了凤丹牡丹(P. ostii)不饱和脂肪酸生物合成相关的候选基因以及导致雄蕊瓣化形成的可能原因,其染色体水平的高质量基因组资源对于研究超大染色体/基因组进化和牡丹育种具有极其重要的科学及应用价值,是牡丹科学和植物基因组学研究领域的突破性、里程碑式的标志性成果之一。

转自:iPlants”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com