PBJ | 广东省农业科学院蔬菜所构建长豇豆接近完整的基因组并揭示豆荚花青素积累相关基因
2023/8/18 16:33:39 阅读:27 发布者:
长豇豆(Vigna unguiculata ssp. sesquipedialis)是一种重要豆类蔬菜,被誉为亚洲十大栽培蔬菜之一,中国是世界上长豇豆最大的种植和消费国。目前现有长豇豆基因组组装仍存在一定数量的间隙和未定位序列,这给功能基因组学研究带来挑战。作为果菜类蔬菜,外观和营养是重要的品质性状,花青素赋予植物绚丽色彩的同时亦有保健功效,然而,调控豇豆荚花青素积累的关键基因仍然未知。
2023年8月9日,广东省农业科学院蔬菜研究所叶菜豆类资源与育种团队与合作者在《Plant Biotechnologe Journal》(IF = 13.8)上发表题为“A near-complete assembly of asparagus bean provides insights into anthocyanin accumulation in pods”的论文。报道了长豇豆接近完整的基因组组装,解锁了豇豆基因组中结构最为复杂的着丝粒区域、端粒区域及大片段重复序列等,是目前最完整的豇豆基因组组装。基于此,克隆了豇豆荚花青素合成的关键基因。该成果是豇豆基因组学研究的重大突破,为豇豆研究领域提供了新的有力工具和重要理论基础。
该研究以长豇豆精英自交系丰产6号为材料,利用约~140× 的Nanopore超长和~60× 的 Pacbio HiFi 测序数据,结合Hi-C和Illumina测序数据进行挂载和矫正,完成了丰产6号参考基因组接近完整的组装(FC 6)。该基因组全长521.3Mb,contig N50达到46.4 Mb,挂载比例达到99.8%,仅存在1个间隙。成功组装了所有(11个)着丝粒区域以及14个端粒序列,4条染色体实现了端粒到端粒的组装。经评估,该基因组的碱基准确率达到99.99%,BUSCO的完整性为 99.3%。这些结果共同证明了丰产6参考基因组的高连贯性、完整性和准确性。
丰产6号端粒到端粒的基因组组装
该研究利用豇豆已发表的着丝粒特异性卫星序列CEN455、CEN721及CEN1600成功鉴定出长豇豆基因组11个(全部的)着丝粒核心区域,全长38.1Mb。并发现着丝粒区域的特异性串联重复卫星序列被长末端反转录转座子等转座子包围,占着丝粒区域的26.7%。在着丝粒区域预测到127个蛋白编码基因,其中29.1%的基因至少在一个组织中表达,说明这些基因保留一定功能。该研究成功解析了豇豆基因组着丝粒区域的组成结构,为阐明着丝粒的进化历程奠定了基础。
Vu01染色体着丝粒区域特征描述
在整个基因组中,长度至少为1kb、且序列同源性为90%或更高的重复序列被称为大片段重复(SD),它们是重复基因的重要来源,在基因进化中起着重要作用。丰产6的高质量基因组组装为准确解析SD提供了宝贵机会。该研究鉴定了总长度达到79.6 Mb的SD,占基因组的15.3%。SD区域的3,338个基因在代谢过程、热应答、细菌防御应答、诱导系统获得抗性等方面富集,表明SD促进了与环境适应相关的功能基因的扩张。 NBS-LRR基因是植物对病原菌感染防御系统中的最大的一个基因家族。该研究在丰产6的基因组中鉴定了181个NBS-LRR基因,发现根的NBS-LRR基因中位表达量最高,表明根可能对微生物接触有增强的反应,可能是由于根部更容易受到感染。
丰产6号基因组中的重复序列鉴定与重复基因
综合利用该高质量基因组组装和大规模转录组数据,该研究成功鉴定出一个控制长豇豆豆荚色泽的关键转录因子基因VuMYB114。相关发现为阐明长豇豆花青素代谢途径的精细调控机制,以及未来设计育种提高豆荚的外观及营养价值奠定了基础。
豆荚花青素合成关键基因定位与功能验证
该研究获得了长豇豆丰产6号接近完整的基因组组装,为开展基因定位分析、标记辅助选择等一系列分子模块设计育种研究提供了极为宝贵的基础资源支撑。相关成果的产出,将有力推动功能基因组学在长豇豆中的应用,有助于更快培育出性状更优异、品质更佳的新品系,以促进长豇豆的产量与质量的高质量发展。
广东省农业科学院蔬菜研究所杨易博士和中山大学吴志坤博士为该论文共同第一作者,广东省农业科学院蔬菜研究所张艳副研究员为通讯作者。浙江省农业科学院李国景研究员,吴新义副研究员参与了该项工作。本研究得到广东省自然科学基金,广东省重点领域研发计划项目和广东省农业科学院创新基金资助。
原文链接:
https://onlinelibrary.wiley.com/doi/epdf/10.1111/pbi.14142
转自:“植物生物技术Pbj”微信公众号
如有侵权,请联系本站删除!