【Cell Reports】新手段!浙江大学利用eQTL和机器学习挖掘棉花产量基因
2023/9/14 10:21:20 阅读:47 发布者:
2023年9月8日,浙江大学棉花精准育种团队在Cell Reports上发表了题为“Integration of eQTL and machine learning to dissect causal genes with pleiotropic effects in genetic regulation networks of seed cotton yield”的研究论文。该研究鉴定了棉花胚珠中和产量功能位点关联的基因调控网络,并结合机器学习方法挖掘新的功能基因。
棉花产量形成是分子网络中多个基因共同作用的结果,因此,阐明农艺性状形成的调控网络和鉴定网络中的枢纽基因具有重要意义。全基因组关联分析(GWAS)是作物基因挖掘的重要手段,然而GWAS的分辨率受目标群体内的连锁不平衡程度,等位基因或单倍型的频率限制,挖掘基因仍然具有挑战性。
表达数量性状位点(expression quantitative trait locus, eQTL)是解析基因表达的遗传基础的重要方法。为了挖掘功能位点背后的候选基因,研究人员通过558个陆地棉的胚珠的转录组测序,结合基因组重测序数据,鉴定到了12,207个eQTL,并通过连锁不平衡LD关系,获得了38个和功能位点共定位的基因调控网络。
研究人员进一步探究了位于同一调控网络中的基因在不同组织中表现出相似的表达模式,暗示其可能受到了相同遗传因子的调控。不同功能调控网络之间的基因存在交集,可能与遗传位点的一因多效有关。反式 (trans-) 作用eQTL是指某个基因的eQTL定位到其它基因组区域,遗传力分析显示,由trans-eQTL基因来源的遗传变异可以挽救部分“消失的遗传力”。
为了鉴定网络中的枢纽基因,研究人员还采用XGBoost算法识别重要基因。并结合全转录组关联分析(transcriptome-wide association)结果,对排序较前的功能基因NF-YB3和GRDP1分别进行了功能验证。
本研究通过生物大数据和机器学习来认识基因功能和调控机制,为实现知识驱动的分子设计育种提供新的见解。
浙江大学农业与生物技术学院特聘研究员赵汀为论文第一作者,关雪莹教授为论文通讯作者。张天真教授、方磊教授对研究工作做了重要指导。该研究受到国家重点研发计划、国家自然科学基金等项目资助。
转自:“iPlants”微信公众号
如有侵权,请联系本站删除!