北京市农林科学院胡红霞研究员团队在鱼类分类性状基因组选择方法研究方面取得重要进展
2023/8/10 8:50:48 阅读:42 发布者:
以下文章来源于农业通讯 ,作者宋海亮
分类性状是指可以明确分为几种离散类别的性状,如鲟鱼的鱼卵颜色为四分类性状(1:黑色,2:中间色,3:浅色,4:金色);鱼类抗病性状可作为五分类性状(0:没有感染,1:极轻感染,2:轻度感染,3:中度感染,4:晚期感染,5:重度感染);鱼类的生长速率可以被分类为快速生长、中等生长、慢速生长等。分类性状因测量简单、记录成本低,被广泛应用于鱼类育种中,对鱼类育种和遗传改良非常重要。然而,目前大多数研究将分类性状视为线性性状,并使用线性模型进行分析,这可能会违背线性模型的基本假设,导致基因组预测准确性严重降低。
Agriculture Communications 期刊于2023年8月上线了北京市农林科学院水产科学研究所胡红霞研究员团队题为“Using Bayesian threshold model and machine learning method to improve the accuracy of genomic prediction for ordered categorical traits in fish”的研究论文,报道了利用贝叶斯阈模型和机器学习方法显著提高鱼类分类性状基因组预测准确性。
图文摘要(Graphical Abstract)
该研究分别利用模拟数据和大西洋鲑实际数据验证了贝叶斯阈模型和机器学习方法在鱼类分类性状基因组预测上的优势。首先,模拟4个世代的群体数据,每个群体4000尾个体,分别模拟4分类、3分类和2分类的表型,将第三个世代的4000个个体作为参考群体,随机选择第四个世代的1000个个体作为验证群体,模拟重复20次。利用BayesA和BayesCπ的线性模型和阈模型进行基因组育种值估计,另外选择基于默认超参数的支持向量回归(SVRdef)和调整超参数的支持向量回归(SVRtuning)进行基因组选择。结果表明,贝叶斯阈模型对2分类、3分类和4分类性状的预测准确性平均比贝叶斯线性模型高2.1%、2.6%和2.9%。在所有情况下,与SVRdef和贝叶斯阈模型相比,SVRtuning产生了更高的预测准确性。
图1 模拟数据分类性状的发生率估计
为了进一步验证贝叶斯阈模型和机器学习方法在鱼类分类性状基因组预测上的优势,选择1484尾大西洋鲑群体数据进行验证,分析的性状为抗阿米巴鳃病,是一个5分类性状。利用20次重复的5fold交叉验证对不同方法进行比较。结果表明,贝叶斯阈模型的预测准确性比贝叶斯线性模型高1.2%,SVRdef和SVRtuning的预测准确性分别比贝叶斯方法高3.3%和6.6%。我们的结果证实了贝叶斯阈模型和机器学习方法在鱼类分类性状基因组预测方面的优越性,该研究对丰富基因组选择理论,促进鱼类育种遗传进展具有重要意义。
图2 用BayesCπ线性和阈模型估计真实QTL(π)的比例
原文链接
https://doi.org/10.1016/j.agrcom.2023.100005
北京市农林科学院宋海亮副研究员为该论文第一作者,胡红霞研究员为通讯作者。这项工作得到了国家自然科学基金(32202915)、北京市自然科学基金(6222014),北京市种质创制和品种选育联合攻关项目(G20220628008)和北京市农林科学院青年基金(QNJJ202105)等项目的资助。
转自:“iPlants”微信公众号
如有侵权,请联系本站删除!