投稿问答最小化  关闭

万维书刊APP下载

Plant Physiology | 实用!中国农科院基因组所潘玮华团队开发植物基因功能注释软件:GFAP

2023/7/14 9:53:43  阅读:49 发布者:

以近缘物种基因功能信息注释基因是较为常见的基因功能注释方式。目前已有约788种植物经过了基因组测序,然而目前主流功能注释工具包含的植物参考种类却极为有限。以著名的注释网站eggnog-mapper为例,在其收集的373类参考物种中,仅有9种与植物相关。换言之,难以找到合适物种模型进行注释是目前植物基因功能注释方面需要解决重要问题。

近日,中国农业科学院深圳农业基因组研究所潘玮华团队在Plant Physiology发表了题为“GFAP: ultra-fast and accurate gene functional annotation software for plants”的论文,介绍了新研发的植物基因功能注释软件GFAP

GFAP综合了多种类型的数据库。首先,近缘物种注释库包含从藻类、苔藓、蕨类、裸子直至单子叶与双子叶植物在内的208种植物注释模型。其次,隐马尔可夫模型库包含目前最完整的蛋白结构域与功能映射,该库原则上可以注释任何具有已知蛋白结构域的基因。上述两库主要用于GOKEGG以及Pfam注释。另外,目前主流的nrswissprotCOG以及UniProt数据库也加入到了GFAP数据库中,使用户可以根据自身需要灵活选择。除注释外,GFAP的辅助功能可以帮助用户更加便捷地操作数据,目前所设置的辅助功能包括数据可视化、基因家族成员鉴定、从转录本中提取编码序列、批量翻译、批量提取等。效率方面,GFAP可以在4.5s内以GOKEGGPfam信息注释超过2000个基因,显著高于当前主流功能注释工具;经CAFA等广泛认可的测试数据集验证,GFAP的注释准确性显著高于当前主流功能注释工具或与主流工具持平。所有功能都可以通过点击的方式实现,降低了对用户计算和生物信息方面能力的要求。配备有相应版本可以适应目前所有主流操作系统(包括WindowsLinuxMacOS)且开发了相关网站,便于用户使用。

目前,GFAPQQ用户群(ID836269686)已有480位成员且软件开发者就在群中,可以帮助用户解决使用方面的问题。

中国农业科学院农业基因组研究所潘玮华研究员为本文通讯作者,山东农业大学的李际红教授、浙江农林大学的张进教授为本文共同通讯作者,中国农业科学院农业基因组研究所博士后许东为本文第一作者,中国农业科学院农业基因组研究所博士后杨映雪、科研助理宫得胜以及南京师范大学本科生陈晓健为本文共同第一作者。本研究得到国家自然科学基金、深圳市优秀科技创新人才培养项目等的支持和帮助。

工具链接:

http://43.139.112.84/go-kegg-pfam-index

文章链接:

https://doi.org/10.1093/plphys/kiad393

本文转载自植物生理PlantPhysiol

转自:“植物生物技术Pbj”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com