投稿问答最小化  关闭

万维书刊APP下载

Sangerbox: 交互式整合生信分析平台 | 国产新刊iMeta发布

2022/7/25 16:00:06  阅读:670 发布者:

Sangerbox:交互、友好的整合临床生信分析平台

https://doi.org/10.1002/imt2.36

202278日,哈尔滨医科大学宋湘团队联合杭州慕谷科技有限公司在iMeta 发表了题为Sangerbox: A comprehensive, interaction-friendly clinical bioinformatics analysis platform”的文章。

 Sangerbox (http://vip.sangerbox.com)是基于网络的工具平台,用户可以在一个友好的交互页面中进行不同的分析。平台提供可交互的图形化分析工具,包括相关性分析工具,通路富集分析、WGCNA分析等常见的工具和功能

  第一作者:沈玮涛、宋紫光、钟晓

  通讯作者:宋湘(song761231@sina.com)

   亮点

 Sangerbox界面友好,支持差异分析、相关分析、通路富集分析、加权相关网络分析等

  一种新的交互式绘图系统,允许用户调整图像中的参数,如直接拉伸、移动图表元素,导时矢量图等

●组织了GEOTCGAICGC等数据库, 快速批处理降低了数据获取的难度,大大提高了效率。

基于Google Scholar统计,“Sangerbox”截止2022723日被引532次,2022年上半年被引245次,每天至少助力一篇文章发表。

全文解读

近十几年以来,随着高通量测序技术的不断发展,医学研究中的数据体量不断增大,数据囊括的范围也越来越广,在不断产生庞大的公共测序数据的同时,几乎每一位临床研究者都拥有一份自己独立的组学数据,这为数据挖掘和更深入的了解基因功能创造了很好的条件。但对于这些数量庞大的数据,许多不论是常见的或是前沿的有效的生物信息研究方法仍然无法被广泛应用。这促使了许多分析平台的产生,有一部分数据库或平台旨在解决的用户的特殊分析需求,例如为了特定组学建立的网站平台MGRAST, IMG/M, Qiita, BIGSdb, TRAPR, imageGPMetOrigin,还有一些为解决特定问题分析而设计的,例如Metascape旨在提供基因的功能注释和功能富集分析;BioNumericsRidomSeqSphere+为了执行多位点序列分型设计;CARD仅提供抗菌素耐药性注释。此外,还有一部分网络服务功能比较陈旧,同时交互效率低下往往不能满足研究人员的精细个性化需求。因此海量的数据处理任务需要被完成,并且一个综合的生物信息分析平台亟待完成。

我们开发了Sangerbox (http://vip.sangerbox.com),一个基于网络的工具平台。用户可以在一个友好的交互页面中进行不同的分析。平台提供可交互的图形化分析工具,包括相关性分析工具,通路富集分析、WGCNA分析等等常见的工具和功能(1)。用户只需要上传他们对应的数据到网站云端,输入需要的参数,等待计算完成后即可获得结果。我们还建立了全新的互动式绘图系统,这个系统允许用户在画面中直观的调整参数。同时,我们还优化绘图工具的性能,这一点允许用户在网页中调整大容量的矢量图的工具。除此之外,我们还整合了GEOTCGAICGC等数据库,并且对这些数据进行了快速批量处理,大大降低用户获取数据难度的同时提高了生信分析中数据处理的效率。最后我们还提供丰富的生信分析课程资源,为研究人眼提供了一个分享和交流的知识的平台。

便捷、强大、可交互的分析和绘图工具

Sangerbox平台的分析及绘图工具加速了研究人员分析数据的效率,提高了公共资源和个人数据的利用率,有利于临床研究。长期以来,生物信息分析对于临床和专业实验的研究人员来说一直都是难以入门的,无论是代码变成技能、数学代数知识或是统计学、概率学都需要长时间的积累,如果每项技能都从头开始,需要研究人员付出大量努力和时间。其次,许多分析过程中需要高性能的网络、存储、计算服务,不少分析中,计算量不是个人电脑能够承受的。

Sangerbox提供了一个仅需了解工具分析原理和分析目的就可以进行计算的平台,平台中超过40中不同类型的工具可以更高效的帮助科研人员完成分析(2),简化学习过程,降低学习成本,同时加快数据处理过程,消化不断增长的海量生物数据。同时平台拥有远远优于更个人电脑性能的云端服务器,可以完成更多个人电脑无法完成的分析类型,可以让研究人员轻松地突破计算力和分析方法的限制,完成对数据量更大、资源要求高、更复杂方法的应用。该平台还提供了一个可视化网页界面,研究人员可以通过输入自己的生物数据和设置参数来使用绘图工具和生物信息学分析工具。目前,Sangerbox平台集成了100多种常用的计算分析方法,提供的工具约40余种,涵盖统计、分析、可视化三大类工具。

绘图工具中涵盖了常见的图表类型,如森林图、雷达图、热图、小提琴图、箱线图、韦恩图和弦图等。绘图工具在提供绘制功能的同时还附带常用的一般统计信息,并允许用户在一些特定图表工具中选择组内或组间的参数或非参数检验等。其次,Sangerbox的绘图系统还对数据输入的格式进行了调整,更加符合一般用户的习惯,让绘图变成更加轻松方便。最后我们还对绘图工具进行了性能上的优化,让用户可以高效快速的使用,并且允许一些配置较低的电脑上运行大容量的矢量图。

对比一些常用的工具软件包,例如ggplot2complexHeatmap等,Sangerbox的绘图工具在功能得到进一步加强的情况下还更加简单易于操作。

Sangerbox平台还为用户提供了多种广泛使用的生物信息分析工具,包括文本处理和数据标准化处理工具;数据分析包括降维、聚类、差异分析等以及一些常见的生物信息分析,例如加权相关网络分析(WGCNA)、生存分析、基因集富集分析(GSEA)等。Sangerbox将根据用户的不同需求不断改进工具、更新更多方法和统计数据,让Sangerbox的用户可以更高效的处理更多的临床生物数据、进而为临床研究发出贡献。

强大的可交互可视化界面

为了获得更好的用户体验,我们开发了全新的可视化交互系统,不在需要繁琐的编程代码和复杂的参数设置(图3)。我们的系统基于D3.JSjQuery.JS建立,使用JavaScript设计的交互式可视化界面允许用户通过鼠标点击、选择、拖动等操作,直观快速的获得矢量图形,从而实现“所见即所得”的目标。

同时,Sangerbox支持用户导出多种不同格式的位图或矢量图,以进一步支持用户的需求。

此外,矢量图绘制、计算需要占用大量绘图性能,为了让不同工作环境下的研究人员都能够良好的体验,我们优化了图像的性能,让用户能够在较低算力的情况下快速使用并调整大容量的图形。

公开数据的下载和处理

Sangerbox平台支持更轻松快速的下载公共数据,同时可以对数据进行批量处理,这有利于研究人员的数据研究工作。这些数据来自The Cancer Genome Atlas (TCGA)International Cancer Genome Consortium (ICGC)Gene Expression Omnibus (GEO) 和其他一些包含随访数据、临床数据、突变数据和表达谱数据等的数据库。

Sangerbox还为来自NCBIGEO中的表达谱数据提供了快速预处理功能,用户可以直接获得重注释、标准化等预处理后的数据。同时整合了TCGAICGCTARGET(therapeutically applicable research to generate effective treatments)等数据库的全新目录,更符合一般科研者的使用习惯,可以帮助用户降低数据获取的门槛。

Sangerbox还构建了完成的课程分享平台。在提供录屏课程的同时还有一些在线直播课程。包括帮助科研者熟悉平台操作,介绍分享某些领域的前沿研究方法和研究趋势。

引文

Weitao Shen, Ziguang Song, Xiao Zhong, Mei Huang, Danting Shen, Pingping Gao, Xiaoqian Qian, Mengmeng Wang, Xiubin He, Tonglian Wang, Shuang Li, Xiang Song. 2022. Sangerbox: A comprehensive, interaction-friendly clinical bioinformatics analysis platform. iMeta 1: e36. https://doi.org/10.1002/imt2.36

作者简介

宋湘(通讯作者)

●博导,哈尔滨医科大学教授,上海浦东新区周浦医院心研所主任

●目前是上海健康医学院附属周浦医院学术骨干和学科带头人,国家自然科学基金委员会评委及Frontiers in Renal and Epithelial Physiology杂志编委。长期致力于心血管病心力衰竭方面的研究,其中一些研究在相关领域原创性提出新的概念,首次发现并克隆出心脏尿素转运蛋白,将其新命名为UT-A7,开展UT-A7的研究获得国家自然科学基金的资助。近5年作为项目负责人主持包括国家自然科学基金2项、教育部归国留学人员科研启动金及省部级课题多项。以第一作者或通讯作者发表SCI 收录学术论文16篇,其中第一作者6篇,通讯作者10篇,影响因子累积超过50。目前围绕于性激素与心血管疾病的研究并已取得一些进展。

沈玮涛(共同第一作者)

  杭州慕谷科技研发部,现已在Nucleic Acids Research , NEURO-ONCOLOGY等杂志发表SCI论文7

宋紫光(共同第一作者)

●哈尔滨医科大学博士研究生,已在Frontiers in cardiovascular medicineFrontiers in public healthJournal of Cardiovascular Translational Research等杂志发表论文5

钟晓(共同第一作者)

●哈尔滨医科大学博士研究生。现已在Clinical and Experimental Pharmacology & PhysiologyMICROVASCULAR RESEARCH杂志发表SCI论文2

本文转自iMeta

转自:解说科研项目

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com