以下文章来源于作图丫 ,作者mlndbb
导语GUIDE ╲
STRING是一个储存了已知和预测的蛋白质-蛋白质互作信息的数据库。
数据库介绍
发现和注释细胞中的功能性蛋白的相互作用关系,对系统地学习和理解细胞的功能起着重要的作用。近年来,通过实验证实和计算机技术预测都产生了大量的蛋白质互作信息。
STRING数据库作为一个全面的蛋白质互作数据库,整合了实验证实的蛋白质-蛋白质相互作用关系(文本挖掘)、从基因组的特征计算得来的相互作用关系和基于直系同源的物种模型转移来的相互作用关系这三类数据。在STRING数据库中,所有的蛋白质相互作用关系数据都有被加权、整合,并且都会有一个计算得到的可靠值,通过STRING数据库的网页访问,可以快速的获得我们想要得到的蛋白质互作关系。
在研究中可以通过分析蛋白质互作网络,找到网络中的关键基因!在目前的诸多蛋白质互作数据库中,STRING是覆盖物种最多,包含信息最全面的数据库,在最新的11.0b版本中,它包含了来源于5090个物种的24,584,628 个蛋白质之间的3,123,056,667 对蛋白质互作关系。
数据库链接:https://www.string-db.org/
数据库的使用
首先进入STRING数据库的主页,界面十分精简,点击Search进入查询界面,输入我们的目标蛋白质和对应物种。如果是输入一个蛋白质名称(或序列),会输出与该蛋白质互作的所有蛋白质的互作图。一次输入多个蛋白质名称(或者序列),将只输出这几个蛋白质之间的互作网络图。
01输入目标蛋白
在我们的实例中,使用METTL3基因作为输入,选择物种为Homo sapiens,点击SEARCH。
点击continue,就可以得到输出的蛋白质互作网络图了!
02节点和边信息
节点代表一个蛋白质,蛋白质中的螺旋代表该蛋白质的结构已知,如果该蛋白质结构未知,则圆圈内就是空。
节点之间的连线代表两个蛋白质之间存在互作关系,在evidence线型下,根据连线的不同颜色,代表了两个蛋白之间的互作关系有着不同的类型,包括实验证实、基因同源关联、共表达等。
在Settings选项中,可以通过调节网络线型为confidence,点击UPDATE,发现网络中的edge发生了变化,不同于evidence模式下多种颜色的线,只有一条黑线,线的颜色深浅不同,代表了蛋白质之间相关性的强弱。
edge的来源主要包含七部分,即实验数据、文本挖掘数据、数据库数据,基因邻接、基因融合、基因共表达。STRING利用打分机制对不同方法得来的结果给予一定的权重,最终给出一个综合得分。我们可以根据我们的目的不同,对这些来源进行筛选,或者对于相关得分进行筛选,从而得到我们所需要的蛋白质关系对。
03富集分析
在得到蛋白质互作网络的同时,STRING还给我们提供了对蛋白质互作网络中的蛋白质进行GO和KEGG富集分析的功能。点击Analysis选项,即可查看富集分析的结果。
在最下方的Save/Exports选项中,我们可以对富集分析的结果分别下载输出。
04聚类分析
在Clusters界面中,数据库提供了K-means和MCL两种聚类方法,对蛋白质互作网络中的蛋白质进行聚类,选择一种方法,点击APPLY,得到的网络中蛋白质节点的颜色代表了蛋白质所代表的分类。
05网络的扩张和精简
如果觉得得到的网络不够全面或者过于复杂,我们可以通过More或Less选项对现在的网络进行扩张或精简操作。
06网络的输出
在Exports界面,可以将蛋白质互作网络输出为图片格式(PNG),或者以表格信息的格式输出,从而在cytoscape等工具中进行进一步分析。
Download:
为了方便用户,STRING数据库给我们提供了数据下载功能,我们可以在Download选项中下载全面的蛋白质互作信息,从而进行更加个性化的网络信息。
小编总结
作为最全面的蛋白质互作数据库,STRING数据库可以构建蛋白质-蛋白质相互作用网络,预测潜在的蛋白质相互作用网络,为研究提供新方向。在我们的科研初期,快速获取目标蛋白质的功能互作蛋白,尤其是还没能很好的表征的蛋白质,STRING可以起到重要的作用!
如有侵权,请联系本站删除!