本期给大家复现的是一篇2022年2月刚刚新鲜出炉的发表在5分+的医学杂志Aging (Albany NY)上的基因家族单肿瘤的生信文章~
文章背景
胶质母细胞瘤(GBM)是一种致命的恶性原发性脑肿瘤,占所有胶质瘤的54.9%
即使经过手术、放疗、化疗等各种治疗,GBM患者的预后也较差
因此,识别新的生物标志物,有效地提高预后和个体化治疗具有重要意义
CBX家族蛋白(CBX1-8)是表观遗传调控复合物的重要组成部分,参与了多种癌症的发生和发展,然而,CBX成员在GBM中的作用尚不清楚
在本研究中,作者利用多个的生物信息学数据库,全面探讨了CBXs在GBM中的表达谱、预后意义、基因改变、免疫浸润和潜在的生物学功能,并进行了细胞实验来研究CBX8在GBM中的作用
为寻找胶质母细胞瘤CBX家族成员潜在的预后标志物和新的治疗靶点提供新的思路
文章思路
差异表达分析
Figure 1:GBM患者中CBXs的mRNA表达水平
Figure 2:人类蛋白图谱中CBXs的代表性免疫组化图像
临床意义
Figure 3:CBXs转录水平与临床病理的关系
Figure 4:GBM中CBXs转录水平的预后价值
功能聚类
Figure 6:GBM中CBXs的遗传改变及相关性分析
Figure 7:GBM中CBXs及其共表达基因的蛋白-蛋白相互作用及功能富集
Figure 8:CBXs与免疫细胞浸润的相关
交互网络
Figure 7:GBM中CBXs及其共表达基因的蛋白-蛋白相互作用及功能富集
实验验证
Figure 5:CBX8促进了GBM细胞的增殖
使用工具
GEPIA2数据库
http://gepia2.cancer-pku.cn/#index
UALCAN数据库
http://ualcan.path.uab.edu/
仙桃学术工具
https://www.xiantao.love/
HPA数据库
https://www.proteinatlas.org/
GlioVis数据库
http://gliovis.bioinfo.cnio.es/
cBioPortal 数据库
http://www.cbioportal.org/
STRING数据库
https://string-db.org/
TIMER数据库
https://cistrome.shinyapps.io/timer/
复现步骤
Figure 1:GBM患者中CBXs的mRNA表达水平
PS:在Figure 1中作者使用了GEPIA2和 UALCAN两个不同的数据库分析了mRNA的表达
(1)进入GEPIA2数据库(http://gepia2.cancer-pku.cn/#index),点击左下角Profile
弹出的界面,Gene输入CBX1,Dataset选择GBM,默认其它参数,最后点击Plot
即可得到文中Figure 1A中CBX1在GBM组织和正常胶质组织中的mRNA表达散点图,点击download即可下载SVG格式的矢量图,同样方法可获取CBX家族其它7个基因的mRNA表达散点图
(2)选择Expression DIY中的Multiple gene comparison,Gene list里面输入CBX1、CBX2、CBX3、CBX4、CBX5、CBX6、CBX7、CBX8,Dataset选择GBM,默认其它参数,点击Plot
即可得到文中Figure 1C CBX家族在GBM中的相对表达量条形图,点击右上角保存按钮即可保存
(3)进入UALCAN数据库(http://ualcan.path.uab.edu/),Enter gene symbols里面输入CBX1、CBX2、CBX3、CBX4、CBX5、CBX6、CBX7、CBX8,TCGA dataset选择Glioblastoma multifome的,点击Explore
即可得到文中Figure 1B中的CBX1在GBM组织和正常胶质组织中的mRNA表达箱式图,点击右上角下载按钮,即可下载PNG/PDF/SVG等格式图片,同样方法可获取CBX家族其它7个基因的mRNA表达箱式图
PS:这里也可以通过仙桃学术工具(https://www.xiantao.love/)一键出整个基因家族的mRNA表达箱式图,进入仙桃学术工具
左侧导航栏中选择表达差异(挑)中[云]非配对样本→选择胶质瘤的数据集,分子类型输入CBX1、CBX2、CBX3、CBX4、CBX5、CBX6、CBX7、CBX8,默认其它参数
点击确认,即可得到整个CBX基因家族在GBM组织和正常胶质组织中的mRNA表达箱式图
Figure 2:人类蛋白图谱中CBXs的代表性免疫组化图像
(1)进入HPA数据库(https://www.proteinatlas.org/),输入基因CBX1,点击Search
点击Tissue
选择cerebral cortex
其中第一个免疫组化图即为文中Figure 2A中CBX1在正常组织中表达的组化图片,记录其所用的抗体及表达等相关信息,右键图片另存为保存即可,同样方法可获取CBX家族基因分别在正常组织和肿瘤组织中表达的组化图片
Figure 3:CBXs转录水平与临床病理的关系
PS:这里作者利用脑瘤专用数据库分析了CBXs家族基因转录水平与临床病理的关系
该数据库除了包含TCGA的脑瘤相关数据,其在2020年新纳入了中国神经胶质瘤基因组图谱,即Chinese Glioma Genome Atlas (CGGA),数据库可对表达、生存、相关性、突变、差异表达等进行分析和和可视化
(1)进入GlioVis数据库(http://gliovis.bioinfo.cnio.es/),点击Explore
(2)进入Expression分析界面,在左侧参数栏中,Dataset选择CGGA,Tumor type选择All,Gene输入CBX1,Plot type选择Grade,默认其它参数
点击download即可得到文中Figure 3A中的CBX1在GBM中不同分级的表达箱式图,同样方法可获取CBX家族基因在GBM中不同分级下的表达箱式图
同时调整Plot type类型为Recurrence,即可得到CBX家族基因在GBM中不同复发状态下的表达箱式图
PS:这里也可以通过仙桃学术工具一键出图:进入仙桃学术工具→左侧导航栏选择临床意义(靠)中(临时)[云] 临床相关性→选择TCGA-GBMLGG FPKM格式的数据集→选择临床参数WHO-grade
(当然这里后期小伙伴们分析自己数据时可根据实际情况选择不同的参数分析)
设置分组→分子栏中输入CBX1、CBX2、CBX3、CBX4、CBX5、CBX6、CBX7、CBX8基因
点击确认,即可得到CBX家族基因在GBM中不同分级的表达箱式图
Figure 4:GBM中CBXs转录水平的预后价值
PS:这里CBXs家族基因的预后生存分析,作者还是GlioVis数据库
(1)进入GlioVis数据库(http://gliovis.bioinfo.cnio.es/),点击Explore,进入Survival分析界面,在左侧参数栏中,Dataset选择CGGA,Tumor type选择All
Gene输入CBX1,Histology选择GBM,默认其它参数,点击download即可得到文中Figure4A中的CBX1在GBM中生存曲线,同样方法可获取CBX家族基因在GBM中的生存曲线
Figure 6:GBM中CBXs的遗传改变及相关性分析
(1)进入cBioPortal 数据库(http://www.cbioportal.org/),选择原文中提到的Glioblastoma Multiforme (TCGA, Firehose Legacy) 数据集,点击Query By Gene
(2)默认相关参数,输入基因CBX1、CBX2、CBX3、CBX4、CBX5、CBX6、CBX7、CBX8,点击Submit Query
(3)新的界面点击Download,即可下载文中Figure 6A,即GBM中CBX家族基因的突变概况图
(4)Figure 6B中CBX家族基因的相关性热图这里我们直接用仙桃工具一键式复现出图
进入仙桃学术工具→左侧导航栏选择分子交互(联)[云] 相关性热图→选择TCGA-GBMLGG FPKM格式的数据集→分子栏中输入CBX1、CBX2、CBX3、CBX4、CBX5、CBX6、CBX7、CBX8基因
点击确认即可得到CBX家族基因的相关性热图
Figure 7:GBM中CBXs及其共表达基因的蛋白-蛋白相互作用及功能富集
(1)重复Figure 6A的步骤1-2,弹出新界面,选择Co-expression,即可得到CBX家族基因的共表达基因,点击Download TSV下载数据,然后根据Spearman相关性系数和P值进行筛选共表达基因
PS:原文中没有具体描述共表达基因的筛选阈值,这里首先可以根据P值来筛选基因,初筛条件一般可设置P<0.05,也可设置P<0.01或P<0.001
其次根据Spearman相关性系数进一步筛选,相关系数的绝对值>0.75的为高度相关,在0.5-0.75区间的为中度相关,<0.5的为弱相关,大家在自己的分析中可根据具体基因数量灵活调整设置参数
(2)整理获取的共表达基因通过STRING数据库构建PPI,保存如下图所示的tsv格式数据
PS:也可进入仙桃学术工具→左侧导航栏选择交互网络(联)→STRING蛋白互作→分子栏中输入前面获取的共表达基因,点击确认,待分析完成后下载PPI的excel数据
(3)最后通过Cytoscape软件对PPI结果进行可视化,这里因为没有原文的数据就不给大家展示了,关于Cytoscape软件的教程,这里给大家推荐解螺旋的免费课程技能单元课里的Cytoscape软件使用教程,里面详细介绍了网络可视化方法和技巧
(4)接下来的富集分析,作者式通过WebGestalt在线工具进行分析和可视化,这里我们通过仙桃给大家呈现富集分析的多种可视化形式
进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→GO/KEGG富集分析,分子列表输入共表达基因,富集分析选择全部GO-BP项目,点击确认,下载excel结果并保存结果为BP
点击左侧导航栏中的功能聚类(圈)→GO/KEGG可视化,选择分析好的项目BP,类型可选择柱状图/气泡图,输入显示的富集条目,点击确认保存即可
此外,除了柱状图/气泡图外,也可进行可视化网络,点击左侧导航栏中的功能聚类(圈)→GO/KEGG可视化网络,选择分析好的项目BP,输入显示的富集条目,方法选择发散类型/环状类型,点击确认保存即可
同样的方法可进行CC/MF/KEGG的富集分析和可视化
Figure 8:CBXs与免疫细胞浸润的相关性
(1)进入TIMER数据库,导航栏中选择Gene,Gene Symbol输入CBX1,Cancer Types中输入GBM,Immune Infiltrates默认B cell,CD8+ T cell,CD4+ T cell,macrophage,neutrophil ,dendritic cell ,点击Submit,即可得到文中Figure 8A
(2)重复上述方法,更换CBX家族的其它基因,可分别获取其它基因与免疫细胞浸润的相关性散点图
文章到这里就结束了,这里最后再给大家小结一下
整个文章所涉及基因是一个基因家族,所涉及的分析方法包括差异表达(多个数据库、mRNA/蛋白层面共同分析佐证,增加了可信度)、预后分析、临床相关性分析、基因突变分析、生物功能富集分析、免疫浸润分析
这里大家思路再拓展一下,家族基因可不可以换成其它基因集?比如一个信号通路、一个复合物、一个表型等等,同时再升级一下可不可以做成基因集泛癌分析
当然,分析的方法内容也可以再细化或者加减,比如差异表达里面也可以继续亚型分析,预后分析中可以添加预后模型,网络构建方面也可以添加相关调控网络,多个数据库、多种方法算法共同佐证一个结果等等,看到这里,屏幕前的你如果心动了,那就赶紧行动起来吧,说不定下个5+就是你的了~
转自:仙桃学术
如有侵权,请联系本站删除!