空间转录组定量分析及应用—基因调控网络
2022/8/10 8:45:25 阅读:293 发布者:
生物是一个有机整体,我们想要研究组织中的基因表达量多少,除了通过定量分析研究差异表达基因分析,还可以使用基因网络根据表达量变化或者已有的互作关系构建基因调控网络。因为基因网络研究的第一个优势就是系统性,它将个别的基因表达量变化转化为一个整体,能揭示某些微量变化的因素,更符合生物体的整体特性;第二个优势是探索性,WGCNA和SCENIC能挖掘潜在的调控关系,能发现微量的驱动因素或者下游效应。基于此,下面我分别介绍应用于空间转录组分析的3种基因网络分析方法。
一STRING互作网络分析
STRING数据库是一个检索已知蛋白和预测蛋白之间相互作用的数据库。为了研究区域特征基因或者与生物问题相关的关键基因的互作网络,我们可以从string数据库中提取基因集的互作关系,构建基因/蛋白互作网络图,从而研究空间细胞亚群中发挥调控网络作用的基因功能。
例如,2021年12月,孙洋等人在EMBO Mol Med上发表的研究银屑病干预新靶点的文章使用了单细胞转录组和空间转录组测序分析发现[1],巨噬细胞中PTPN11(SHP2编码基因)与NF-κB通路相关基因存在正相关关系,具体分析如下:对髓系细胞进行再分群研究,然后利用髓系细胞中上调的基因进行富集分析发现NF-κB通路等显著富集,再接着对不同处理的髓系细胞进行差异表达基因分析,最后将差异表达基因集在string数据库中构建蛋白关联网络,从而确定了10个hub基因,同时发现这些基因只在特异亚群中表达,可能说明这些基因以细胞类型特异性的方式发挥主调控因子的作用。
二共表达基因网络分析(WGCNA)
加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)是用于研究不同区域或亚群之间基因关联模式的系统生物学方法,通常由于单细胞数据的稀疏性来过滤基因和细胞,然后计算两两基因间的相关性,并且对相关性系数取β幂次来强化强相关系数,从而得到基因间的连通信息,接着绘制两两基因的热图和聚类树,最后根据热图区域和聚类树分支进行模块的划分与合并。因此,使用WGCNA分析可以用来鉴定高度协同变化的基因集,根据基因集的内连性、基因集与空间细胞亚群、基因集与空间区域之间的关联鉴定候选基因或治疗靶点,还可以利用基因连通性信息挑选核心基因,构建基因间的表达调控网络关系,从整体视角研究更全面的生物学问题。除此以外还可以利用空间转录组的位置信息分析高表达的基因集在哪个区域中高表达,或者转录因子在哪个区域发生活跃的转录调控。
例如,2022年6月,Wu等人在Cell and Bioscience上发表的研究人类胚胎肾脏时空基因表达的文章时使用WGCNA分析了肾脏不同区域的生物学功能和高度特异性hub基因[2],首先作者筛选了15个空间转录组细胞亚群的全部上调差异基因进行WGCNA分析得到16种不同的共表达模块,然后进一步根据这些模块的生物学功能和关键基因定义每个模块的生物学功能,研究发现这些模块雨肾脏亚群的相关功能相对应,如离子转运(M8和M12)、内皮细胞发育(M7)和上皮细胞发育(M5和M10)等,接着将模块特征基因(PC1)与肾脏空间区域进行相关性分析,研究发现特定基因模块的生物学功能与区域细胞类型的功能重叠,说明不同空间区域存在功能异质性。同时从相关性分析种发现了M5模块代表了不同皮质区域的NPC和PTA的共同特征,通过M5的GO富集分析发现与肾脏形态发生和输尿管芽形成的调控相关。为了更好地确定M5中各基因的调控机制,作者建立了一个共表达网络,并基于基因连接性分析了hub基因,研究发现这些基因与肾源性生态位发育相关,并且发现细胞周期调控基因CDK1和细胞分化调控转录因子FOXD1,从而提供了关于NPC和PTA细胞发育更全面的调控信息。从ST基因表达映射图发现这些基因只局限于外皮层区域,说明了皮层区域活跃的发育过程。
三空间基因调控网络构建(SCENIC)
单细胞调控网络推理与聚类分析(single-cell regulatory network inference and clustering, SCENIC)是单细胞转录因子的分析方法,输入单细胞基因表达量矩阵后,首先使用基因表达量构建TF与靶基因的调控网络,同时计算每个TF与gene之间的得分,根据得分过滤掉一些得分较低的模块,生成推测的TF-gene共表达网络;然后基于gene-motif数据库对每个模块中所有基因进行motif富集分析,接着使用每个模块中显著富集的motif来确定对应的TF,最终构成了一个包含TF与靶基因的基因调控网络模块,并把该模块称作regulons;最后对每个细胞中所有基因从高到低排序,根据Regulons中的基因在排序中的位置,计算累计曲线面积 (AUC) ,即为Regulons在细胞中的活性。因此,使用SCENIC分析我们可以绘制空间区域、空间细胞亚群的Regulons活性热图来研究区域或细胞亚群的异质性,或者使用TF与靶基因的关系绘制基因调控网络图来研究基因转录调控机制。
例如,2022年5月,汪建等人在cell上发表小鼠器官发育时空转录图谱的文章时为了探索中脑背侧神经细胞发育和胶质细胞发育的分子机制[3],对不同阶段的小鼠胚胎切面的中脑背侧区域进行细胞周期分析发现放射状胶质细胞的增殖能力高于神经母细胞和胶质母细胞,接着使用monocle3进行拟时分析的发育轨迹显示两个分支起源于放射状胶质细胞,一个分支是神经母细胞,另一个是胶质母细胞,分别对起源细胞和分支细胞进行差异分析发现了高度特异性的外源性配体表达,从而揭示了祖细胞的发育潜在机制;接着使用SCENIC分析发育中的中脑背侧区域的转录调控,分析确定了神经母细胞和胶质母细胞谱系相关的假定转录因子,如HES1在胶质细胞中高表达,其靶基因包括已知的特定于胶质细胞谱系的基因Aldh1l1和Nfib,HES6在神经母细胞中高表达,其靶基因包括Ascl1和Hes5。因此,该分析提供了中脑背侧祖细胞的全面空间解析转录图谱。
总结
这3种研究空间转录组定量分析的方法都是以输入表达量矩阵,然后从整体或局部整体的角度构建两两基因之间的连接网络图,从而使得我们研究生物学问题也从整体性和系统性来分析解决方案或揭示转录调控机理。但这3种方法也有一些差异,例如,string互作网络分析是依赖于人们整理的已被实验验证或预测的蛋白互作关系;WGCNA分析是依赖于纯数学的两两基因相关性分析得来的基因调控关系,并且将大量基因在数量较多的区域或亚群划分为不同模块来研究基因表达,从而减少因基因表达在不同亚群变化不一致造成的杂乱;SCENIC分析是依赖于motif-TF数据库和纯数学运算得来的转录因子与靶基因的调控关系,局限于TF-gene调控关系的研究,并且还可以根据TF-gene构建的网络关系来研究细胞的异质性。所以,在进行空间转录组定量分析研究某相关基因表达量时,可根据研究目的不同来选择具体的方法,也可以将这3种方法联合起来进行关键基因挖掘。
转自:基迪奥生物
如有侵权,请联系本站删除!