投稿问答最小化  关闭

万维书刊APP下载

空间转录组差异及富集分析应用思路

2022/7/25 16:33:21  阅读:367 发布者:

空间转录组测序(ST-seq)技术的推出使得高通量组学技术进入空间时代,它可以检测完整组织切片上的基因表达水平,同时定位基因的表达位置。因此,对于ST-seq数据的分析就有两个大分支,一个是基于表达量水平,一个是基于空间位置。其中基于表达量分析中最常见的分析点就是定量分析,它可以研究细胞中基因表达量的多少,比较不同spot中的差异表达基因及其候选的基因集进行功能富集分析,并且表达量的变化还能进一步引出基因调控网络分析,为ST-seq表达量研究提供众多方法。
对于上述的ST-seq数据挖掘的两个分支,本篇主要先为大家介绍定量分析内容及其应用

一、差异基因分析

差异基因分析是转录组数据中最常见也是最基础的分析内容,它的基本原理就是以生物学意义的方式定性基因表达量,然后计算两个比较组的基因表达差异倍数,得到显著性P值,然后通过多重假设检验校正筛选出具有统计学意义的显著差异表达基因,从而为我们挑选目标基因缩小范围。
ST-seq的差异基因分析原理与转录组的差异分析基本一样,但是由于ST-seq检测单位是完整切片上每一个直径比细胞稍大的spot,而普通转录组则是以样本为单位进行检测。所以ST-seq的差异基因分析思路是将每个spot看作一个细胞,参考单细胞转录组(scRNA-seq)的分析思路进行,其分析内容和scRNA-seq的分析内容高度相似。在ST-seq的差异分析思路中,首先利用每个spot的分子特征将相似性较强的spot划分为若干亚群,然后就可以针对亚群进行差异分析。
ST-seq中最常见也是最重要的差异分析维度必然是亚群上调特征基因分析,它是研究亚群特征基因最快的方法,同时还应该借助解剖学进行不同亚群的细胞类型鉴定和异质性研究,因为ST-seq是为了研究组织不同区域之间的空间异质性,与scRNA-seq只比较两组细胞的异质性更高级,并且如果不借助病理学同时研究,也就体现不出ST-seq的技术优势。ST-seq的亚群差异分析还可以研究不同解剖学区域之间的差异,即特定亚群的差异分析,所以,我们在进行ST-seq的亚群差异分析需要尽可能的减少不同切片间的空间异质性对亚群差异分析时的影响,因此不同切片的空间异质性也有很大差异。
ST-seq中研究细胞的空间异质性还可以从不同区域的维度进行差异分析。由于空间异质性不仅存在于同一切片的不同区域之间,也存在于不同实验组的切片之间或者同一实验组的不同生物学重复的切片之间,所以对于不同区域的差异分析需要根据项目的实验设计和研究目的进行分析。例如,有几张癌细胞的切片,我们想要研究癌症区域与癌旁区域或者正常细胞区域的异质性,由于肿瘤细胞是现有研究中异质性最强的组织类型,所以我们在进行差异分析时就要考虑不同切片的空间异质性,通常情况下只能选择在同一张切片的不同区域进行差异分析,用于研究癌症相关的基因。再比如研究目的是正常组织的空间细胞图谱绘制,这时候的切片异质性就不会太强,可以考虑将几个不同组织类型的切片进行差异分析,用于研究空间层面的细胞分化或细胞功能异质性研究。
对于ST-seq的差异分析,由于数据维度较多,所以ST-seq可以从不同样本、不同切片、不同亚群、不同细胞类型、不同区域等维度进行差异分析来研究更多的生物学问题。

二、基因功能富集分析

根据研究目的进行不同维度的差异分析后,通常都会对显著基因集进行功能富集分析,这个思路与bulk RNA-seq一样,分析原理是借助各类数据库和分析工具进行统计分析,挖掘在数据库中与我们研究的生物学问题具有显著相关性的基因功能类别,通俗来说,就是把我们筛选出来的基因归类,看看哪些基因的功能与我的研究相关,然后根据检验P值判断是否显著,想要更准确一点,再对P值进行一次多重检验校正,使用Q值来判断哪些基因的功能与研究目的相关。
常见的富集分析方法是利用超几何分布来检验一组基因中某个功能类的显著性,通过离散分布的显著性分析、富集度分析和假阳性分析,得出与实验目的有显著关联的基因功能类别。
常用的富集分析数据库有GOKEGGReactomeDO等,我们可以将基因集使用不同的数据来分析基因功能,例如GO富集分析可以研究基因集的分析功能、细胞组分、生物学过程;KEGG富集分析可以研究基因集的基因表达通路,进一步了解基因的生物学功能;Reactome富集分析可以研究基因集的信号和代谢分子及其组成生物途径和过程的关系。
除了常见的富集分析分析外,还可以使用GSEAGSVA等方法研究基因集的富集功能。

三、应用思路

1. 亚群上调基因研究区域异质性

空间转录组的亚群上调差异基因分析是最基础也是最常见的分析内容,用于查找各亚群特异上调表达的基因,从而研究不同区域的异质性。
例如20221月发表在Nat Commun上的一篇关于空间转录组研究小鼠肠道愈合的空间细胞图谱文章,作者为了研究粘膜愈合过程中的空间转录图谱差异,取WT小鼠肠道(d0)和损伤后又愈合的肠道(d14)进行空间转录组测序(图2A),使用harmony整合了来自d0d14的数据进行聚类分群,分析注释了17个不同的cluster(图2B),然后对每个cluster进行亚群上调差异基因分析,如图2C所示,显示了每个cluster中最特异的基因,同时每个cluster定义了组织的不同空间区域,其中cluster12指定为肠道神经系统(ENS),在粘膜下层具有分散的表达(图2D),而cluster0在空间上映射到近端结肠(图2D)。

2. 区域组间差异分析揭示不同样本的基因功能

在空间转录组中我们还可以研究同一区域在不同样本的差异基因表达,从而揭示不同样本的基因功能。例如上面的案例中,作者研究了不同区域的异质性后,接着又研究了一些特异区域的功能,因为有一些cluster在组织愈合过程中显示出部分或剧烈的富集,而在WT组织中很少或不存在。为了研究粘膜愈合过程中如何改变结肠的空间细胞图谱,使用非负矩阵分解法(NNMF)将d0d14数据联合反卷积为20factor,差异分析发现8factor在粘膜愈合期间(d14)的特定区域表达,但在第0天中不表达。其中factor5是一个水肿区域,组织学上以炎症为特征,位于严重损伤的上皮层下方,KEGG富集分析显示factor5与解剖结构发育、细胞粘附和细胞外基质(ECM)组织相关。factor14的特征是参与应激反应Duoxa2Aldh1a3)和白细胞浸润(如Ly6ad Cxcl5)的基因表达,这表明了对屏障破坏和组织损伤的急性反应。Factor7在皮肤和结肠上皮之间的不稳定区域,主要特征是参与角化细胞分化和伤口愈合的反应。Factor20在发生增生和隐套树枝化的远端上皮,主要特征是上皮修复。总体而言,DSS诱导的损伤导致小鼠结肠内不同组织病理学过程的各种共有发生,同时揭示了以前未被重视的组织修复的异质性转录和区域空间图谱。

以上是空间转录组差异基因和富集分析的全部内容,后续再分享空间转录组基因网络分析。

转自:基迪奥生物

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com