期刊:Nature Genetics
通讯作者:Clint L. Miller、Chongzhi Zang
单位:弗吉尼亚大学公共卫生基因研究组
发表时间:2022-5-19
简介
冠心病(CAD)是全球范围内导致死亡的主要疾病。CAD发病机制复杂,其中涉及多种细胞类型表型的转化,包括:内皮细胞、平滑肌细胞、免疫细胞等。全基因组关联分析(GWASs)已经确定了超过200个与CAD相关的位点,其中大多数风险变异位点位于非编码DNA序列,且多富集在顺式作用元件中。本研究作者应用转座酶(Transposase,Tn5) 单细胞核染色质可及性分析((snATAC-seq), 在细胞水平探究CAD发病机制。
单细胞ATAC-seq原理及技术简介
人类基因组内的非编码区至少80%是有生物活性的,其中,顺式作用元件(cis-regulatory element, CRE)是目前已知的最重要的功能性非编码区。顺式作用元件包括启动子、增强子、调控序列和可诱导元件等,它们通过与转录因子(transcription factors TFs)结合而调控基因转录的起始和转录效率。发生在顺式作用元件上的基因突变是许多重大疾病的发病机制之一,比如本文研究的冠心病(CAD),阿尔兹海默症,自身免疫病等。
细胞内的DNA进行转录等活动的时候,DNA才会从组蛋白中释放出来,裸露出需要与转录因子结合的位点,便于转录。我们把染色质的这种特性叫做染色质的可及性(chromatin accessibility),而将暴露的这段染色质称为“开放染色质”(open chromatin)。作为转录调控的核心区域,顺式作用元件附近的染色质通常具有较高的可及性。因此,利用单细胞核染色质可及性分析((snATAC-seq),可以鉴定出细胞中潜在的顺式作用元件。
实验流程
选取41例不同疾病阶段的冠心病患者的冠状动脉(44个样本,冰冻组织);分离制备单细胞核文库;鉴定各细胞类型特异的顺势作用元件(CREs)及特异的数量性状基因座(QTLs),确定和CAD相关的关键转录因子。
材料
41例不同疾病进程的冠心病患者的冠状动脉标本(共28316个细胞核)进行snATAC-seq。
主要结果
人冠状动脉单细胞核snATAC-seq图谱
首先展示人冠状动脉单细胞核snATAC-seq图谱,降维聚类确定了14个不同的细胞簇(b),展示了各细胞类型对应的标记基因(maker gene)活跃评分,平滑肌细胞SMC的marker基因:MYOCD, MYH11,CNN1, TAGLN ,ACTA2;内皮细胞:CLDN5;成纤维细胞:TCF21,LUM;巨噬细胞:CSF1R;T&NK细胞:TBX21(c)。热图显示snATAC-seq和scRNA-seq细胞类型之间相关性(d)。各细胞类型在含动脉外膜和不含动脉外膜样本的分布占比。
人冠状动脉内不同细胞类型呈现不同的调控进程
根据snATAC-seq基因评分总共确定了各细胞类型共含有5121个marker 基因和各细胞类型特异的,a热图展示了5121个marker基因在各细胞类型的基因评分热图。b,反映冠状动脉各细胞类型特异的转录调控元件CREs标记峰的热图,共含173357个,结果提示,各转录调控元件具有细胞类型特异性。为探究各细胞类型的转录调控因子,进行HOMER46转录调控因子富集分析,确定各细胞类型特异的转录因子,(c)展示了各细胞类型对应的转录调控因子,SMCs中富集MEF2家族,TEAD家族等,巨噬细胞富集PU.1/SPIB,肥大细胞富集GATA家族,上述转录因子富集结果和既往报道相吻合。另外本文发现一些既往较少关注的转录因子元件,如SIX1/2在成纤维细胞中富集,免疫细胞中富集PRDM1等。另外作者还用chromVAR61观察每个细胞特异的染色质富集区(e). 值得关注的是TCF1在成纤维细胞和平滑肌细胞SMC中特异高富集,和之前报道的驱动SMC表观调控的结果相一致。最后,作者进行细胞型连锁不平衡(LD)评分回归(LDSC)探究了各细胞类型特异的染色质可及区和冠心病GWAS的结果或冠心病血管相关因素是否存在相关性,结果提示,冠心病GWAS结果及血压和平滑肌细胞、内皮细胞、巨噬细胞的转录调控元件CREs标记峰相关。这说明平滑肌细胞SMCs在冠状动脉病变早期中起着重要作用。
以上结果表明,冠状动脉snATAC-seq染色质谱揭示了各细胞类型在不同健康状态、疾病的不同阶段中特异性调控机制。
SMCs亚群染色质可及区分析
鉴于上述结果提示SMCs在CAD疾病进程中起重要作用,作者接下来对SMCs进行亚群细分,研究SMCs各亚群基因调控元件。首先是SMCs可分为4个亚群(a),和各亚群SMCs 标记基因打分。作者选取了SMCs标记基因MYH1,CNN1,成纤维肌细胞(fibromyocyte)的标记基因TNFRSF11B,FN1,发现MYH1,CNN1在SMCs第5和第6群基因打分高,而TNFRSF11B,FN1在第4和第7群基因打分高(b)。探究转录因子CArGbox,ATF3,TCF21和TEAD4在SMCs各亚群的富集情况。接着作者探究了SMCs各亚群分化轨迹和分化过程中伴随的各元件变化。作者对比了纤维肌细胞(fibromyocyte)与SMCs差异的启动子(promoter peaks)。对成纤维肌细胞(fibromyocyte)上调和下调峰(downregulated peaks)进行功能注释。
snATAC-seq结果和GWAS联合分析
作者将snATAC-seq的结果和CAD全基因组关联分析位点(冠心病CAD相关的SNPs)相结合,确定CAD疾病可能的靶基因(a-b),发现CAD中各细胞类型存在其特异基因座,内皮细胞中NOS3,JCAD,SMCs中的CDK13,周细胞9号染色体9p21位点(CDKN2B-AS1/ANRIL)(c-d)。
冠状动脉细胞类型中调节染色质可及性的遗传变异的鉴定
作者对CAD疾病进程起重要作用的4种细胞类型(SMCs (d),巨噬细胞 (e),成纤维细胞和内皮细胞)进行caQTL映射 (Chromatin accessibility quantitative trait locus (caQTL))mapping) (a-)结合冠状动脉组织ATAC测序(bulkATAC-seq)ChIP–seq,辅助机器学习,鉴定了127个和CAD高相关或中度相关的位点(f-h),如巨噬细胞中和CAD相关的疾病候选位点FCHO1,rs10418535。
PRDM16和TBX2是CAD关键的转录因子
Peak2基因分析提示TBX2的表达和CAD强相关(a),另外SMCs中peak5上ACTRT2(PRDM16不同的转录本divergent transcript)上述区域包含PRDM16的9号外显子区域,提示非编码区和编码区均可影响PRDM16的表达。另外,上述结果和activity-by-contact enhancer-gene mapping of CAD SNPs相一致,均提示PRDM16和TBX2可作为CAD的目标基因,而且PRDM16和TBX2均是snATAC中MSC的标记基因。PRDM16是SMC中LMOD1上游的基因,作者探究了SMC中LMOD1的RNA打分(b). 为深入了解这两个PRDM16和TBX2基因,作者查看了斯德哥尔摩-塔尔图动脉粥样硬化反向网络工程任务基因心脏代谢组织的调节网络(Stockholm-TartuAtherosclerosis Reverse Network Engineering Task (STARNET) gene regulatory networks),提示PRDM16和TBX2是重要的关键驱动因素。在CAD进程中,prdm16调节模块为动脉粥样硬化及代谢特征,均提示和CAD疾病严重程度相关(c)。最后作者在正常动脉和CAD病变血管的PRDM16,发现PRDM16在正常动脉和CAD病变血管表达和位置存在差异。
编者总结
本研究中,作者主要通过单细胞核染色质可及性分析(snATAC-seq),对41例不同疾病进程的CAD患者的冠状动脉snATAC-seq,质控后,共有28316个核进行后续分析,首先展示了CAD snATAC-seq 图谱,共14个不同的细胞簇。比对了各细胞中共320,000个可接近位点,确定了细胞类型特异性元件和转录因子,对功能性CAD风险变异进行了优先排序。确定了平滑肌细胞过渡状态(如纤维肌细胞)中的元件和功能变异。研究进一步确定了CAD关键的驱动转录因子,PRDM16和TBX2。总之,CAD单核图谱为揭示冠心病风险疾病进程的调控机制提供了重要的信息。
原文链接:https://pubmed.ncbi.nlm.nih.gov/35590109/
转自: 学术查
如有侵权,请联系本站删除!