投稿问答最小化  关闭

万维书刊APP下载

Cell Res | 再取进展!北京大学汤富酬团队开发基于三代测序检测单细胞染色质可及性技术

2022/10/14 17:08:29  阅读:218 发布者:

真核生物中的核小体是染色质的基本结构单位。核小体是有DNA与组蛋白组成,核小体进一步折叠压缩最终形成染色质。高度折叠的染色质结构在复制和转录时需要暴露出DNA序列,这段暴露的区域就是染色质开放区域,这个区域可以供转录因子和其他调控元件结合,所以它与转录调控是密切相关的。人类基因组中可及性染色质区域在调控元件中富集,并在其中发现了许多与人类疾病相关的遗传变异。

在下一代测序 (next-generation sequencing, NGS) 平台上使用测序 (Single-cell assay for transposase-accessible chromatin using sequencing, scATAC-seq) 对转座酶可及性染色质进行单细胞检测是一种成熟的检测单个细胞内染色质开放区域的方法。然而,在scATAC-seq数据中检测大规模结构变异 (structural variations, SVs),包括插入、删除、重复、倒置和易位,和单倍型分期方面仍存在挑战,这些问题可以通过基于第三代测序 (third-generation sequencing, TGS) 平台的单分子长读测序解决。

20221011日,北京大学生物医学前沿创新中心(BIOPIC)汤富酬团队在Cell Research 杂志在线发表题为“scNanoATAC-seq: a long-read single-cell ATAC sequencing method to detect chromatin accessibility and genetic variants simultaneously within an individual cell”的研究论文,为了将长读测序的优势整合到scATAC-seq中,该研究基于TGS平台的scATAC-seq方法,开发了在纳米孔测序平台对可及性染色质进行单细胞检测 (single-cell assay for transposaseaccessible chromatin on Nanopore sequencing platform, scNanoATAC-seq) 技术。

另外,2022105日,北京大学汤富酬及中国医学科学院/北京协和医学院王洁共同通讯在Signal Transduction and Targeted TherapyIF=38)在线发表题为“Single-cell transcriptomic profiling reveals the tumor heterogeneity of small-cell lung cancer”的研究论文,该研究通过单细胞转录组谱揭示了小细胞肺癌的肿瘤异质性。该研究对来自11SCLC患者的原发肿瘤(PTs)和匹配的正常相邻组织(NATs)的约5000个单个细胞进行了高精度单细胞转录组学分析,其中包括1PT和复发肿瘤(RT)患者。比较发现了人类SCLC的免疫抑制景观。SCLC肿瘤中的恶性细胞表现出不同的状态,主要与细胞周期、免疫和缺氧特性有关。该研究数据还揭示了SCLC中关键转录因子(TFs)的瘤内异质性(ITH)以及相关基因的表达模式和功能。SCLC中非神经内分泌(non-NE)肿瘤与炎症基因特征和免疫细胞浸润增加相关,这有助于对免疫检查点抑制剂产生更好的反应。总之,这些发现表明了人类SCLC的显著异质性,以及癌细胞和TME之间在单细胞分辨率上的密集交互,因此,为更好地理解SCLC的生物学以及开发SCLC的新疗法奠定了基础(点击阅读)。

2022712日,北京大学汤富酬团队在Nucleic Acids Research IF=19)在线发表题为“De novo assembly of human genome at single-cell levels ”的研究论文,该研究使用单细胞基因组长读长测序技术(SMOOTH-seq),在 PacBio HiFi Oxford Nanopore TechnologiesONT)平台上对 K562 HG002 细胞进行了测序,并进行了从头基因组组装。该研究首次在单细胞水平上完成了具有高连续性的人类基因组组装(使用 95 个单独的 K562 细胞,NG50 约为 2 Mb),并探索了不同组装器和测序策略对基因组组装的影响。借助 ONT 平台上 30 个基因组覆盖率相对较高(平均覆盖率 ∼41.7%)的二倍体 HG002 细胞的测序数据,NG50 可以达到 1.3 Mb 以上。此外,利用来自 K562 单细胞数据集的组装基因组,可以识别更完整和准确的插入事件集和复杂的结构变异。总之,该研究开启了单细胞基因组从头组装实践的新篇章(点击阅读)。

为了评估scNanoATAC-seq在单个细胞中捕获染色质可及性方面的作用,研究人员在五种人类细胞系以及人类外周血单个核细胞(peripheral blood mononuclear cells, PBMCs) 中测试scNanoATAC-seq方法,发现scNanoATAC-seq的读取长度中位数从4000 bp4900 bp不等。

scNanoATAC-seq识别等位基因特异性染色质可及性的示意图(图源自Cell Research

进一步通过转录起始位点 (transcriptional start site, TSS) 富集、片段数和峰值中读取末端的分量 (fractions of read ends in peaks, FRIP) 来评估数据质量。结果表明,scNanoATAC-seq读取端在TSS周围表现出强烈的富集模式,在CCCTC结合因子 (CCCTC-binding factor, CTCF) 结合位点附近显示出印迹,这与基于NGSscATAC-seq数据相似。在等量细胞数下,scNanoATAC-seq10× scATAC-seq在识别单个细胞内的染色质可及性区域具有相当的性能。但scNanoATAC-seq技术能够检测到更多核小体标记(nucleosome occupancy)。

相比于基于二代测序平台的ATAC-seq技术,基于三代测序平台的scNanoATAC-seq技术可以在同一个细胞系中检测到十倍以上的等位基因特异性的染色质开放区域。scNanoATAC-seq技术可以准确地对染色质可及性信号进行基因型分型。并发现即使峰值内没有杂合子SNPs,也存在等位基因特异峰(allelespecific peaks, ASPs),这在基于NGS平台的短读长scATAC-seq中是不可实现的。

不仅如此,该研究利用scNanoATAC-seq技术还可以检测基因组中的各种结构变异事件(插入,缺失,重复,倒位,易位等)。以人类慢性髓系白血病(CML)细胞系为基准,该研究发现scNanoATAC-seq技术在K562细胞系(至少5个单细胞支持)中分别检测到了7688个插入事件(占基准的64.6%)和6120个缺失事件(占基准的67.7%),准确度分别为93.8% 75.5%

除了经典的BCR-ABL1易位事件,该研究也可以检测到长达89 kb的缺失事件,该缺失事件同时截断了ZRANB1CTBP2两个基因。已知CTBP2可以抑制白血病细胞增殖,这表明scNanoATAC-seq技术检测到了K562细胞系中潜在的导致抑癌功能缺失的结构变异事件。不仅如此,scNanoATAC-seq技术还可以准确检测单个细胞的基因组拷贝数变异,能准确地区分出整倍体细胞和非整倍体细胞。

综上所述,该研究开发的scNanoATAC-seq是一种基于TGS平台的长读单细胞ATAC测序方法,可应用于各种生物领域。它可以同时检测单个细胞内的染色质可及性和遗传变异 (包括SVsSNPsCNVs)

在当前的测序深度下,scNanoATAC-seq库的成本低于2.5美元/细胞。目前,在相同测序深度下,ONT 测序(Oxford Nanopore Technologies)技术的成本仍然高于NGS平台,因此需要在更多的片段来丰富更强的表观遗传信号和更长读长来检测长读长特异性特征之间进行权衡。

原文链接:

https://www.nature.com/articles/s41422-022-00730-x#author-information

转自:iNature”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com