2022/4/6 10:03:39 阅读:156 发布者:chichi77
scCancer包是一个专门用于分析肿瘤单细胞转录组的工具包,集成了单细胞数据分析的基本流程,内容高度封装,两行代码,就能进行一系列分析。
背景介绍
在单细胞测序日渐火热的今天,相信很多小伙伴也想进行相关的研究分析吧,今天小编给大家带来的R包scCancer,封装了基本的 scRNA-seq 分析的流程,针对癌症的高度异质性和复杂微环境整合了一组适用于肿瘤数据的计算和分析方法,包括肿瘤微环境分析、恶性细胞评估、细胞周期评估、干细胞特征评估、基因集信息得分评估、表达程序识别、细胞间相互作用分析等。接下来小编就来给大家分享一下具体的使用!
R包安装
library(devtools)
##安装的时候可能提示一些附加的包要单独安装(比如harmony、NNLM等)
install_github("wguo-research/scCancer")
可视化分析
01
输入数据
在这里,我们用作者提供实例数据作为例子,下载链接为:http://lifeome.net/software/sccancer/KC-example.tar.gz
scCancer 主要是为 10X Genomics 平台设计的,数据文件夹主要包含软件 Cell Ranger 生成的结果,如下:
02
R包的使用
R包是高度封装的,仅需要几行代码即可跑完全套流程
scStatistics 主要实现对表达矩阵的质量控制,并返回一些建议的阈值来过滤细胞和基因。
library(scCancer)
dataPath <- "./data/KC-example" # 数据路径
savePath <- "./results/KC-example" # 保存路径
sampleName <- "KC-example" # 样本名
authorName <- "****" # 作者名
# 直接用runScStatistics函数
stat.results <- runScStatistics(
dataPath = dataPath,
savePath = savePath,
sampleName = sampleName,
authorName = authorName
)
#大概有几分钟等待时间出结果
scAnnotation使用 QC 阈值,首先过滤细胞和基因,然后执行归一化、对数转换、高度可变基因识别、不需要的方差消除、缩放、居中、降维、聚类和差异表达分析等操作。 此外,scAnnotation 还执行一些癌症特异性分析。
library(scCancer)
dataPath <- "./data/KC-example" # 数据路径
statPath <- "./results/KC-example" # scStatistics结果路径
savePath <- "./results/KC-example" # 储存路径
sampleName <- "KC-example" # 样本名
authorName <- "*****" # 作者名
# Run scAnnotation
anno.results <- runScAnnotation(
dataPath = dataPath,
statPath = statPath,
savePath = savePath,
authorName = authorName,
sampleName = sampleName,
geneSet.method = "average" # or "GSVA"
)
scCombination主要基于单样本的scAnnotation结果进行多样本数据整合、批效应校正和分析可视化。
library(scCancer)
single.savePaths <- c("./results/KC1", "./results/KC2", "./results/KC3")
sampleNames <- c("KC1", "KC2", "KC3") # 所有样本标签
savePath <- "./results/KC123-comb" # 结果路径
combName <- "KC123-comb" # 组合样本标签
authorName <- "G-Lab@THU" #
comb.method <- "NormalMNN" # 整合数据的方式,可选 ("NormalMNN", "SeuratMNN", "Harmony", "Raw", "Regression", "LIGER")
# Run scCombination
comb.results <- runScCombination(
single.savePaths = single.savePaths,
sampleNames = sampleNames,
savePath = savePath,
combName = combName,
authorName = authorName,
comb.method = comb.method
)
以上三种就是scCancer包的主要功能,每个结果都包含一个html文件和一些结果文本文件。
03
结果的解读-scStatistics
cell calling:过滤掉UMI过低的细胞
根据 nUMI(UMI 总数)和 nGene(检测到的基因总数)过滤具有低质量细胞的液滴
去除高线粒体/核糖体基因表达比例和高解离相关基因表达的细胞
高表达基因
计算得到的过滤细胞的指标
04
结果的解读-scAnnotation
首先读取质控后的数据
基于 R 包 Seurat V3 进行预处理:标准化、归一化、高变基因。
一些细胞类型标记的标准化表达着色的散点图
细胞聚类(TSNE、UMAP)
类之间的差异基因热图
肿瘤微环境细胞类型注释
细胞恶性肿瘤估计
特定基因集表达活性,基因集来自MSigDB的默认50个标志性基因集。
细胞间相互作用分析
小编总结
scCancer包对于单细胞转录组的分析高度封装,整合了很多种现有的单细胞数据分析的工具,我们可以通过参数选择使用不同的方法,最后返回的结果包括直观的html文件和结果的具体文本文档,十分清晰!
如有侵权,请联系本站删除!