你的位置:鼎点注册 > 关于鼎点注册 >
SoupX:单细胞转录组分析去除环境污染RNA
发布日期:2024-10-14 12:20    点击次数:100

1、《KS科研分享与服务》公众号有QQ交流群,进入门槛是20元(完全是为了防止白嫖党,请理解),请考虑清楚。群里有免费推文的注释代码和示例数据(终身拥有),没有付费内容,群成员福利是购买单个付费内容半价!

2、《KS科研分享与服务》微信VIP群只针对购买打包代码的小伙伴(公众号所有付费内容合集)!微信群不是单独的,是对于打包的人答疑解惑和交流的平台、群成员专享视频教程,帖子提前发布,以及其他更多福利!

点击:→ 加入微信vip群:2024-2025《KS科研分享与服务》付费内容打包集合

3、需进QQ群或者打包代码入微信VIP的小伙伴请添加作者微信了解,请备注目的,除此之外请勿添加,谢谢!

详情请联系作者:

前面我们介绍了decontX去除环境污染RNA的方法(decontX:单细胞转录组分析去除环境污染RNA),常用的其实还有SoupX,方法并没有优劣,感兴趣的可以做个对比。不过在方法的操作上,decontX相比于SoupX那是相当简单了。SoupX的分析可基本分为三步骤:1-Calculate the profile of the soup. 2-Estimate the cell specific contamination fraction. 3-Infer a corrected expression matrix。SoupX建议是cluster后的数据,或者注释好的,这样会得到较好得结果。同样的,soupX矫正后的矩阵也是小数,如果需要用它进行下游分析,建议取整数。

github链接:https://github.com/constantAmateur/SoupX

原文链接:https://www.biorxiv.org/content/10.1101/303727v1

接下来我们看看具体的操作:首先安装软件

install.packages('SoupX')library(SoupX)library(Seurat)

然后就是获取input文件,单细胞count矩阵即可:第一个是raw count(没有经过过滤或者原始的),第二个是过滤后的矩阵(经历过质控)。

toc = GetAssayData(object = scRNA_ha, slot = "counts")dirs = list.files('./',pattern='[scRNA]$')seurat_object = lapply(dirs,function(dirs){ CreateSeuratObject(counts = Read10X(dirs), project = dirs)})Merge_obj <- merge(seurat_object[[1]], y = c(seurat_object[[2]],seurat_object[[3]]), add.cell.ids =c("AA","HC","SD")) #合并一个组的数据tod = GetAssayData(object = Merge_obj, slot = "counts")dim(tod) #[1] 33538 27304dim(toc) #[1] 23046 19074tod <- tod[rownames(toc),]

估计soup表达谱,矫正矩阵:

#估计soup表达谱sc = SoupChannel(tod, toc, calcSoupProfile = FALSE)soupProf = data.frame(row.names = rownames(toc), est = rowSums(toc)/sum(toc), counts = rowSums(toc))sc = setSoupProfile(sc, soupProf)#add celltype clusterssc = setClusters(sc, setNames(scRNA_ha$celltype, rownames(scRNA_ha@meta.data)))#Estimating the contamination fraction估计污染分数sc = setContaminationFraction(sc, 0.2)#设置污染分数20%sc = autoEstCont(sc)#Correcting expression profile,roundToInt=TRUE表示矩阵取整out = adjustCounts(sc, roundToInt=TRUE)# seurat_obj[["RNA"]]@counts <- out

好了,这就是soupX的所有内容了,也很简单其实。至于后续,那就是使用矫正的矩阵重新进行降维聚类了。不过还是那句话,这些都是可选的,一定不要生搬硬套在自己的数据上,结合实际情况。觉得分享有用的,点个赞再走呗!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。

栏目分类
相关资讯