Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SCP—为单细胞分析设计的端到端解决方案 #3880

Closed
ixxmu opened this issue Sep 22, 2023 · 1 comment
Closed

SCP—为单细胞分析设计的端到端解决方案 #3880

ixxmu opened this issue Sep 22, 2023 · 1 comment

Comments

@ixxmu
Copy link
Owner

ixxmu commented Sep 22, 2023

https://mp.weixin.qq.com/s/ELK7DhcInqQzxqyJc9kt6A

@ixxmu
Copy link
Owner Author

ixxmu commented Sep 22, 2023

SCP—为单细胞分析设计的端到端解决方案 by 单细胞天地


分享是一种态度

书接上文【端到端的单细胞管道SCP-安装】,可能很多读者不清楚SCP可以做什么?这里给大家补一个序言。

单细胞时代刷新了微观世界下观察的分辨率,也让科学研究更接近于真相。

尽管如此,单细胞也更暴露出了比以往bulk测序研究更多的问题。

技术层面上的问题例如基因究竟在一个细胞中表达与否、数据集之间的批次效应如何消除,等等;生物层面上的问题例如如何定义一个细胞类型或状态、细胞从哪来到哪去、基因或细胞之间是如何协同的,等等。

然而一旦模糊的界限被打破,就已无法回避。

生信的开发领域中已经诞生了大量优秀的算法、软件,来解决上述的各类问题。但如同机器学习领域一样,许多算法存在有限的泛化能力,导致在生信的应用领域中,会在错误的时刻发生错误的调用及解读。

作为生信应用研究人员,此时想回答生物学层面的问题就需要同时回答技术层面的问题,这种”既要又要”无疑在迫使生信分析人员转变角色,成为真正的左手技术、右手生物的生信科学家。

这里的”技术”强调下,它并不指代编程能力,也不指代算法开发上的能力,而是指一种在”生物信息”角度上对科学的辩证思维:时刻围绕着中心法则构建和完善生物世界观,并对所有生物数据是如何产生的、如何反应生物本身等进行不断的质疑与推断,学习理解常用算法背后的原理及其缺陷,避免让自己陷入黑盒。

最终,结合产生数据的技术背景和生物学背景,借助各类工具全方位、多角度的探索数据,才可以在分析中有效推断出微观世界所发生着的各类事件,才可以对上述问题做出更自信的回答。


SCP (Single-Cell Pipeline)

SCP是一个端到端单细胞数据分析管道,可实现数据从下机后的处理、分析、共享和发表的全部工作。管道意味着极简、标准化、模块化,SCP的特点是简洁全面高效,让单细胞的科学研究更专注于科学本身。

SCP中的所有方法根据分析类型主要分为三个模块,包括了数据预处理模块下游分析模块可视化模块。借助reticulate[1],SCP也在内部创建了一个python环境环境来整合python相关的工具和方法,让其在R/Rstudio中即可完成调用和结果解析。

SCP中的所有方法均围绕Seurat对象(SeuratV4)开发,虽然如此,利用转换函数adata_to_srt()我们依然可以在任意时候从python中的经典的AnnData[2]对象出发(.h5ad)。


SCP各模块内容

前处理:

  • 4种doublets鉴定方法(scDblFinder, scds, Scrublet, DoubletDetection)
  • 多种指标下的综合质控(doublets, outlier, umi, gene, mito, ribo,ribo_mito_ratio, species)
  • 标准的单细胞处理流程(Normalization, Feature selection, Dimensionreduction, Clustering)
  • 11种批次矫正的单细胞整合处理流程(Seurat, scVI, MNN, fastMNN, Harmony,Scanorama, BBKNN, CSS, LIGER, Conos, Combat)
  • 5种线性降维和8种非线性降维方法

下游分析:

  • 20多种基因注释数据库、多物种、多基因ID类型的自动构建方法
  • 4种差异基因鉴定流程(All, Paired, Conserved, Distrubed)
  • ORA和GSEA两种富集分析方法
  • 3种特征打分方法(Seurat, Ucell, AUcell)
  • 5种细胞映射方法(KNNMap, PCAMap, SeuratMap, CSSMap,SymphonyMap)和3种细胞自动注释方法(KNNpredict, scmap, SingleR)
  • 7种细胞轨迹推断方法(Slingshot, PAGA, scVelo, Palantir, Monocle2,Monocle3, WOT)和基于pseudotime的动态特征鉴定方法

可视化:

  • 200多种离散型和连续型调色板
  • 两种常用的绘图主题,分别用于分析和发表
  • 图片的后期调整和格栅化方法
  • 20多种绘图函数,可绘制上百种图像类型
  • 快速构建交互式的单细胞数据查询网页SCExplorer

更多细节将在后面的教程中说明,敬请期待。

文中链接

[1]

reticulate: https://github.com/rstudio/reticulate/

[2]

AnnData: https://github.com/scverse/anndata

往期回顾

当 Transformer 遇见单细胞转录组——TOSICA

单细胞分析揭示了葡萄膜黑色素瘤新的进化复杂性

把单细胞技术应用到药物研发需要会这么多高级分析技巧吗?

端到端的单细胞管道SCP-安装

单细胞测序最好的教程(十):万能的Transformer与细胞注释






如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程



看完记得顺手点个“在看”哦!


生物 | 单细胞 | 转录组丨资料
每天都精彩

长按扫码可关注

@ixxmu ixxmu changed the title archive_request SCP—为单细胞分析设计的端到端解决方案 Sep 22, 2023
@ixxmu ixxmu closed this as completed Sep 22, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant