搜索
查看: 5040|回复: 6

单细胞测序聚类发现新类型细胞

[复制链接]

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
发表于 2017-4-13 09:54:40 | 显示全部楼层 |阅读模式
本帖最后由 ydchen 于 2017-4-13 09:58 编辑

原文见:http://www.nature.com/nmeth/jour ... ull/nmeth.4236.html
他们做的数据都是可以下载的:
scRNA-seq data for patient 1 and 2 is available from GEO under accession code GSE79102. Source data files for Figures 1,2,3, and Supplementary Figure 1,2,3,4,5,6,7 and 12 are available online.


而且是一个R包,非常方便下载及使用:


Software availability.
SC3 is available as a R package at http://bioconductor.org/packages/SC3/.

更重要的是,这篇paper里面的画图代码及数据,作者都公布了,简直是我的偶像~~~~



单细胞测序前所未有的揭示了机体水平的复杂程度,为解析机体的功能提供了更深层次的解读,然而单细胞RNA seq的聚类问题,也就是通过将不同的细胞进行聚类,然后发现新的亚类一直是困扰人们的问题,来自 Wellcome Trust Sanger Institute 的研究者们提出了 Single-Cell Consensus Clustering (SC3)的方法,通过非监督聚类实现单细胞聚类分析。通过一种一致的方法SC3实现了更高的准确性和稳定性。在12个公开发表的数据上进行测试,SC3比5种目前存在的方法更优!

不仅如此,SC3提供了新的可视化的界面操作,从而可以更加友好。

流程介绍如下:
( a ) Overview of clustering with SC3 framework (see Methods).
A total of 6 D clusterings are obtained, where D is the total number of dimensions d1, …, dD considered. These clusterings are then combined through a consensus step to increase accuracy and robustness. Here, the consensus step is exemplified using the Treutlein data: the binary matrices (Methods) corresponding to each clustering are averaged, and the resulting matrix is segmented using hierarchical clustering up to the k-th hierarchical level ( k = 5 in this example).

( b ) Published datasets used to set SC3 parameters. N is the number of cells in a dataset; k is the number of clusters originally identified by the authors .

( c ) Testing the distances, nonlinear transformations and d range. Median of ARI over 100 realizations of the SC3 clustering for six gold standard datasets (Biase, Yan, Goolam, Kolodziejczyk, Deng and Pollen, colours as in ( b )). The x-axis shows the number of eigenvectors d (see ( a )) as a percentage of the total number of cells, N. The black vertical lines indicate the interval d = 4-7% of the total number of cells, N. The black vertical lines indicate the interval d = 47% of the total number of cells N, showing high accuracy in the classification.

( d ) Histogram of the d values where ARI>.95 is achieved for the gold standard datasets. The black vertical lines indicate the same as in ( c ).

( e ) 100 realizations of the SC3 clustering of the datasets shown in ( b ). Individual corresponds to clustering without consensus step. Consensus corresponds to the consensus clustering over the parameter set (Methods). The black line corresponds to ARI=0.8. Dots represent individual clustering runs. The dashed black line separates gold and silver standard datasets.


基于SC3方法,科学家们在肿瘤病人样本上成功发现了新的肿瘤亚细胞群体:









上一篇:ggplot2箱线图
下一篇:R语言培训一般做什么内容呢?
回复

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-4-13 10:59:50 | 显示全部楼层
作者为了测试自己的方法,选择了6篇公共数据,以前做过的质量比较高的单细胞转录组数据:
6. Biase, F.H., Cao, X. & Zhong, S. Genome Res. , 1787–1796 (2014).
7. Yan, L. et al. Nat. Struct. Mol. Biol. 0, 1131–1139 (2013).
8. Goolam, M. et al. Cell 65, 61–74 (2016).
9. Deng, Q., Ramsköld, D., Reinius, B. & Sandberg, R. Science 33,
193–196 (2014).
10. Pollen, A.A. et al. Nat. Biotechnol. 3, 1053–1058 (2014).
11. Kolodziejczyk, A.A. et al. Cell Stem Cell 7, 471–485 (2015).  






你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-4-13 11:01:30 | 显示全部楼层
还选择了5个其它的方法作为比较:
tSNE  followed by k-means clustering (t-SNE + k-means; similar to the method used by Grün et al.1), pcaReduce , SNN-Cliq , SINCERA  and SEURAT .

非常值得相关领域朋友学习:

18. van der Maaten, L. & Hinton, G. J. Mach. Learn. Res. 9, 2579–2605 (2008).
19. Zurauskiene, J. & Yau, C. BMC Bioinformatics http://doi.org/10.1186/
s12859-016-0984-y (2016).
20. Xu, C. & Su, Z. Bioinformatics https://doi.org/10.1093/bioinformatics/
btv088 (2015).
21. Guo, M., Wang, H., Potter, S.S., Whitsett, J.A. & Xu, Y. PLoS Comput. Biol.
, e1004575 (2015).
22. Macosko, E.Z. et al. Cell 6, 1202–1214 (2015).

你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

12

主题

26

帖子

592

积分

版主

Rank: 7Rank: 7Rank: 7

积分
592
发表于 2017-4-20 15:24:48 | 显示全部楼层
看了确实很好
回复 支持 反对

使用道具 举报

0

主题

4

帖子

111

积分

注册会员

Rank: 2

积分
111
发表于 2017-10-9 21:35:47 | 显示全部楼层
为什么我在使用SC3进行单细胞分析的过程中发现,设定Ks后,导入同样的数据,为什么两次分群结果不一样啊
回复 支持 反对

使用道具 举报

2

主题

17

帖子

204

积分

中级会员

Rank: 3Rank: 3

积分
204
发表于 2018-3-19 21:25:07 | 显示全部楼层
Jimmy 发表于 2017-4-13 11:01
还选择了5个其它的方法作为比较:
tSNE  followed by k-means clustering (t-SNE + k-means; similar to t ...

Jimmy大神,求以后多发些与单细胞转录组测序方面的帖子
回复 支持 反对

使用道具 举报

0

主题

1

帖子

30

积分

新手上路

Rank: 1

积分
30
发表于 2019-2-28 09:04:09 | 显示全部楼层
你好,你在关于“单细胞测序聚类发现新类型细胞”的帖子中,原文链接好像失效了,你能再发我一下吗?十分感谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-3-25 00:13 , Processed in 0.045383 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.