搜索
查看: 2177|回复: 0

分析TCGA的breast cancer的LNC-RAN聚类--需要下载TCGA原始数据的...

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-3-5 11:03:02 | 显示全部楼层 |阅读模式
-需要下载TCGA原始数据的权限!!!
文章是:http://journals.plos.org/plosone ... ournal.pone.0163238
题目有点长:Consensus Analysis of Whole Transcriptome Profiles from Two Breast Cancer Patient Cohorts Reveals Long Non-Coding RNAs Associated with Intrinsic Subtype and the Tumour Microenvironment

其实他们下载了3个公共计划的fastq数据:
Utah Breast Cancer Study (UBCS).
The Cancer Genome Atlas (TCGA).
Cancer Cell Line Encyclopaedia (CCLE).
其中UBCS产生了: The resulting gene-by-sample matrix consisted 19567 protein-coding genes and 6062 lncRNAs across 53 non-basal and 10 basal-like samples.
TCGA产生了The resulting matrix consisted of 19567 PC genes and 6062 lncRNAs across 271 non-basal and 68 basal-like samples.
CCLE产生了 Therefore, the resulting gene-by-sample matrix consisted of 5284 lncRNAs across 41 cell lines.

值得大家留意;

一般人是没办法下载这么多原始数据的,也没必要。
他们选取的是encode注释系统,这个比较标准。
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-22 00:16 , Processed in 0.028038 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.