搜索
查看: 6044|回复: 2

现在下载TCGA数据也是非常方便,接着是cgdsR和cbioportal

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-2-7 15:42:29 | 显示全部楼层 |阅读模式
网页版工具无法就是多摸索人家网页上面的各种选择框框罢了!
cbioportal地址是:http://www.cbioportal.org/
他们给网站做了一个R包的API,这样就不需要去他们的网站上面选这选那的了!叫做cgdsR,我写过教程: http://www.bio-info-trainee.com/1257.html

那时候对这个网站懂的不多,其实现在看来,他就是整合了历年来发表过的TCGA大文章的数据而已:

而cbioportal网站提供的一个R接口,非常好用,只需记住4个函数即可!!!
只需熟记getCancerStudies,getCaseLists,getGeneticProfiles,getProfileData需要什么参数以及它们返回了什么对象即可!
总共有一百多篇文章,就是cbioportal网站上面可以选择的!
每篇文章有十几二十几个样本列表,就是把文章的总样本根据各种情况分的小类别!
每篇文章有十几个数据类型可以下载,必须就是mRNA,mRNA-seq,miRNA,miRNA-seq,还有拷贝数,突变情况,甲基化数据咯。
如果要下载数据,需要指定基因,然后指定一个样本列表,还有指定数据类型!
BRCA1 <- getProfileData(mycgds, "BRCA1", my_dataset, my_table)   
比如,我下载BRCA1基因在my_dataset这个数据集(mRNAseq表达量)的my_table这些样本的数据!


安装包很简单了哦,如果有依赖关系,你就先把依赖包安装好即可!
[AppleScript] 纯文本查看 复制代码
install.packages('R.methodsS3')
install.packages('R.oo')
install.packages("cgdsr",repos="http://cran.us.r-project.org")
library(cgdsr)
mycgds <- CGDS("http://www.cbioportal.org/public-portal/")
test(mycgds)
# Get list of cancer studies at server
## 获取有哪些数据集
all_TCGA_studies <- getCancerStudies(mycgds)

paper <- "brca_tcga_pub2015"   ##这篇文章里面的数据

## 获取这篇文章中有哪些样本列表,

all_tables <- getCaseLists(mycgds, paper)

dim(all_tables)

## 我们需要验证一下下载的mRNA表达量数据,所以我们选择下面这个样本列表

my_table <- "brca_tcga_pub2015_rna_seq_v2_mrna"

## 而后获取有哪些数据可以下载

all_dataset <- getGeneticProfiles(mycgds, paper)

my_dataset <- 'brca_tcga_pub2015_rna_seq_v2_mrna'  ##然后我们选择下载mRNA数据

BRCA1 <- getProfileData(mycgds, "BRCA1", my_dataset, my_table)  ## 根据my_table这个样本列表来下载my_dataset这种数据

this_clilical <- getClinicalData(mycgds, my_table) ##临床数据下载 



你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

1

主题

8

帖子

402

积分

中级会员

Rank: 3Rank: 3

积分
402
发表于 2017-6-27 11:11:16 | 显示全部楼层
https://github.com/cBioPortal

现在GitHub上面全部可以下载,也非常方便的
回复 支持 反对

使用道具 举报

4

主题

48

帖子

778

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
778
发表于 2017-7-19 23:02:30 | 显示全部楼层
BRCA1 <- getProfileData(mycgds, "BRCA1", my_dataset, my_table)  ## 根据my_table这个样本列表来下载my_dataset这种数据   这行代码只下载brca1的中表达情况,如果要下在全部的基因的表达情况,难道要自己制作全部全部gene symbol 的list放入,然后下载的才是全部?在cdgsr文档中没有看到这样的参数。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-22 08:33 , Processed in 0.032743 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.