搜索
查看: 2391|回复: 0

[mRNA-seq] 转录组入门分析2_从文章中获取数据

[复制链接]

9

主题

15

帖子

132

积分

注册会员

Rank: 2

积分
132
发表于 2017-8-18 10:18:20 | 显示全部楼层 |阅读模式
本帖最后由 laofuzi 于 2017-8-18 10:21 编辑

1. 找出GEO数据编号
    从文章《AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347.》找出GEO数据库的编号GSE81916


2. 检索GEO数据库
    打开GEO主页(https://www.ncbi.nlm.nih.gov/geo/)将GSE81916放入搜索框检索,可以得到该研究的概览信息。在该页中,找到“Overall design”对应的选项“Samples 1-8 are RNA-immunoprecipitation (RIP)-seq to determine AKAP95 binding to the transcriptome. Samples 9-15 are mRNA-seq to determine effect of AKAP95 knockdown in human 293 cells (9-11) or mouse ES cells (12-15).”可以看到样本9-15选项是RNA-seq数据。点击“more”超级链接,可以看到全部的数据信息。



3. SRA数据库中的检索
    点击上图中的Relations项的子项SRA(SRP075747),可以看到SRA数据库中对应的全部信息。





4. 获取SRA和GEO数据库对应ID的信息
    点击“Send results to Run selector”,可以看到样本的GEO数据库和SRA数据库对应的编号以及样本和Run的信息,选择需要下载的SRA数据(SRR3589956- SRR3589962)点击“RunInfor Table”按钮,下载相关的Run信息,将下载的Run信息另存为Excel文件备用。



    从相关的Excel文件中获取SRR的编号信息。
    SRR3589956
    SRR3589957
    SRR3589958
    SRR3589959
    SRR3589960
    SRR3589961
    SRR3589962



5.获取下载地址
    回到GEO数据库中,在GSE81916记录页中选择ftp下载,获取七个数据的下载地址
ftp://ftp-trace.ncbi.nlm.nih.gov ... 9956/SRR3589956.sra

ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589957/SRR3589957.sra
ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589958/SRR3589958.sra
ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589959/SRR3589959.sra
ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589960/SRR3589960.sra
ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589961/SRR3589961.sra
ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589961/SRR3589961.sra



6.下载数据
启动Ubuntu,创建文件夹并下载数据
[AppleScript] 纯文本查看 复制代码
mkdir /mnt/d/AKAP95/data
wget -P /mnt/d/AKAP95/data/ [url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589956/SRR3589956.sra]ftp://ftp-trace.ncbi.nlm.nih.gov ... 9956/SRR3589956.sra[/url]
wget -P /mnt/d/AKAP95/data/ [url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589957/SRR3589957.sra]ftp://ftp-trace.ncbi.nlm.nih.gov ... 9957/SRR3589957.sra[/url]
wget -P /mnt/d/AKAP95/data/ [url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589958/SRR3589958.sra]ftp://ftp-trace.ncbi.nlm.nih.gov ... 9958/SRR3589958.sra[/url]
wget -P /mnt/d/AKAP95/data/ [url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589959/SRR3589959.sra]ftp://ftp-trace.ncbi.nlm.nih.gov ... 9959/SRR3589959.sra[/url]
wget -P /mnt/d/AKAP95/data/ [url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589960/SRR3589960.sra]ftp://ftp-trace.ncbi.nlm.nih.gov ... 9960/SRR3589960.sra[/url]
wget -P /mnt/d/AKAP95/data/ [url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589961/SRR3589961.sra]ftp://ftp-trace.ncbi.nlm.nih.gov ... 9961/SRR3589961.sra[/url]
wget -P /mnt/d/AKAP95/data/ [url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR3589962/SRR3589962.sra]ftp://ftp-trace.ncbi.nlm.nih.gov ... 9962/SRR3589962.sra[/url]


7.后记
论坛里几位大神还列出其他的软件和方法下载数据,本人尚未深入理解。现在只是想抓住重点,对整个流程有个概貌,然后再逐渐细化和深入理解,掌握技巧。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:R包搬运之ggcyto: Visualize Cytometry data with ggCyto
下一篇:转录组入门分析3_fastq进行质控
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-7-21 15:34 , Processed in 0.038191 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.