搜索
查看: 2923|回复: 0

[other] 转录组入门(2-3)下载数据及质量控制

[复制链接]

4

主题

11

帖子

131

积分

注册会员

Rank: 2

积分
131
发表于 2017-7-23 19:10:06 | 显示全部楼层 |阅读模式
本帖最后由 一只聋了的青蛙 于 2017-7-23 19:11 编辑

系统:Mac OS Sierra 10.12.5
Data availability.
The RIP-seq an RNA-seq data have been deposited in the GeneExpression Omnibus database, with accession code GSE81916. All other data isavailable from the author upon reasonable request.
操作中遇到的问题及解决办法:
通过ftp的方式下载数据一直下载不下来,panda姐说axel快一些,试了一下,是很快!

1.安装axel
brew install axel  
2、循环语句,axel下载
参考了论坛大神的下载命令,下载sra数据命令:
for i in {56..62}
do
axel ftp://ftp-trace.ncbi.nih.gov/sra ... /SRP075747/SRR35899$i/SRR35899$i.sra
done
3.fastq-dump,转换sra文件
fastq-dump --gzip --split-3 -O path -A accession
4.fastqc检测测序文件质量
论坛里的方法在我电脑里面有点问题,作为一个没有计算机基础的我,也不知道是哪里有问题,就去生信菜鸟团找了有关fastq的帖子,然后自己改了循环语句:
(1)首先Mac终端cd到fastq文件夹
(2)模仿jimmy哥批处理语句
for file in ./*
do
fastqc in ${file}
done
(3)得到质控的结果,解读结果





另外还有个小问题:虽然最后运行成果了,也得到了fastqc的报告,但是运行中有出现报错,请大家帮忙看一下这个如何改进一下?谢谢各位!
Skipping 'in' which didn't exist, or couldn't be read


Snip20170723_6.png




参考文献:
1.greenhillman. 转录组入门2-如何从NCBI下载高通量数据. http://fbb84b26.wiz03.com/share/s/3XK4IC0cm4CL22pU-r1HPcQQ2FSGeS3LE4tM2rg0A-1qRcP-
2.greenhillman. 转录组入门3-测序数据质量检查. http://fbb84b26.wiz03.com/share/s/3XK4IC0cm4CL22pU-r1HPcQQ2irG2836uQYm2iZAyh1Zwf3_
3.jimmy. fastqc对原始测序reads质控. http://www.bio-info-trainee.com/95.html










上一篇:一页面放多张图
下一篇:(2)转录组之数据获取
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-2-20 02:19 , Processed in 0.023643 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.