搜索
查看: 2601|回复: 0

[other] 转录组入门(2-3)下载数据及质量控制

[复制链接]

2

主题

9

帖子

105

积分

注册会员

Rank: 2

积分
105
发表于 2017-7-23 19:10:06 | 显示全部楼层 |阅读模式
本帖最后由 一只聋了的青蛙 于 2017-7-23 19:11 编辑

系统:Mac OS Sierra 10.12.5
Data availability.
The RIP-seq an RNA-seq data have been deposited in the GeneExpression Omnibus database, with accession code GSE81916. All other data isavailable from the author upon reasonable request.
操作中遇到的问题及解决办法:
通过ftp的方式下载数据一直下载不下来,panda姐说axel快一些,试了一下,是很快!

1.安装axel
brew install axel  
2、循环语句,axel下载
参考了论坛大神的下载命令,下载sra数据命令:
for i in {56..62}
do
axel ftp://ftp-trace.ncbi.nih.gov/sra ... /SRP075747/SRR35899$i/SRR35899$i.sra
done
3.fastq-dump,转换sra文件
fastq-dump --gzip --split-3 -O path -A accession
4.fastqc检测测序文件质量
论坛里的方法在我电脑里面有点问题,作为一个没有计算机基础的我,也不知道是哪里有问题,就去生信菜鸟团找了有关fastq的帖子,然后自己改了循环语句:
(1)首先Mac终端cd到fastq文件夹
(2)模仿jimmy哥批处理语句
for file in ./*
do
fastqc in ${file}
done
(3)得到质控的结果,解读结果





另外还有个小问题:虽然最后运行成果了,也得到了fastqc的报告,但是运行中有出现报错,请大家帮忙看一下这个如何改进一下?谢谢各位!
Skipping 'in' which didn't exist, or couldn't be read







参考文献:
1.greenhillman. 转录组入门2-如何从NCBI下载高通量数据. http://fbb84b26.wiz03.com/share/s/3XK4IC0cm4CL22pU-r1HPcQQ2FSGeS3LE4tM2rg0A-1qRcP-
2.greenhillman. 转录组入门3-测序数据质量检查. http://fbb84b26.wiz03.com/share/s/3XK4IC0cm4CL22pU-r1HPcQQ2irG2836uQYm2iZAyh1Zwf3_
3.jimmy. fastqc对原始测序reads质控. http://www.bio-info-trainee.com/95.html







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:一页面放多张图
下一篇:(2)转录组之数据获取
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-14 22:12 , Processed in 0.038446 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.