搜索
查看: 403|回复: 0

[mRNA-seq] 转录组入门(1~4)数据下载与QC

[复制链接]

4

主题

11

帖子

131

积分

注册会员

Rank: 2

积分
131
发表于 2019-11-13 23:13:47 | 显示全部楼层 |阅读模式
1、计算机资源的准备2、下载数据
NCBI上SRA Run Selector检索BioProject号
选择你需要的SRA,循环语句,axel下载
for i in {56..62}doaxel ftp://ftp-trace.ncbi.nlm.nih.gov ... /SRP075747/SRR35899${i}/SRR35899${i}.sra done
选择你需要的SRA,下载Accession list,循环语句下载。
mkdir 191113testcd 191113testperl -lne '$id=substr($_,0,6);print "axel ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/$id/$_/$_.sra"' SRR_Acc_List.txt >sra_down.shbash sra_down.sh
3、把测序sra文件转换为fastq文件
fastq-dump --gzip --split-3 -O path -A accession fastq-dump [各种参数] <输入文件的登录号或者路径>
看一下事故现场,避开一些坑 做过1000遍RNA-seq的老司机告诉你如何翻车
关于输出: -O 指定输出路径 --gzip 指定输出格式为gzip压缩格式(fastqc软件可以直接识别gzip压缩的文件) --bzip2 指定输出格式为bzip2压缩格式 *多个文件参数 --split-3 如果是双端测序数据,则输出两个文件,如果不是则只输出一个文件
#cd到fastq文件夹for i in `seq 56 62`do fastq-dump --gzip --split-3 -O ./fastq/ -A SRR35899${i}.sra #根据测序文件名称修改“SRR35899${i}.sra”donels #查看结果
注意⚠️fastq-dump命令不显示进度条,需要等待很长一段时间



上一篇:精心整理(含图版)|你要的全拿走!(R数据分析,可视化...
下一篇:转录组入门(5~9)比对计数
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-12-6 07:17 , Processed in 0.020466 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.