搜索
查看: 1834|回复: 0

[mRNA-seq] 转录组作业(三)了解fastq格式

[复制链接]

11

主题

22

帖子

330

积分

中级会员

Rank: 3Rank: 3

积分
330
发表于 2017-10-21 19:51:51 | 显示全部楼层 |阅读模式
  • sratoolkit把sra文件转换为fastq格式的测序文件
  • for i in `seq 56 62`
    do   
    fastq-dump --gzip --split-3 -O  /mnt/d/RNA_seq/data -A SRR35899${i}.sra
    done
  •   #-O  指定输出路径
    --gzip 指定输出格式为gzip压缩格式(fastqc软件可以直接识别gzip压缩的文件)可以减少空间
  --split-3 使用原因:如果是双端测序数据,则输出两个文件,如果不是则只输出一个文件。
    这一步会非常慢,可能是我电脑配置不高的问题,而且没有显示,需要有一定的耐心。
解压以后会有

2.fastqc软件测试测序文件的质量
ls *gz | while read id; do fastqc -t 4 $id; done
解读文件内容:

绿色表示通过,红色表示未通过,黄色表示不太好.
https://www.plob.org/article/5987.html
主要看的东西有:碱基质量与含量分布。
3.用multiQC一次性打开所有结果:http://fbb84b26.wiz03.com/share/ ... V2GwkwL2AaxYi2fXHP7

百度了一下,原来是multiqc需要python3.5* 但是我的版本是3.6的所以不能安装。借鉴Anaconda多环境多版本python指导。
http://www.jianshu.com/p/d2e15200ee9b

OK
下周再把具体fastqc报告整理发到作业上。
OK!



上一篇:偏最小二乘法(Partial Least square, PLS)
下一篇:微生物质量控制(MBQC)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-19 14:41 , Processed in 0.030366 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.