搜索
查看: 2528|回复: 1

[other] 转录组入门——5

[复制链接]

6

主题

8

帖子

706

积分

高级会员

Rank: 4

积分
706
发表于 2017-8-14 18:21:01 | 显示全部楼层 |阅读模式
本帖最后由 mt831 于 2017-8-14 18:21 编辑

比对软件
Bowtie2
[官方网址](http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)
[中文教程](http://blog.leanote.com/post/son ... 5%E4%BD%BF%E7%94%A8)
Tophat
[官方网址](https://ccb.jhu.edu/software/tophat/manual.shtml)
[中文教程](http://www.chenlianfu.com/?p=910)
Hisat2
[官方网址](https://ccb.jhu.edu/software/hisat2/index.shtml)
[中文教程](http://blog.biochen.com/archives/337)
STAR
[中文教程](http://www.bio-info-trainee.com/727.html)
index下载
[AppleScript] 纯文本查看 复制代码
wget [url=ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/hg19.tar.gz]ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/hg19.tar.gz[/url]
wget [url=ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/mm10.tar.gz]ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/mm10.tar.gz[/url]
tar -zxvf *.tar.gz

map,sam to bam,sort bam(-n 根据reads名称进行排序)
[AppleScript] 纯文本查看 复制代码
#! usr/bin/bash
hg19_ref=~/fastq/hisat2_index/hg19/genome
mm10_ref=~/fastq/hisat2_index/mm10/genome
hg19_gff=~/fastq/refdata/Genecode/gencode.v26lift37.annotation.gff3
mm10_gff=~/fastq/refdata/Genecode/gencode.vM10.annotation.gtf
data_path=~/fastq
ls Homo*.fastq.gz|while read id;do(hisat2 -t -p 5 -x $hg19_ref -1 $data_path/${id%_*}_1.fastq.gz -2 $data_path/${id%_*}_2.fastq.gz 2>${id%_*}_map.log | ~/software/samtools-1.3.1/samtools view -Sb  - >${id%_*}.bam);done
ls Mus*.fastq.gz|while read id;do(hisat2 -t -p 5 -x $mm10_ref -1 $data_path/${id%_*}_1.fastq.gz -2 $data_path/${id%_*}_2.fastq.gz 2>${id%_*}_map.log | ~/software/samtools-1.3.1/samtools view -Sb  -  >${id%_*}.bam);done
ls *.bam|while read id;do(~/software/samtools-1.3.1/samtools sort -n -@ 5 $id  -o ${id%%.*}.Nsorted.bam);done

两种排序差异,建立索引
[AppleScript] 纯文本查看 复制代码
ls *.sra.bam|while read id;do(~/software/samtools-1.3.1/samtools sort -@ 5 $id -o ${id%%.*}.sorted.bam);done
ls *.sorted.bam|while read id;do(~/software/samtools-1.3.1/samtools index ${id%%.*}.sorted.bam;done
head -1000 Homo_SRR3589956.sra.bam > test.bam
samtools view test.bam | head
head -1000 Homo_SRR3589956.Nsorted.bam > test.nsorted.bam
samtools view test.nsorted.bam | head
head -1000 Homo_SRR3589956.sorted.bam > test.sorted.bam
samtools view test.sorted.bam | head
IGV截图


bam简单QC
[AppleScript] 纯文本查看 复制代码
# Python2.7环境下
pip install RSeQC
# bam文件统计分析
bam_stat.py -i Homo_SRR3589956.sorted.bam
# 基因组覆盖率的QC需要提供bed文件,RSeQC的网站下载
wget [url=https://sourceforge.net/projects/rseqc/files/BED/Human_Homo_sapiens/hg19_RefSeq.bed.gz/download]https://sourceforge.net/projects ... Seq.bed.gz/download[/url] -O hg19_RefSeq.bed.gz
gzip -d hg19_RefSeq.bed.gz
read_distribution.py -i Homo_SRR3589956.sorted.bam -r ~/fastq/refdata/hg19_RefSeq.bed


参考:
panda姐 https://mp.weixin.qq.com/s/C66OKH08mjWvHOmq-s8V1A
hoptop http://www.jianshu.com/p/681e02e7f9af
lxmic http://www.jianshu.com/p/93f96e7538da




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:转录组入门(7):差异基因分析
下一篇:转录组入门(7-8)从差异基因到富集分析
回复

使用道具 举报

3

主题

19

帖子

316

积分

中级会员

Rank: 3Rank: 3

积分
316
发表于 2018-1-3 11:28:44 | 显示全部楼层
学习了,赞一个!!!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-5-21 15:40 , Processed in 0.041504 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.