搜索
查看: 2490|回复: 0

【直播】我的基因组 44:比对文件画profile和heatmap图

[复制链接]

103

主题

133

帖子

860

积分

版主

Rank: 7Rank: 7Rank: 7

积分
860
发表于 2017-2-7 19:50:16 | 显示全部楼层 |阅读模式
本帖最后由 zckoo007 于 2017-2-7 19:53 编辑

【直播】我的基因组 44:比对文件画profile和heatmap图

就在昨天,一篇羞羞嗒的推送在各个群里炸开了锅。氮素,大家都是小清新啊今天还是给大家规(wu)规(liao)矩(tou)矩(ding)讲一下比对文件怎样画profile和heatmap图。


这主要是针对于chip-seq数据分析的,但是针对全基因组测序数据呢,也可以说明一定的问题。


d9800d185a6d9ec5c21e49d4ba2cb4ee.png

我这里会采用deeptools这个软件来探究测序数据关于各种genomic feature的profile和heatmap,安装deeptools及使用方法见我的博客,我就不再赘述(复制该网址:http://www.bio-info-trainee.com/2136.html或查看原文均可)。

这时候,需要下载genomic feature的文件,这个软件要求的bed格式的基因组注释信息,下载方式如下:

[url=]https://genome.ucsc.edu/cgi-bin/hgTables[/url]


b706d53c4bc0cb01ba7595fcbba4bd00.jpg

这里运行的代码如下:

  • date
  • start=`date +%s`
  • computeMatrix reference-point   -p 10  --referencePoint TSS -b 2000 -a 2000  -S ../*bw -R ~/annotation/CHIPseq/hg19/ucsc.refseq.bed --skipZeros -o TSS.mat.gz
  • plotHeatmap -m TSS.mat.gz  -out TSS.merge.png
  • plotProfile --dpi 720 -m TSS.mat.gz  -out TSS.profile.pdf --plotFileFormat pdf --perGroup
  • plotHeatmap --dpi 720 -m TSS.mat.gz  -out TSS.merge.pdf --plotFileFormat pdf
  • runtime=$((end-start))
  • echo "Runtime for TSS was $runtime"
  • date
  • start=`date +%s`
  • computeMatrix scale-regions  -p 5  -S ../*bw  -R ~/annotation/CHIPseq/hg19/ucsc.refseq.bed -b 3000 -a 3000 -m 5000 --skipZeros -o genebody.mat.gz
  • plotHeatmap -m genebody.mat.gz  -out genebody.merge.png
  • plotProfile --dpi 720 -m genebody.mat.gz  -out genebody.profile.pdf --plotFileFormat pdf --perGroup
  • plotHeatmap --dpi 720 -m genebody.mat.gz  -out genebody.merge.pdf --plotFileFormat pdf
  • runtime=$((end-start))
  • echo "Runtime for genebody was $runtime"


第一个genomic feature就是TSS附近的测序深度图,很明显,这5个lane的数据量不一样,但是它们的pattern是高度相似的。它们在TSS附近是有一个测序深度的peaks的,是因为TSS附近的GC含量不一致导致。并不是通常CHIP-seq的富集效应。


eb9e6b3b3e9277b31263b2ebf3ba042d.jpg

但是,下面这个,就是一个典型的CHIP-seq的数据可视化结果,很明显,可以看到,那些IP,都是有着4~6倍的富集效应。但是 IgG 就没有,是正常的GC含量富集效应。


4b4c0ae7d2d9b4c8bf06df7d83fd9046.jpg

这就是本次直播介绍的知识点!


还有一个是genebody这个genomic feature的可视化结果,但是我自己目前也不是很懂,欢迎各位高手留言讨论。


0b0d06fa96abb7af60168c9ee24a519c.jpg


文:Jimmy

图文编辑:吃瓜群众







上一篇:【直播】我的基因组 43:简单粗糙的WGS数据分析流程
下一篇:【直播】我的基因组 45:SNV突变(6种)频谱的制作
基因组,转绿组,肿瘤信息,生物统计,Python, Linux.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-11-17 19:23 , Processed in 0.048672 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.