搜索
查看: 4455|回复: 1

【直播】我的基因组(十四):bam文件给按照染色体给分割...

[复制链接]

103

主题

133

帖子

860

积分

版主

Rank: 7Rank: 7Rank: 7

积分
860
发表于 2017-2-2 09:58:40 | 显示全部楼层 |阅读模式
本帖最后由 zckoo007 于 2017-2-2 10:01 编辑

【直播】我的基因组(十四):bam文件给按照染色体给分割成小文件

昨天,我们了解了一下SAM格式的比对结果,不知道大家理解的怎么样。但是全基因组测序数据实在是太大了,即使比对后把sam文件压缩成二进制的bam文件也还有55G(如何压缩转换可查看直播十二),如果完整的导入IGV查看会略微考验计算机配置。


3e14dda625946f58e6d2d6cef67bd50a.png


如果按照染色体(chr1-chr22,chrX,chrY,chrMT)来分割写一个脚本其实很容易,无非是效率的高低而已。但是我Google了一下,发现有现成的工具,也顺便试用一下这个软件bamtools。

如果需要手动切割,用下面的脚本,其中$BAM是需要传进去的参数。

[Perl] 纯文本查看 复制代码
for chrom in `seq 1 22` X Y MT do    samtools view -bh $BAM chr${chrom} | samtools sort - chr${chrom}    samtools index chr${chrom}.bam done

如果需要使用现成的工具bamtools的话,该软件的github地址是:[url=]https://github.com/pezmaster31/bamtools[/url] 。安装也是非常容易,因为没有二进制可执行版本,所以需要下载源码自己编译。


[Perl] 纯文本查看 复制代码
## Download and install variationtoolkit
## [url=https://github.com/pezmaster31/bamtools/wiki/Building-and-installing]https://github.com/pezmaster31/b ... ding-and-installing[/url]
cd ~/biosoft
mkdir bamtools &&  cd bamtools
git clone git://github.com/pezmaster31/bamtools.git
cd bamtools
cmake --version  ## BamTools requires CMake (version >= 2.6.4).
mkdir build &&  cd build
cmake ../
make
~/biosoft/bamtools/bamtools/bin/bamtools

与我以前安装的软件不太一样的是要先cmake然后再make,而且保证cmake的版本不低于2.6.4

用法非常简单:

bamtools split -in file.bam -reference

我的代码如下:

[Perl] 纯文本查看 复制代码
~/biosoft/bamtools/bamtools/bin/bamtools split \
-in /data/project/myGenome/bamFiles/P_jmzeng.final.bam \  -reference  
## 这里指定按照reference来分离bam文件

还可以指定 -tag RG 来把这个bam文件按照原来的测序上样品的lane给分离开(因为本身测序文件就是多个,比对后merge的bam)

也可以指定-mapped来分离比对成功与否的bam文件!

默认split后的小bam文件,就在原来的大的bam文件目录下,这个55G的文件,运行了近8个小时。

a2d07c392c1c6cafc96626bd5f132b94.jpg



上面的脚本也好,这个bamtools工具也好,都是一个个染色体依次运行,所以速度很慢,其实可以同时开25个文件句柄,一次读入,全部写出!!!



    最后呢,留个问题给大家,对于PE reads,如果左端的reads比对到1号染色体, 但是右端比对到2号染色体,这个应该归于哪个染色体的比对情况呢?欢迎大家评论区留言!

文:Jimmy、吃瓜群众

图文编辑:吃瓜群众







上一篇:【直播】我的基因组(十三):了解sam格式比对结果
下一篇:必须要了解的美国国立综合癌症网络NCCN
基因组,转绿组,肿瘤信息,生物统计,Python, Linux.
回复

使用道具 举报

0

主题

14

帖子

235

积分

中级会员

Rank: 3Rank: 3

积分
235
发表于 2017-3-20 08:58:55 | 显示全部楼层
左归1,右归2。 或者变成single?但是合理的推测一下应该不会变成single,因为flag值不会变。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-6-1 14:23 , Processed in 0.028644 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.