搜索
查看: 1686|回复: 0

【直播】我的基因组 40:不同lane的bam文件的比较

[复制链接]

103

主题

133

帖子

860

积分

版主

Rank: 7Rank: 7Rank: 7

积分
860
发表于 2017-2-4 22:36:22 | 显示全部楼层 |阅读模式
【直播】我的基因组 40:不同lane的bam文件的比较

首先要把bam文件根据lane的标记来拆开,前面我们提到了把bam文件根据染色体来拆开的软件是bamtools,它还可以指定 -tag RG 来把这个bam文件按照原来的测序上样品的lane给分离开(因为本身测序文件就是多个,比对后merge的bam)命令如下:

~/biosoft/bamtools/bamtools/bin/bamtools split -in ~/data/project/myGenome/bamFiles/P_jmzeng.final.bam -tag RG
从输出的bam文件的大小,就知道每条lane的上样量不一致。


还是老规矩,先统计平均测序深度及覆盖度,还有测序深度累积曲线。脚本还是用得前面讲到的那些,我就不具体细讲了:



根据结果,统计在excel可以看到:


它们的各种指标都取决于数据量的多少,没有lane的偏好性,证明数据质量比较好。


同时把bw文件打开,看看全基因组尺度的测序深度分布:


从测序是pattern上来看,也出奇的一致:


也反应了我的样本在不同的lane中表现比较好,没有出现lane的差异。

文:Jimmy、阿尔的太阳

图文编辑:吃瓜群众



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:【直播】我的基因组39:从bam中提取我们的原始测序数据
下一篇:【直播】我的基因组 41:按照不同的lane来call variation
基因组,转绿组,肿瘤信息,生物统计,Python, Linux.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-22 00:16 , Processed in 0.031300 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.