搜索
查看: 3277|回复: 1

sam文件的tag多如牛毛,几人真心搞懂了?

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-6-5 16:02:51 | 显示全部楼层 |阅读模式
大家都知道,做高通量测序数据处理最常见的公司就是sam/bam了。
一般都会推荐去看https://samtools.github.io/hts-specs/SAMv1.pdf 文档,但是 里面的信息只是标准的sam格式罢了。
任何一个软件都可以在标准的sam文件上进行tag增删操作。
比如GATK,就会增加下面这些:
original
RevertSam
BWA MEM
MergeBamAlignment

RG
RG

RG
read group
PG

PG
PG
program group
OC


original cigar
XN


# of ambiguous bases in ref
OP


original mapping position
SA

SA
SA
chimeric alignment
MD

MD
MD
string for mismatching positions
NM

NM
NM
# of mismatches
AS

AS
AS
alignment score
UQ

UQ
Phred likelihood of the segment
MC

MC
CIGAR string for mate
MQ

MQ
mapping quality of the mate
OQ


original base quality
XT


tool specific

XS
XS
BWA's secondary alignment score

当然,具体解释需求自己去看官网文档咯。UQ (the Phred likelihood of the segment) and MQ(mapping quality of the mate/next segment) tags  

比如用gatk的BaseRecalibrated命令做recal的时候,给bam文件增加了 BD and BI tags ,导致 bam文件变大。


还有bwa/bowtie/hisat等



上一篇:生信服务器配置
下一篇:对肿瘤细胞系进行药物筛查
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

4

主题

51

帖子

327

积分

中级会员

Rank: 3Rank: 3

积分
327
发表于 2017-8-8 11:15:06 | 显示全部楼层
本帖最后由 xuehzh95 于 2017-8-8 14:17 编辑

http://davetang.org/wiki/tiki-index.php?page=SAM
http://www.biotrainee.com/thread-1934-1-1.html
补充一下可以去这个网站看看,个人觉得讲解还是很详细的,还有例子
还有另外一篇中文版的帖子,坛友整理的也不错

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-7-18 09:32 , Processed in 0.029586 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.