搜索
查看: 1732|回复: 0

【直播】我的基因组48:我可能测了一个假的全基因组

[复制链接]

103

主题

133

帖子

860

积分

版主

Rank: 7Rank: 7Rank: 7

积分
860
发表于 2017-2-9 22:05:09 | 显示全部楼层 |阅读模式
【直播】我的基因组48:我可能测了一个假的全基因组[size=1.4em]背景知识
男性只有一条X染色体和一条Y染色体,所以,理论上它们上面的SNV都应该是纯合的!
X,Y除了同源区域外,其它地方差异很大。所以在女性样本里面即使是混入了极低量的男性样本,也很容易检测出来。同理,男性样本里面混入了女性样本,会给男性带来大量的X染色体的杂合SNV,也很容易检测出来。
我的测序结果
我对前面步骤call到的vcf格式的变异位点文件进行了X,Y染色体的简单统计,代码如下:
cat  jmzeng.freebayes.vcf |grep -w 'chrY'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -ccat  jmzeng.freebayes.vcf |grep -w 'chrX'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c
结果不是很妙!

  • 按照道理,不管是X,Y染色体,我都只有一条呀!
  • 但是为什么我call出来的snp位点, 居然~~~这么多杂合的????
  • 尽管测序会有错误,不那么精准,但是误差不应该那么大吧!

我测试了另外一个软件call出来的snp位点,也用同样的脚本进行统计!
zcat jmzeng.bcftools.vcf.gz |grep -w 'chrX'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -czcat jmzeng.bcftools.vcf.gz |grep -w 'chrY'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c
结果也不容乐观!



起初我怀疑是我的snv结果没有进行过滤,所以造成了这么大的误差,那么就用测序深度来进行过滤吧!

很明显,纯合杂合的问题,并没有测序深度的偏差,我暂时还不能确定问题出在哪里,接下来4篇帖子都会围绕着这个问题展开!
关于NGS数据探索性别相关问题,更多阅读,请自行前往我的博客搜索!
  • 根据chrY独有区域的覆盖度及测序深度来判断性别([url=]http://www.bio-info-trainee.com/1248.html[/url])
  • 根据X,Y染色体比对上的reads数来判断性别([url=]http://www.bio-info-trainee.com/1244.html[/url])
  • 根据X染色体的snp的纯和率来判断性别([url=]http://www.bio-info-trainee.com/1243.html[/url])



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:【直播】我的基因组47:测序深度和GC含量的关系
下一篇:【直播】我的基因组49:Y染色体的SNV不能用常规流程来找?
基因组,转绿组,肿瘤信息,生物统计,Python, Linux.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-16 15:42 , Processed in 0.029611 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.