搜索
查看: 4389|回复: 1

[variation-calling] 如何降低不一致率

[复制链接]

3

主题

7

帖子

50

积分

注册会员

Rank: 2

积分
50
发表于 2016-9-20 14:31:49 | 显示全部楼层 |阅读模式
求助啊!!!!!今天做不出来老大会杀了我的!!!

手上有pacbio测序数据,经过bwa,GTAk,unifiedtyper,与已知hiesq对比。
具体任务如下:

SNP/indel calling
a. 实现Pacbio SNP detection技术路线。
b. 实现Pacbio indel detection技术路线。
c. 完成样品SNP/indel detection。
d. 评价SNP/indel结果与Hiseq数据的一致性。
e. 优化SNP detection技术路线及分析参数,使SNP结果与genotype array结果不一致率小于5%



在d步骤,我的一致性不是很高,snp大约在80%左右,indel……可以忽略了。
请问如何提高一致性,前面哪一步或者哪些参数需要重做????

回复

使用道具 举报

3

主题

7

帖子

50

积分

注册会员

Rank: 2

积分
50
 楼主| 发表于 2016-9-20 14:33:58 | 显示全部楼层
Parameters as interpreted:
        --vcf /ifs4/BC_RD/USER/shangpeilin/result.filtered_snp.annodb.vcf
        --out /ifs4/BC_RD/USER/shangpeilin/compare/snp_compare
        --diff /ifs4/BC_RD/USER/lizhixin/my_project/MHC/workdir/outdir/result/MHC/result_variation/snp/MHC.snp.vcf

After filtering, kept 1 out of 1 Individuals
Comparing individuals in VCF files...
N_combined_individuals: 2
N_individuals_common_to_both_files:     0
N_individuals_unique_to_file1:  1
N_individuals_unique_to_file2:  1
Comparing sites in VCF files...
Found 15469 sites common to both files.
Found 2838 sites only in main file.
Found 9410 sites only in second file.
Found 0 non-matching overlapping sites.
After filtering, kept 18307 out of a possible 18307 Sites



这是用了vcftools的比较结果……江湖救急,哪个大哥来帮一下
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2021-12-2 00:46 , Processed in 0.110365 second(s), 35 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.