搜索
查看: 3628|回复: 3

如何在GWAS之前过滤SNP

[复制链接]

9

主题

25

帖子

172

积分

版主

Rank: 7Rank: 7Rank: 7

积分
172
发表于 2017-4-10 15:31:54 | 显示全部楼层 |阅读模式
在读懂VCF文件的前提下,可以自己编写脚本过滤GWAS需要的SNP,也可以使用现有的工具,通常后者都要快很多。个人最新喜欢用的就是vcftools和plink这两个工具。
vcftools 使用说明见 http://vcftools.sourceforge.net/man_latest.html
plink http://www.cog-genomics.org/plink2/

这个工具我记得都是免编译安装的,自己down下来就可以直接使用,很方便。

使用vcftools过滤:

1. MAF<0.05
vcftools --vcf test.vcf --maf 0.05 --out XX

2.完整度大于90%
vcftools --vcf test.vcf  --max-missing 0.9 --OUT XX

3.平均深度大于5
vcftools --vcf test.vc --min-meanDP 5 --out xx

注:
使用--gvcf更为快捷

使用plink过滤

1.vcf转化plink格式
vcftools --vcf test.vcf --plink --out  xxx

2.plink --noweb --file plink --geno 0.05 --maf 0.05 --hwe 0.0001 --make-bed

个性化需求,可自己参看官网说明书
回复

使用道具 举报

0

主题

2

帖子

59

积分

注册会员

Rank: 2

积分
59
发表于 2017-4-13 01:46:04 | 显示全部楼层
过滤条件如果是MAF<0.05的话,应该用这个参数吧
--max-maf 0.05

"使用--gvcf更为便捷" 我猜你想说的是--gzvcf吗

请多指教还希望楼主多出一些vcf数据分析的帖子
回复 支持 反对

使用道具 举报

9

主题

25

帖子

172

积分

版主

Rank: 7Rank: 7Rank: 7

积分
172
 楼主| 发表于 2017-4-15 10:55:46 | 显示全部楼层
luke_tu/e 发表于 2017-4-13 01:46
过滤条件如果是MAF

这些参数官网其实写的很清楚,多看看就明白了
回复 支持 反对

使用道具 举报

10

主题

52

帖子

553

积分

版主

Rank: 7Rank: 7Rank: 7

积分
553
QQ
发表于 2017-7-11 16:11:28 | 显示全部楼层
vcftools和bcftools有什么区别,哪个好用?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-2-21 22:51 , Processed in 0.042225 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.