搜索
查看: 2418|回复: 0

常见科研领域对变异位点需要注释的数据库

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2016-10-15 08:52:31 | 显示全部楼层 |阅读模式
通常我们测序,会得到几万到上百万的VCF格式的变异位点记录,如果你不知道什么是VCF,那么下面的你就不用看了~
这些VCF文件只告诉你基因组的哪一条染色体,哪一端区域发生了什么样的变异,不能得到该变异的其它功能,比如是否改变蛋白编码,是否有害,其他人群是否也发生同样的变异,等等, 那么就需要一系列数据库来注释了。
这里可以用snpEFF,VEP,annovar 这3种主流软件来做注释,数据库主要有下面的:

dbsnp144 (这个是ncbi提供的最权威的啦)
cgi69
ExAC.vcf.gz(这个是broadinstitute提供的外显子联盟)
Cosmic_v73.ann.vcf.gz (这个是癌症突变信息集)
finalTCGA.vcf.gz (TCGA计划也是癌症相关的)
icgc.vcf.gz
dbNSFP2.6vcf
SCLP.ann.vcf.gz
CCLE.ann.vcf.gz
ESP6500-SIv2.vcf.gz (Variants from the Exome Sequencing Project (ESP))
adni-sum
safs-sum.indel.vcf.gz
gonl.vcf.gz
ssm.vcf.gz
ssi.vcf.gz
uk10k.vcf.gz
1000g-ph3v5.gff.gz  (千人基因组计划)
gwasCatalog.gff.gz  \
phewascatalog.gff.gz  \
dbgap-gwas.gff.gz  \
interproDomain.gff.gz \
clinvar.gff.gz \
RegulomeDB.gff.gz \
CancerGAMAdb.gff.gz \

参考:http://www.bio-info-trainee.com/1033.html



上一篇:请问做连锁不平衡分析时,对于二态的indel要怎么处理?
下一篇:你可以在你自己的电脑上面建一个论坛自己玩一下
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-4-26 10:44 , Processed in 0.028358 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.