搜索
查看: 5346|回复: 3

GWAS精细定位

[复制链接]

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
发表于 2017-5-17 09:42:02 | 显示全部楼层 |阅读模式
原创 2017-05-16 BMC 中国 BioMedCentral开放获取出版 BioMedCentral开放获取出版
人类群体中的常见疾病如肥胖、糖尿病、精神分裂等大多是多基因控制的复杂疾病。定位与复杂疾病关联的基因一直是人类遗传学领域的一个重要难题。近几年出现的全基因组关联分析方法(Genome-Wide Association Study,简称GWAS)利用大群体和高密度SNP(Single Nucleotide Polymorphism,单核苷酸多态)分子标记已经定位到了上千个与复杂疾病关联的SNP位点,而且这些关联信号在多次试验中有很高的可重复性。然而,由于随机采样带来到抽样误差(这在现实中无法避免)以及SNP之间复杂的连锁不平衡(linkage disequilibrium, 简称LD),GWAS定位到的SNP位点通常不是致病位点。因此,度量GWAS定位得到的SNP位点和致病位点之间的关系(如:物理距离和LD)是GWAS之后功能研究的关键一环,因为它能为接下来的精细定位(fine-mapping)提供重要的理论依据和实验设计指导。

2017年5月16日,澳大利亚昆士兰大学杨剑教授领导的研究团队在国际知名学术期刊Genome Biology发表了题为Quantifying the mapping precision of genome-wide association studies using whole-genome sequencing data的研究论文。该研究利用公共数据库中的3,642个英国人的全基因组测序(Whole-Genome Sequencing,WGS)数据,进行了大量的计算机模拟分析。他们首先随机抽取了一些WGS变异位点作为致病位点,再根据这些致病位点产生模拟的表型数据(比如:人的肥胖指数)。他们然后去掉WGS数据信息,只留下那些在SNP芯片上有的SNP位点,再通过imputation的方法预测去掉的那些WGS数据信息(注:在 GWAS研究中,由于SNP芯片比WGS价格低10倍以上,目前绝大多数的GWAS都基于SNP芯片,然后用imputation技术来预测缺失的WGS数据信息,我们这里将这种策略简称为芯片GWAS)。Imputation分析是通过比较芯片上的SNP数据和模版上的WGS数据来实现的。为了让模拟更趋于真实,他们采用了四个在GWAS 中常用的imputation模版:HapMap2、1KGP1(千人基因组计划1期;近1000个个体)、1KGP3(千人基因组2期;近2500个个体)和HRC(Haplotype Reference Consortium,近33000个个体)。

结果显示,对于在群体中常见SNP位点(最小等位基因频率即MAF > 1%),芯片GWAS定位得到的绝大多数SNP位点(95%~98%)都在致病位点的100Kbp范围以内(至少有80%在33.5Kbp以内),另外imputation模版的选择对定位精度的影响很小。有意思的是,基于全基因组测序的GWAS(这里简称为测序GWAS)的定位精度并不比芯片GWAS高多少。这一结果与该研究团队之前的研究结论(Yang et al. 2015 Nature Genetics)一致:对于常见SNP位点的定位,芯片GWAS比测序GWAS的性价比高很多。然而,对于群体中罕见的SNP位点(MAF < 1%),芯片GWAS的定位精度相对较低(~68%在100Kbp以内),远远低于测序GWAS,例如:绝大部分(~94%)测序GWAS定位到的罕见位点都在致病位点的5Kbp范围内。这一结果表明,对于罕见的致病位点,测序GWAS(当然需要大样本)既可以用来检测与疾病关联的遗传位点,同时也可以用来对位点进行精细定位。该研究还发现,芯片GWAS的定位精度和imputation模版的样本大小基本无关,而是随着模版的SNP数量的增加而提高。当然,不管芯片GWAS还是测序GWAS,其定位精度都会随着GWAS样本量的增加而提高。另外,该研究还发现,如果致病位点是罕见的,GWAS定位到的SNP位点绝大多数情况也是罕见的,很少出现罕见致病位点的关联信号被定位到一个常见SNP上的情况。该研究还开发了一个在线应用(http://cnsgenomics.com/shiny/gwasMP/),便于其它研究人员查找在各种不同参数(如:距离、LD和MAF差异)限定下的GWAS定位精度,为他们设计精细定位试验提供参考。


BioMed Central隶属于Springer Nature出版集团,是世界上开放获取出版的先锋,发表生物、医学领域的最新科研成果。目前拥有300多本开放获取期刊,其中近200本拥有影响因子。期刊Genome Biology (IF: 11.313)、BMC Biology (IF: 6.967)、BMC Medicine (IF: 8.005)、Genome Medicine (IF: 5.7)为旗下4本旗舰刊,颇受科研人员的欢迎。同时,拥有多本与中国科研机构合办的期刊,广受中国作者好评




上一篇:斯坦福大学的暑期小课程-用bioconductor做统计分析
下一篇:两款典型的peaks caller推荐
回复

使用道具 举报

0

主题

20

帖子

291

积分

中级会员

Rank: 3Rank: 3

积分
291
发表于 2017-6-25 10:10:37 | 显示全部楼层
说得好详细,学习了
回复 支持 反对

使用道具 举报

0

主题

20

帖子

291

积分

中级会员

Rank: 3Rank: 3

积分
291
发表于 2017-6-25 10:10:52 | 显示全部楼层
说得好详细,学习了
回复 支持 反对

使用道具 举报

0

主题

15

帖子

215

积分

中级会员

Rank: 3Rank: 3

积分
215
QQ
发表于 2017-7-7 18:01:42 | 显示全部楼层
很好 很漂亮。GWAS的文章也越来越多。Fine-mapping inflammatory bowel disease loci to single-variant resolution 这篇文章是刚发的  
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-3-31 10:11 , Processed in 0.035847 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.