搜索
查看: 6042|回复: 1

SNP基因分型之基因芯片

[复制链接]

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
发表于 2017-3-1 16:53:21 | 显示全部楼层 |阅读模式
本帖最后由 ydchen 于 2017-3-1 16:54 编辑

一、基于GeneChip平台的基因分型芯片
芯片推荐:Genome-Wide Human SNP Array 6.0
芯片介绍:Affymetrix Genome-Wide Human SNP 6.0芯片产品涵盖超过1,800,000个遗传变异标志物:包括超过906,600个SNP和超过946,000个用于检测拷贝数变化(CNV, Copy Number Variation)的探针。

芯片推荐:DMET™ Plus
芯片介绍:人类基因组上的差异(SNP、插入、缺失、复制等)会导致不同个体对同一药物产生不同的反应。针对这种情况,Affymetrix推出了DMET(Drug-MetabolizingEnzymes and Transporters)Plus完整解决方案。它能检测225个基因中与药物代谢和转运有关的1936个分子标记。这些分子标记已经在不同种族、至少1200个个体中验证。通过检验不同个体分子标记的差异,研究者们可以发现药物发挥不同作用的遗传机制,从而决定药物的剂量和使用对象。

二、基于GeneTitan平台的Axiom®基因分型芯片
Axiom®基因分型解决方案为您提供多种芯片。您可以选择要研究物种的自定义内容,也可以选择来自Axiom®基因组数据库的基因型经过验证的内容。
芯片推荐:Infinium OmniZhongHua-8 Kit
覆盖了中国人特有常见和稀有变异,是第一款人类种群特异的全基因组芯片。经过优化的标签SNP内容来自HapMap所有三个阶段以及千人基因组计划(1kGP),可用于在中国人种群中探索全新的疾病和性状关联。特别覆盖中国人81%的常见变异(MAF>5%)和60%的稀有变异(MAF> 2.5%),适合全基因组关联研究(GWAS)。采用Illumina专利的BeadArrayTM技术,可提供非常高的数据质量,平均检出率>99%,重复率>99.9%。

大家分享几个运用基因芯片进行SNP基因分型的案例~

[size=1em]方案一 遗传疾病连锁分析定位         
在遗传病家系研究中,连锁分析定位是一种稳定可靠的方法。使用基因芯片对家系样本进行分型,并使用连锁分析将遗传病相关基因定位于一段基因区域中,随后再进行测序寻找这段基因区域内的遗传变异,可将候选范围缩小至数个位点。连锁分析通常用于单基因遗传病研究,或者用于定位复杂疾病中致病性高的遗传变异。
研究案例:连锁分析和外显子测序在Dowling-Degos病例中确定致病基因
Dowling-Degos病是一种色素性疾病,为常染色体显性遗传,特征为身体屈侧有网状色素沉着、显著的粉刺样皮疹和凹陷性瘢痕。本研究使用了患有Dowling-Degos病的家系作为研究对象,患者样本数量为19个。作者使用了Sanger测序排除了包含已知致病基因ABCB6、POFUT1和POGLUT1突变的样本,使用了上海伯豪提供的IlluminaInfinium Human OminiZhongHua-8基因芯片进行基因分型。连锁分析将致病基因定位至12q13.12-12q14.1区域内,LOD值为3.19,定位精度为13.76cM。随后,对其中一例患者,研究者进行了外显子组测序,平台为AgilentSureSelect,测序深度为100X。在定位区域内发现了KRT5基因起始密码子的突变c.2T>G(p.Met1?)和NEUROD4基因的一个错义突变c.376G>A(p. Ile126Val)。经过使用Sanger测序进行突变与疾病的共分离分析,后者被排除,而前者被证明与疾病相关。
原文出处:
Li M, Wang J, Zhang J, et al. Genome-wide linkage and exome sequencing analyses identify an initiation codon mutation of KRT5, in a unique Chinese family with generalized Dowling–Degos disease. Brit J Dermatol, 2015, 174(3):663-666.

[size=1em]方案二 遗传图谱构建和QTL定位         
遗传连锁图谱(Genetic linkage map)是以基因重组交换值为基础构建的遗传图谱,可表示分子遗传标记之间的相对位置和距离。它除了可用于比较进化研究和基因组拼装外,最常见的应用则为数量性状定位。数量性状(Quantitativecharacters)是指在一个群体内的各个体间表现为连续变异的性状,在一个群体内各个个体的差异一般呈连续的正态分布,难以在个体间明确地分组。目前已知,大多数控制性状(如作物产量、生育期、籽粒重、乳牛泌乳量、羊毛长度等)的位点均为数量性状,称为数量性状位点(quantitativetrait locus,QTL)。QTL定位以遗传图谱的构建为基础,将QTL定位在遗传图谱的一个区间内。经过进一步的精细定位和图位克隆,即可获得目标基因的序列。

[url=]实验材料[/url]
作图群体(F1,F2,RILs,BC等),个体数> 200

研究案例:鲤鱼高密度遗传谱图构建和性别与生长相关性状的QTL定位
鲤鱼是重要的水产物种,其全基因组已于14年被测序完成,并开发出了高密度SNP芯片。本研究研究材料为黄河鲤全同胞F1家系的119个个体和2个亲本,使用了Affymetrix Axiom Carp 250KSNP芯片进行基因分型,得到了平均标记密度为0.38cM的高密度连锁图谱。利用这张图谱,作者对这个家系的生长相关性状(体重、体长、胴体重)和性别二态性进行了QTL定位,鉴定出了22个和7个性状相关的QTL,平均(中值)定位精度在1cM以内。研究还进行了基于家系的关联分析作为连锁分析的参考。根据定位结果,研究鉴定出了生长相关调控因子KISS2,IGF1,SMTLB,NPFFR1CPE,以及性别二态性相关基因3KSRDMRT2b。本研究显示黄河鲤高密度遗传连锁图谱为QTL精细定位和原位克隆提供了有力的帮助。

原文出处:Peng W, Xu J, Zhang Y, et al. An ultra-high density linkage map and QTL mapping for sex and growth-related traits of common carp (Cyprinus carpio) Sci Rep, 2016, 6.
[size=1em]方案三 全基因组关联分析         
全基因组关联分析(genome-wide association studies,GWAS)是一种在全基因组水平上将大量样本的表型和基因型进行对照分析或相关性分析,从而对复杂性状进行基因定位的方法。目前,GWAS已经成为动植物数量性状位点(quantitativetrait locus,QTL)精细定位的重要手段。随着越来越多农林相关物种高密度芯片的开发,GWAS将更广泛地应用于农林领域。

实验材料:
无关个体(质量性状):分为case/control,最少>200个/组,推荐> 500个/组
无关个体(数量性状):最少 >200个,推荐> 500个
家系个体:最少 > 200个,推荐> 500个。需提供家系信息。









上一篇:用AnnoLnc来辅助lncRNA研究
下一篇:sanger测序作为测序界的金标准,还是需要会的
回复

使用道具 举报

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
 楼主| 发表于 2017-3-2 11:50:02 | 显示全部楼层
芯片数据的处理主要集中在标准化过程,对基因芯片数据的标准化处理,主要目的是消除由于实验技术所导致的表达量(Intensity)的变化,并且使各个样本(sample)和平行实验的数据处于相同的水平,从而使我们可以得到具有生物学意义的基因表达量的变化。标准化过程主要包含芯片内标准化和芯片间标准化。
芯片内标准化根据目的不同可分为消除染色偏差的Lowess Normalization (Locally Weighted Linear Regression),消除点样针头引起的空间差异的Print-tip Normalization。 芯片内的数据标准化,主要是去除每张芯片的系统误差,这种误差主要是由荧光染色差异,点样机器(arrayer print-tip),或者杂交试验所产生的,通过标准化,使每个基因的表达点都具有独立性。我们采用的标准化方法是局部加权回归分析:Lowess normalization.
常用的芯片间标准化有中位数标准化(Median Normalization)和分位数标准化(Quantile Normalization)。因为多个样本是分别在不同芯片上实验的,所以需要将不同试验芯片的数据调整到同一水平。常用的方法是平均数、中位数标准化(mean or median normalization)。即:将五组实验的数据的log ratio中位数或平均数调整为0。另外,一般芯片的杂交实验很容易产生误差,所以经常一个样本要做3~6次的重复实验。平行实验间的数据差异可以通过Quantile Normalization去处掉。

我们首先要对基因芯片的实验设计再多讲两句以便能更好地理解后面的介绍。一般的,基因芯片实验都会同时做两组,实验组及对照组。然后用两组实验结果进行比较来寻找在不同实验条件下差异表达的基因。为了方便,我们用R和G来分别表示它们(通常红色(Cy5)和绿色(Cy3)是较为常用的荧光指示)。
虽然通常情况下,我们认为,荧光的强度大小与mRNA或者cDNA人丰度是成正比的,但是我们知道,尤其是在两极,这个比例关系并不一定存在,比如背景的自发荧光会干扰低表达量的基因检测;而高荧光强度时,荧光检测探头可能会被饱合,而无法区分检测上限以上强度的荧光强度。最简单地用于显示原始数据这种荧光强度依赖效应的方法是绘制R-I(ratio-intensity)图,又称MA图。MA图中定义M=log2(R/G); A=1/2*log2(R*G)。

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-11-21 10:06 , Processed in 0.039861 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.