搜索
查看: 2965|回复: 0

GTEx项目检测遗传学效应

[复制链接]

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
发表于 2017-3-2 11:50:29 | 显示全部楼层 |阅读模式
组织内的转录本表达丰度在不同个体之间存在着差异。目前,研究者们对这种个体差异的遗传基础进行了分析。
研究者们在过去的几年里开展了大量的基因组分析,并从中获得了诸多经验,其中一条经验是:如果由大型研究团队开展一系列设计严谨、目标宏大、分析周全的遗传学研究的话,将会推动该研究领域取得巨大的飞跃。这些遗传学研究既能够为研究者提供新的见解,也能够生成大量可供所有研究人员广泛利用的基因数据集,从而实现遗传学研究领域的飞跃。因此值得注意的是,虽然我们现在已经知道绝大多数常见的、与疾病风险有关的遗传多态性位点(即特定DNA序列上的变异)都是通过调控基因表达来发挥作用的,但是我们一直都未开展过“大科学(big science)”转录分析。最近,基因型-组织表达(Genotype-Tissue Expression, GTEx)研究联盟(GTEx Consortium)分别在本期期刊的第648页、第660页和第666页上发表了第一批转录研究的结果(其中包括Melé等人和Rivas等人的研究成果),从而填补了此类研究的空白。
多种组织内的转录本表达丰度在不同的个体之间存在着差异。为了了解导致这种个体差异的遗传基础,GTEx研究联盟在美国国家人类基因组研究所(National Human Genome Research Institute)的协调下开展了GTEx研究工作。迄今为止,我们主要是通过血液淋巴母细胞系的研究以及容易获取的组织(例如脂肪或皮肤)的离体研究,来了解人类基因表达的遗传学机制。GTEx项目计划在大约1000具由近亲属同意捐赠的尸体中获取50多种组织类型,并在这些组织中研究全基因组范围内的序列变异与RNA测序结果之间的关联。全基因组关联研究(genome-wide association study, GWAS)已经发现了数千个与疾病风险相关的遗传变异。如果我们了解这些遗传变异与RNA测序结果之间的关联的话,将会提供直接的证据来证明这些遗传变异的功能,并且阐明导致健康人疾病易感性差异的机制。GTEx项目在试点阶段获得的研究结果主要来自于237名首批捐赠者的尸体:他们分析了其中大约100具尸体体内9种组织的RNA样本,此外还分析了少部分捐赠者体内33种其它组织的RNA样本。GTEx研究联盟的论文报道了基因表达的遗传学调控机制,而Melé等人则系统地比较了不同组织和不同个体之间“转录组(transcriptome)”的差异,即所有RNA分子的差异,包括信使RNA(messenger RNA)、核糖体RNA(ribosomal RNA)、转移RNA(transfer RNA)和其它的长链非编码RNA(long noncoding RNA)。Rivas等人报道了蛋白质截短变异(protein-truncating variant)对人类转录过程的影响,并且生成了一个定量模型,来分析无义介导的RNA降解(nonsense-mediated decay,即清除含有提前终止密码子(premature stop codon)的转录本)在不同组织之间的差异及其可能的遗传学调控机制。
以往针对多种生物的研究已经证实,位于某一基因数十万个碱基范围内的常见调控性多态位点——即表达数量性状基因座(expression quantitative trait loci, cis-eQTL)能够显著影响该组织或其它组织内的、至少一半的基因的表达水平。这些基因座会在局部范围内影响其附近基因的表达,这就可能解释了为什么特定转录本的丰度在不同个体之间存在着差异——少则相差百分之几,多则相差一半以上。由于eQTL位点对基因表达的影响远远强于疾病相关性多态位点,因此即便研究所用到的样本量只有100人,我们也能够检测到最显著的eQTL效应。尽管罕见变异的探索性研究目前还处于起步阶段,但是研究者们预测这类变异也是引发疾病的一个重要因素。表观遗传因素的影响(例如染色质修饰和microRNA调控)当然也能够很大程度地解释转录本丰度的个体差异性。转录变异的一个重要特征是:存在着非常强的共调节作用,有时候会共同调节成千上万个基因。这可以归因于多种调控性反式作用因子(即转录因子、激素、环境因素)所产生的累积效应;此外,组织内不同类型的细胞的数量不同,也是导致转录变异共调节作用的一个重要原因。
首批GTEx论文的主要贡献之一是:量化了不同组织内cis-eQTL的相对贡献,从而表明在甲状腺和胫神经中,邻近多态位点所调控的基因数量是血液或心脏中的两倍。然而,血液中的等位基因特异性表达(allele-specific expression,即主要由两条同源染色体中的一条进行转录)水平似乎较高,而大脑组织中却不存在等位基因特异性表达。有趣的是,与转录本总丰度相比,不同组织之间的等位基因特异性表达水平似乎更加保守。
在不同组织之间到底存在有多少个相同的基因表达调控性遗传变异呢?关于这一问题还存在着很大的争议。我们在比较不同的数据集时,如果采用不同的分析方法,就会产生完全不同的结论。GTEx研究联盟采用两种不同的分析方法(即双向线性模型和Bayesian联合分析法)对同一个普通人群数据集进行了研究,从而解决了这一问题。GTEx研究联盟获得了令人惊叹的研究结论:大约一半的cis-eQTL(尤其是位于启动子附近的cis-eQTL)在绝大多数组织中处于激活状态,而另一半cis-eQTL则倾向于在一种或两种组织中特异性地活化。影响RNA剪接的变异(即剪接变异)可以导致细胞产生替代性的转录本异构体,这些变异在不同的组织中也是保守的,我们可以在多种组织内检测到80%以上的剪接变异,但是在进行组织间的两两比较时,剪接变异的相似度又千差万别:在全血中,只有不到10%的剪接QTL与阳光暴露后的皮肤中的相同,而有大约50%的剪接QTL与左心室的相同。
GTEx研究联盟发表的论文给人们带来了一个大大的惊喜——发现了模块QTL(module QTL,modQTL),它是一类可以影响基因表达共调节作用的调控性变异。modQTL的理念是:大多数基因被组织成一个个的表达模块。即便它们位于不同的染色体上,但是它们却具有相近的表达水平。同一模块中的诸多基因通常都具有相同的功能,例如控制细胞分裂周期。GTEx研究联盟发表的研究共发现了117个模块,每个模块包含有25至414个转录本。我们可以在多种组织中观察到相同的模块,但是却不一定能够在这些组织中观察到相同的表达模式。原来在不同个体之间,有很多基因会转移到其它的模块“阵营”中去(如图)。这种转换与该基因区域内的调控性变异(即modQTL)有关,而在相关的组织中,大约只有一半的modQTL会被检测为cis-eQTL。由于模块内的基因通常都具有相同的调控性模体,用于结合一些常见的转录因子,而且这些模体都含有一些调控性多态位点,因此这就暗示我们,整个GTEx项目将会发现一些新的原理,来说明基因表达的共调节作用为什么会在组织内和组织间存在差异。

这些研究发现对个性化医疗有什么蕴涵的意义呢?我们虽然几乎无法从GTEx研究中找到一些暗示,但是当我们对GWAS数据和DNA元件百科全书(Encyclopedia of DNA Elements, ENCODE)计划(该计划确定了人类基因组序列中的功能性元件)所获得的信息进行生物信息学处理,并根据处理的结果进行推论时,GTEx研究就能够验证这些推论的真实性,这也是GTEx研究所带来的最显著的意义。如果我们对那些用于标注增强子和其它调控性元件的染色质特征进行测量的话,就会意识到疾病相关性变异往往会富集在一些特殊基因附近的区域中,而这些特殊的基因在疾病相关性组织(例如自身免疫性疾病中的淋巴细胞或精神疾病中的神经细胞)中更有可能处于活化状态。GTEx项目提供了直接的证据来证明事实的确如此,而该项目所附带产生的数据库可以供所有研究者查阅,以便了解疾病相关性变异会在哪类组织中对其邻近基因的表达情况产生特定方向的影响。值得注意的是,这里的“邻近区域”通常并不是指最靠近的区域。此外,需要申明的一个关键问题是:研究者们在分析了50种组织的基因表达谱之后证实,蛋白质截短变异体的编码基因实际上在大多数疾病相关性组织中并未进行表达。研究者们曾经根据DNA序列的情况,预测这些蛋白质截短变异会产生有害效应,然而GTEx研究的以上发现则提示我们,这些变异实际上不太可能引发疾病。
在未来的两年内,研究者们应当会获得所有的GTEx数据。毫无疑问,如果GTEx研究获得更多数据的话,它的意义将远远不只是验证了初步研究所报道的发现。我们还会发现更多的cis-eQTL,弄清楚等位基因特异性表达和RNA剪接的复杂网络,并且推测出模块化转换的潜在机制。我们也能够大胆地预测未来:利用一些目前尚未构想出来的统计学方法,就能够更完善地整合GTEx数据和ENCODE分析;ENCODE组织表达(ENCODE Tissue Expression, EnTEx)试点项目将会报道某些GTEx样本的染色质谱系。诸如此类的分析使我们能够从众多具有提示作用的GWAS研究结果中筛选出有意义的发现,从而更多地解释疾病易感性的个体差异,并且将疾病的发生归因于特定类型的细胞。然而,如果有基金资助研究者们对慢性疾病患者或具有不同生活方式或环境暴露(例如毒素或严重社会经济压力的暴露)的个体开展基因型-组织表达研究的话,那么我们就需要设计出更宏伟的GTEx项目,来评价基因调控效应在疾病中的变化情况(“GTEx-D”)及其在不同环境中的差异(“GTEx-E”)。
或许最重要的一点就是:我们可以开始策划一项改进的、基因组推动下的精准医学研究项目。DNA测序技术的功能非常强大,能够确定引起先天性畸形的原因,预测肿瘤的进展情况,并且为患者制定个性化的用药方法。尽管研究者们还在沾沾自喜于DNA测序技术的强大功能,但是静止状态下的基因组仍然存在其局限性。如果在20年以后,基因表达谱分析与基因型分析被整合成为医学诊断领域中的一种标准方法的话,人们就会看到GTEx项目是如何让我们更接近于目标的实现的。
原文检索:GTEx detects genetic effects. Science



通过棱镜过滤GTEx数据可让我们根据组织类型来分解信息;每种类型的组织具有其独特的、指定颜色,并能让我们从有利的位置来分析和比较数据。
一项新的研究就基因型组织表达(GTEx)项目的前驱数据集给出了第一项分析结果,它对我们的基础DNA如何调节基因表达进行了调查。人体中所有的细胞都有着相同的基因。不同组织中细胞间的差异源于基因表达(即来自DNA的信息被复制并被合成为蛋白)在具有代表性的细胞之间的不同。例如,肝细胞所拥有的蛋白与皮肤细胞不同,即使它们的DNA是相同的。科学家们还没有完全理解人体内不同组织的基因表达为什么不同,但他们却怀疑大多数的遗传变异并不会编码变异或没有变异的蛋白;相反,基因变异是通过调控具体基因得到多少表达(如果有表达的话)而发挥其作用的。
为了更好地了解我们的基因和组织在其中发挥作用的基因调控网络,GTEx联合会中的130多位研究人员从175名死者身上采集了1641个尸检样本,这些样本来自43个不同的身体部位。研究人员对几乎所有5万4000个转录基因的基因表达模式进行了观察。这使得他们能够确定基因组中的、影响基因表达的特定区域,并决定这些区域中有哪些会显示出组织特异性表达模式。在两篇相关论文的第一篇中,Marta Melé等人对所有组织中的基因表达分布进行了描述,并证明,因组织而异的若干基因通常主导了这些组织特异性基因的表达。Manuel Rivas等人解释了截短的蛋白变异体如何影响整个组织中的基因表达。了解我们基因的遗传调节网络可帮助科学家们更好地理解基因变异如何让人们易患疾病。GTEx联合会的研究工作对于研究人员在未来调查不同组织中的基因表达遗传控制而言是一个资源。一篇《视角》文章提出了更多的见解。
原文检索:The Genotype-Tissue Expression (GTEx) pilot analysis: Multitissue gene regulation in humans



上一篇:【学分析】16sRNA数据分析-谷禾生物
下一篇:DeAnnCNV: 一个利用全基因组外显子测序的在线拷贝数变异检...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-21 09:31 , Processed in 0.042573 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.