搜索
查看: 4402|回复: 1

[RRBS] 什么是甲基化-转自知乎

[复制链接]

1

主题

2

帖子

30

积分

新手上路

Rank: 1

积分
30
发表于 2016-10-26 15:11:05 | 显示全部楼层 |阅读模式
链接:http://www.zhihu.com/question/32367402/answer/55609430
作者:夏小坤
链接:http://www.zhihu.com/question/32367402/answer/55609430
来源:知乎
著作权归作者所有,转载请联系作者获得授权。

正好在总结这方面的东西,借此机会给大家分享一下甲基化相关的知识。
之前曾经看到过几个关于甲基化的问题,但是没有人能够系统地对这类问题进行回答。本文目的在于向对此领域有兴趣的同学们进行简单的科普。
我会时不时地更新(今后在更新的时候可能也会对之前发布的内容进行修改),对此问题感兴趣的童鞋可以关注这个问题,欢迎随时和我讨论!有不完善和错误的地方,欢迎指出和批评!
**多图预警**

1 概述
DNA中碱基的化学修饰近年来一直是生命科学领域研究的热点之一。其中,胞嘧啶第5位碳原子上的甲基化动态修饰研究得较为深入。早在上世纪中叶,科学家就发现DNA胞嘧啶可以被甲基化修饰,修饰之后的碱基称为“5-甲基胞嘧啶(5-methylcytosine)”,简称为5mC。后来,又陆续发现了发生在同一个碳原子上的其它修饰,并且这些修饰之间可以相互转化(如图 1所示)。

图 1
(本图取自Wu, H. and Y. Zhang, Reversing DNA methylation: mechanisms, genomics, and biological functions. Cell, 2014. 156(1-2): p. 45-68)
如上图所示,C可以被DNMT(DNA甲基转移酶)转化为5mC,5mC可以被TET(一种DNA去甲基化酶)依次转化为5hmC、5fC、5caC,最后由TDG/BER介导的碱基修复机制重新生成C,完成整个循环。
上面的一段话简直讲得太笼统了。下面要讲得稍微详细一点。首先讲一下甲基化的过程,也就是在胞嘧啶的5‘碳原子上面加上一个甲基的过程。甲基化的过程主要是由DNA methyltransferase也就是DNMT来承担的。在真核生物细胞内,不同的物种之间DNMT的数目和结构稍有不同,但大体上具有一定的同源性(图 2)。

图 2 DNMT
(图 2摘自Goll, M.G. and T.H. Bestor, Eukaryotic cytosine methyltransferases. Annu Rev Biochem, 2005. 74: p. 481-514.)
人类细胞中的情况和老鼠(Mus musculus)中的情况差不多,也是DNMT1、DNMT2、DNMT3A/B和DNMT3L等构成。其中,DNMT1的功能主要是在DNA复制的时候维持DNA的甲基化,DNMT3A、DNMT3B的功能主要是DNA的从头甲基化,而DNMT3L不具有甲基化功能,它对 DNMT3A 和DNMT3B的催化活性具有调节作用。
在哺乳动物体细胞染色体当中,有一种序列中CG含量比较高,并且CG成对出现,我们把这种CG成对密集出现的序列叫做CpG岛。哺乳动物体细胞的DNA胞嘧啶甲基化主要发生在CpG岛当中(这种规律在植物细胞当中不存在,下文讲的主要是动物细胞DNA甲基化)。在动物的某些较为特殊的细胞当中,如卵母细胞、胚胎肝细胞和成熟的神经细胞当中,CpG岛以外的甲基化现象同样非常显著。不同的细胞甲基化水平千差万别,功能多种多样。
如图3所示:

图 3
(图3摘自Lister, R., et al., Human DNA methylomes at base resolution show widespread epigenomic differences. Nature, 2009. 462(7271): p. 315-322.)
H1细胞为胚胎干细胞,IMR90细胞为人胚肺成纤维细胞。左图中的上下两个饼图可以看出,在干细胞里面非CpG区域的甲基化水平相对较高。左边的b图可以看出,在OCT4基因附近,CG原件甲基化水平比IMR90低,而CHG和CHH序列的甲基化水平较高。右图可以看出,总体上来说,干性较强的细胞中,非CG甲基化水平较高。
下图(图 4)说明了mCG和mCH与神经细胞生长发育的关系。

图 4
(图 4摘自Lister, R., et al., Global Epigenomic Reconfiguration During Mammalian Brain Development. Science, 2013. 341(6146): p. 1237905-1237905.)
在神经元细胞当中,mCH的含量比非神经元细胞的含量高很多,在人的神经元当中更甚,mCH的占比甚至超过了mCG。左图可以看出mCH和mCG的分布都有一定的位点特异性。从以上两个例子可以看出,DNA甲基化与细胞的生长发育、基因的选择性表达有着密切的关系。
目前为止,研究较为深入的是CpG岛甲基化,非CpG甲基化的功能和调控我们几乎对其一无所知。人类细胞中大约有28 million个 CpGs,体细胞的CpG岛有60-80%被甲基化修饰。

2 甲基化和去甲基化的机制
DNA甲基化的过程发现较早。具体说来,DNMT3A和DNMT3B,负责 de novo methylation,即把原来没有发生甲基化修饰的DNA双链进行修饰。在DNA复制的过程中,由于其半保留复制的特性,新合成的两条双链各有一半保留了模板的甲基化胞嘧啶,而新合成的那另外一条单链则没有被修饰。DNMT1的作用就是去识别DNA中那条被修饰的单链的甲基化位点,把没有被甲基化修饰的那条新合成的单链进行修饰,故称之为 maintenance methylation。(图 5)

图 5
(来源于Nat Rev Genet. 2001 Jan;2(1):21-32.Genomic imprinting: parental influence on the genome.)
对DNA去甲基化过程的研究则相对来讲起步较晚。其实在很早之前,人们已经能够观察到DNA当中甲基化水平的变化并且成功纯化出了甲基化酶,然而去甲基化相关的蛋白质一直没能发现。正如上图所示,去甲基化一共有两条途径,active demethylation 和 passive demethylation。在DNA合成的过程中,如果DNMT1不能结合到DNA上去,那么合成的DNA当中5mC的含量便会降低,这种去甲基化的活动是由DNA复制来完成的,因此称为“被动去甲基化”。那么是否存在一些蛋白质能够把5mC变成C,行使“主动”去甲基化功能呢?
2000年前后的数十年时间里,世界各地的科研工作者卯足了劲,都想成为第一个发现去甲基化酶的人,然而,事与愿违,不止一次有人宣称他们发现了这个去甲基化酶,然而后来事实证明他们是错的。这种情况一直持续到2009年,发表在CNS上的一系列paper宣告了TET去甲基化酶的发现。关于这段有趣的历史,科学网有篇博文值得一读:科学网—表观遗传学的一段多彩历史(+后续)
2009年-2011年的一系列文章表明,DNA主动去甲基化的过程较为复杂,这个过程需要几步反应(图 6):





图6( 来自Kohli, R.M. and Y. Zhang, TET enzymes, TDG and the dynamics of DNA demethylation. Nature, 2013. 502(7472): p. 472-479.)
TET的作用主要是把5mC转化成5hmC,5fC和5caC,此后再经过一些额外的途径将这些中间产物转化为C(TDG-BER蛋白介导的过程)。
需要注意的是,本节所讲的“DNA甲基化和去甲基化的机制”均为诸多观点当中的一种观点,肯定有其不足之处,表观遗传学尚处在初步研究阶段,随着人类认知的进步,现行的观点会被逐渐修改甚至推倒重来。比如上面提到的三种DNMT在甲基化过程中所起到的作用随着研究的深入也有必要进行一些调整。最新的研究表明,这并不是一个完善的模型。研究发现,DNMT1在从头甲基化的过程中也扮演着重要的角色,维持甲基化的过程中DNMT3也发挥了重要的作用;此外,在细胞分裂之前DNA复制的过程中,甲基化似乎也没有之前认为的被那么精确地保留。2014年,Trends in Biochemical Science 杂志上面有人提出了一种“随机DNA甲基化模型”,可以看做是对现行的理论的一些修正(Jeltsch, A. and R.Z. Jurkowska, New concepts in DNA methylation. Trends in Biochemical Sciences, 2014. 39(7): p. 310-318.)。
3 DNA甲基化对基因的调控作用
这一部分来讲DNA甲基化修饰对基因表达的调节。曾经有其他专业的兄弟问我,说DNA甲基化是抑制基因表达还是促进基因表达?这个问题并不好回答,首先是因为DNA甲基化形式多样,不同的类别作用不同,另外就是这个领域相对较为年轻,很多问题都还没有得到较为完善的回答,可能对于一种情况会有不同的研究结论,总之,问题多多,因而大家看完这部分可能又会有数不清的问题出现。
为了避免乏味的说教,我先从自己专业的角度来举个例子。
在下目前主要研究一些和肿瘤相关的热点内容。先放两张图:

图 7 (Jaiswal, S., et al., Age-related clonal hematopoiesis associated with adverse outcomes. N Engl J Med, 2014. 371(26): p. 2488-98.)


图 8(Genovese, G., et al., Clonal hematopoiesis and blood-cancer risk inferred from blood DNA sequence. N Engl J Med, 2014. 371(26): p. 2477-87.)
上面两张图来自于《新英格兰医学杂志》与2014年同期发表的两篇研究文章。这两张图都很直观,相信有部分朋友仔细研究了一会儿之后就能大概猜到它们在表达什么。这两篇文章的作者不同,但实验技术大体相同,即对大量不同年龄的人群(不管健康状况如何)的外周血细胞进行外显子测序,然后统计其基因突变情况。从统计得到的基因突变的频率可以看出,大名鼎鼎的TP53竟然排名如此靠后,而排名前列的基因又是我们刚刚提到的与DNA甲基化有着密切关系的基因——DNMT3A和TET2(其实ASXL1也是一个与表观遗传修饰有着非常密切的关系的基因,在此不多介绍)。这些突变不仅在病人当中发现,在正常人当中也占有不小的比例。基因突变的频率越高,就说明携带这种突变的细胞越能在环境的作用下生存下来,而DNMT3A和TET2很有可能是通过改变整个基因组的甲基化水平来影响细胞的恶性转化的,进而说明甲基化对血液系统的疾病的发生和发展的重要性(其实在其它实体瘤中也可以观察到类似的基因突变情况)。
咔咔,这里提一个小问题,看看谁能知道答案 ¯ □ ¯ :
问题就是,上面讲过,DNMT3A是甲基化酶,而TET2是一种去甲基化酶,按照常理来说两者功能相反——DNMT3A的突变可能导致基因组整体甲基化水平的降低,而TET2的突变则相反会导致基因组整体甲基化水平的升高,可是为什么二者的突变都能导致肿瘤的发生(并且是很重要的突变之一)?
不知道我的表述是否清晰。这真是个很有趣的问题呢!!!(其实在下最近也在思考这个问题,但还是没有一个完美的解释。有能解释此现象者,在下甘愿赠送kindle一个)
上面的问题似乎有点难了,不明白也没有关系,这个例子就是为了说明DNA甲基化的重要性。
很长一段时间以来,人们观察到DNA甲基化水平与基因的表达水平有着一定的关系。首先需要说明的一个问题就是,甲基化的胞嘧啶基因组上的分布有着怎样的规律?
哎呀,这些问题真是很有趣。
这个问题在之前是很难研究的,好在随着测序技术日新月异的发展,研究人员终于有能力从全局的角度对甲基化进行一番探索。
3.1 5mC在基因组上的分布
胞嘧啶甲基化可以分成两大类:
  • CpG元件的甲基化
即发生在诸如ATATCGAT这样的序列中C的甲基化。因为C和G两个碱基中间隔着一个磷酸基团,所以称之为“CpG”。
  • 非CpG元件的甲基化
很遗憾,我们对非CpG元件的甲基化这部分的内容几乎一无所知。
在哺乳动物细胞中的5mC主要集中在CpG上面,并且,在脊椎动物细胞上的CpG频率要明显低于其他动物细胞(如果蝇,图 9)。

图 9(Michael Weber et al. Functions of DNA Methylation and Hydroxymethylation in Mammalian Development)
为什么会这样呢?这与细胞中的一种叫做AID的酶有关。AID可以把胞嘧啶的氨基去掉(deamination),生成T,造成TG错配,如果该错配没有被及时修复的话,通过DNA复制会形成碱基对分别为TA和CG的两条链,进而造成C的丢失。该过程主要发生在生殖细胞产生的过程中,由此可以想象,目前细胞内已知的大多数CpG位点在生殖细胞中应该甲基化程度较低,因为只有这样才能逃脱被去氨基的命运。
CpG元件在DNA上的分布也有着一定的规律。人类DNA当中大约有28 million个CpG位点,它们往往成簇出现,而那些CpG较为密集的地方,我们称之为CpG岛(CpG islands,CGIs),所以,CpG甲基化又可以分为两种类型,即CpG岛甲基化和非CpG岛的甲基化。CpG岛的分布也有一定的规律,它们往往位于一些基因的启动子附近(尤其是一些 house-keeping gene),它们可以调控基因的表达:就一般而言,基因启动子区域的CpG岛的甲基化水平越高,该基因的表达水平就相对较低。CpG除了以CpG岛的形式分布之外,还会零零散散地散布在DNA的各处。基因的序列之中当然也会有CpG出现,而这种以非CpG岛形式出现在基因中的CpG也与基因的表达量有关,一般而言,这种CpG的甲基化程度越高,往往基因的表达水平就越高。


这一段的内容可以用下面的图来表示:

图 10(Stirzaker, C., et al., Mining cancer methylomes: prospects and challenges. Trends in Genetics, 2014. 30(2): p. 75-84.)
图 10 中上下两块分别画出了两个基因的不同的甲基化状态。A图表示的是在正常细胞中,抑癌基因表达,癌基因被抑制;而在B图中则相反,抑癌基因被甲基化沉默而癌基因表达水平上升(B图是肿瘤细胞中一些基因甲基化水平发生改变的典型状况)。除了我提到的启动子和基因序列中的CpG之外,图中还有一些元件比如 enhancer、shore等等,这些区域的甲基化水平也会影响基因的表达,感兴趣的朋友可以找这篇文章来读,图的下方已经标明了出处。
当然了,当然,上面所说的DNA甲基化对基因表达的调控都只能用“大体上”这个词来形容,接下来,我们就根据不同情况详细地去看一下。
3.2 转录起始点(transcription start sites, TSS)的CGIs甲基化
在体细胞中,CGIs的甲基化水平是比较低的(相对于非CGIS而言)。前面说过,转录起始位点附近的CGIs的甲基化水平和基因的表达水平负相关,那么,是不是只要这些区域CGIs的甲基化水平较低,基因的表达就一定会被上调呢?
不是这样的。基因表达的调控是个很复杂的过程,不光涉及表观遗传学的范畴,而胞嘧啶甲基化又只是表观遗传学的一个小分支。除了DNA甲基化,还有一些其他的表观遗传学过程比如组蛋白的甲基化和乙酰化等过程同样可以对基因的表达水平产生影响。如果各位对这些表观修饰感兴趣的话可以告诉我,我会抽时间总结一下写给大家。某些基因的启动子区域甲基化程度较低,然而这些基因的组蛋白修饰可能会不利于转录因子的结合,这同样会抑制基因的表达。
尽管如此,在一些需要长时间保持表达抑制的基因的启动子附近的甲基化仍然表现出较高的水平,换句话说,启动子区域CGIs的甲基化是表达受到长时间稳定抑制的基因的标志。比如在女性体细胞中的两条X染色体上,有一条染色体上的基因不会被表达,这些基因的启动子区域的CGIs甲基化程度会比较高。
3.3 转录起始点的非CGIs甲基化
有相当一部分基因的启动子区域附近没有CGIs的存在,然而,关于这些基因启动子区域的甲基化的功能目前由于研究地不深入,资料极其匮乏。有些研究证明,这些区域的甲基化程度与基因的表达负相关。有兴趣的朋友可以阅读下面的文献:
(1) Han, H., et al., DNA methylation directly silences genes with non-CpG island promoters and establishes a nucleosome occupied promoter. Human Molecular Genetics, 2011. 20(22): p. 4299-4310.
(2) Balasubramanian, D., et al., H3K4me3 inversely correlates with DNA methylation at a large class of non-CpG-island-containing start sites. Genome Med, 2012. 4(5): p. 47.



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:基因组染色体替换
下一篇:检测蛋白磷酸化的六种方法及其优缺点
回复

使用道具 举报

29

主题

131

帖子

1200

积分

金牌会员

Rank: 6Rank: 6

积分
1200
发表于 2018-1-6 15:48:04 | 显示全部楼层
赞!!!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-3-22 17:11 , Processed in 0.029724 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.