搜索
查看: 4955|回复: 1

三维基因组学简史

[复制链接]

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
发表于 2017-9-30 16:28:52 | 显示全部楼层 |阅读模式
简史系列|三维基因组学简史
2017-09-27 三维基因组Magic


染色质构象研究可以追溯到1879年W.Flemming用工业染料对细胞的着色研究。他发现利用碱性染料对细胞进行染色质时,细胞核中存在一种物质可以被染成深蓝色与其他亚细胞结构截然不同。他将其命名为染色质(chromatin)。1888年Waldeyer正式提出了染色体的命名。但是染色质并未立刻得到科学界的重视。

在1900年,随着三位科学家各自独立重新发现孟德尔的遗传定律,对遗传物质组成的研究立刻成了重要的科学问题;1905年英国遗传学家贝特森首先命名了遗传学(genetic)一词,1909年丹麦科学家维尔赫姆·路德维希·约翰逊(Wilhelm Ludwig Johannsen则创立了‘基因’、‘基因型’、‘表现型’等几个被广泛应用的名词。

1928年格里菲斯做了著名的肺炎双球菌侵染试验,他将灭活的III型肺炎双球菌和活的II型肺炎双球菌分别注射到小鼠体内,发现两组小鼠均正常存活,而当两者混合再次注入小鼠体内时,小鼠致死,并在小鼠体内分离出可致病的III型肺炎双球菌。当时大部分科学家推测导致小鼠致病的可能是染色质中存在的蛋白质。

1944年艾弗里及其合作者在格里菲斯的研究基础上,在致病菌的浸出物中分离到高纯度DNA和蛋白质及多糖,并将其分别和R型(非致病型)浸出物混合注射到小鼠体内,发现只有DNA组的小鼠肺炎双球菌发生了转化并导致了小鼠致死,从而证实了DNA是遗传物质。

1951年富兰克林通过提取高纯度的DNA结晶并用X衍射拍摄到及其精美的X射线衍射图片,她的同事威尔金斯私自将这一结果展示给了年轻的科学家沃森和克里克。次年,美国科学家查伽夫E.chargaff测定了DNA分子中4中碱基的含量,发现其中腺嘌呤和胸腺嘧啶的数量相等,鸟嘌呤和胞嘧啶的相等。

1953年沃森和克里克根据以上的信息推测出A-C配对,C-G配对的DNA双螺旋模型,这一结果暗示了DNA在复制过程中存在及其精确的机制,该结果一经发表立刻产生了轰动效应,开启了分子生物学的大门。此时人们惊讶地发现虽然DNA的序列虽存储了足以转录出RNA并翻译成蛋白的所有信息,但对基因是如何有序进行调控发挥正常功能还一无所知。

为了观测细胞核内DNA的分布和定位,根据DNA双链互补配对的原理,研究人员发明了一种通过设计带有标记物的特定探针用于识别细胞核内特定的互补配对片段的方法,称之为原位杂交技术(In situ hybridization),1969年耶鲁大学Gall首先利用爪蟾核糖体基因探针与其卵母细胞进行杂交,1970年,Buongiorno—Nardelli和Amaldi等相继利用同位素标记核酸探针进行了细胞或组织的基因定位,发明了原位杂交技术。

前期的原位杂交技术是通过添加放射性同位素来鉴定的,80年代后人们将检测手段从同位素更换为更安全灵明度更高的荧光,发明了荧光原位杂交技术(Fluorescence in situ hybridization,FISH)。



在荧光原位杂交技术的基础上,科学家采用几种不同颜色的荧光素单独或混合标记的探针进行原位杂交,能同时检测多个位点,利用这一方法,人们首次观测到染色质在细胞核的整体分布,发现每条染色体独立折叠定位在细胞核的特定地域,并称之为染色质领域(chromosome territory)。

但是由于FISH的荧光灵敏度较低,探针片段要长达数十kb才能被检测到,它并不适合用来研究基因的表达调控。因此迫切需要一种新的定量技术来用于基因表达调控的研究。


曙光发生在1993年,当时科学界对转录因子是如何启动基因表达的还存在很多的争论,有的假说认为转录因子在DNA公路上一直奔驰,直到识别启动子序列启动转录(scanning model);有人认为转录因子和启动子结合会导致其结构发生变化从而启动转录(structural tranmission model);而另外一种观点认为是DNA looping model,他们认为转录因子结合到某一段DNA上会形成loop结构,使其与启动子序列空间上靠近,从而启动转录。

Katherine E.Cullen设想如果是前两种模型,DNA的结构都是近线性的,相反如果是环状,启动子DNA必然与远距离的调控片段在空间上靠近,如果有手段可以识别到他们的频率,就可以证实或证伪这一假说。


在研究过程中,他遇到了很多问题:
  首先是原位实验问题:细胞核内DNA是无法实现测序或检测的(FISH的分辨率达不到);
  其次是瞬时定位问题:DNA通过缠绕在组蛋白八聚体中形成核小体包装成染色质,同时染色质DNA的长度长达Mb,如果直接回收DNA,那位置信息就无法在裸露的DNA中获得;

为了解决这些问题,科恩想法了一个绝妙的方法:
   先将一段基因和其可能的调控元件件克隆到一个病毒质粒中,这样就解决的在大型基因组中假阳性问题;
   然后利用限制性内切酶对DNA进行酶切,将DNA片段碎片化;
   其次利用DNA连接酶将DNA分子连接起来,他推测距离相近的片段应该更容易连接在一起。
   最后检测,利用在酶切位点设计的引物用来鉴定片段之间是否连接。

这就是近距离连接反应(proxim ligation assay,PLA)原理,在空间上相互靠近的片段更容易地在碎片化后通过连接酶的活性连接在一起。

通过这个方法,他们发现潜在的调控元件与启动子位点具有显著的扩增条带,从而证实了调控元件可能是通过空间靠近形成loop环状结构来调控基因的表达的。



2002年,Job.Deeker想利用类似的方法将这个实验在真核生物中进行重现,用来鉴定细胞真实的调控元件。为此相较于他的前辈,他可以很方便地得到基因组特定位点的酶切位点信息,因为早在01年人类基因组已经发布了草图。他在近距离连接反应的基础上,增加了交联的步骤--通过添加甲醛使得DNA与蛋白质交联在一起,实现了原位固定。通过在酶切位点附近设计特定的引物,便可以很容易地识别出特定的酶切片段到底跟那些片段是否具有连接。2002年他将这部分成果发表在科学杂志上,并将这一技术命名为3C技术(chromosome conformation capture)。

这一成果的发表是技术与科学假设完美结合的成果,他在文章末尾提到‘Moreover,3C technology can be applied to any organism for which genomic sequence information is available. When combined with other approaches, information about spatial organization can be related to specific chromosome functions.’毫不夸张地说,3C技术是人类完成基因组测序后,第一次将认识DNA一维序列高度提升到三维水平,开启了三维基因组研究的大门。



3C技术只能用于单一位点与可能的调控位点的研究,随microarray 和二代测序的发展,使得同时鉴定多条序列成为可能。赵志虎老师对3C技术进行一步巧妙地改造而发明了4C技术(Chromosome conformation circular capture)。4C在3C文库的基础上利用4碱基酶进行酶切,再次连接,使得部分3C文库形成环形分子,环形分子一个最大的优点在于可以通过在特定片段的两侧设计反向引物进行PCR扩增和测序,可发掘出特定分子所有互作元件,该技术被广泛应用于鉴定特定基因的全基因组互作功能元件。

Dekker 实验室一直矢志于研究一种方法用来获得染色体全局的高级构象,但囿于早期测序成本的问题,对全基因组大规模的测序并不是一个普通实验室可以承担的。因此,他将短期目标放在对染色体区域性互作上,他们在3C实验的基础上,对长达数Mb的DNA设计多条引物,通过PCR反应,用来鉴定酶切片段间互作的关系,这一技术首次获得了在数十Mb范围内互作调控关系,为科学界认识基因组全局性互作关系打开了一扇门。但是由于引物设计的难度及成本及后续的Hi-C技术限制了该技术的进一步发展。

随着3C、4C、5C技术的开发,人们已经逐步认识到高级构象对基因组表达调控的重要性,也极大推动了该领域的发展,如何研发出一项技术,使之实现基因组全局性互作图谱的绘制成为了炙手可热的课题。



2009年,Dekker实验室的Erez Lieberman-Aiden开创性利用在酶切片段的粘性末端进行末端补平时添加生物素的方法,再通过生物素和链亲和素的特异性结合富集携带生物素的嵌合分子,再通过二代测序的方法,鉴定出全基因组范围的互作关系。

Hi-C技术的成功研发,极大地促进了染色质高级构象的研究,人、鼠、酵母、拟南芥、果蝇、大肠杆菌、水稻等一系列物种的三维结构逐步被报道,该技术不仅用研究物种全局性的高级构象,同时还可用于比较分析多样本三维构象的差异。

研究人员逐步发现,染色体内不仅存在着具有特定生物学意义的互作,还存在着大量‘本底’的互作,即没有结合特定蛋白,只是因物理距离较近而连接在一起的分子。因此在HiC文库中存在着大量这个非特异性的分子,在增加测序量的同时也使真实有效的互作淹没在数据汪洋中。

如何获得仅是特定蛋白介导的真实有意义的互作分子?阮一骏老师设想如果特定的蛋白分子如果介导了2个DNA分子的互作,就可以类似ChIP一样利用抗体将蛋白-DNA复合物富集出来,通过DNA 连接酶将DNA分子连接一段特定的接头成嵌合分子环状分子,再通过接头序列中一个特定的酶切位点进行酶切,再通过引物扩增就可将富集的片段扩增成可用于上机的文库,利用高通量测序来鉴定蛋白介导的互作分子。ChIA-PET技术几经改进,已经广泛应用于鉴定蛋白介导的染色质互作研究。



随着HiC技术的普及应用,大量的全局性互作信息被挖掘出来,但是针对某些特定的位点研究使用全局性的方法,数据利用率不高及分辨率较低的问题凸显出来,如果通过较低通量的测序获得高分辨率的局部互作信息已成为三维技术的新的发展方向。




2014年,基于探针杂家捕获的Capture-C技术被研发出来,该技术利用DNA互补配对原理,通过设计特定位点的探针,将所关心区域的互作片段进行杂交,然后再根据探针中携带的生物素进行富集。统计表明该方法可以得到数十到上百倍的片段富集,极大提高了局部区域的分辨率,利用生物信息学算法可以获得更多有统计学意义的互作。

同时,研究人员发现ChIA-PET技术实验操作难度高,且只能获得少量的interactions,因此,任兵和Howard Y Chang改变了策略,将原有先抗体富集(ChIP)再连接(‘HiC’)的方案调整为先连接(‘HiC’)再捕获(‘ChIP’),PLAC-seq/HiChIP降低了实验难度,也获得了更多的互作。



基于近距离连接反应的技术是一种间接地通过测序reads来模拟细胞核DNA分析互作关系的一门技术,连接的偏性及在模拟过程方法的误差对最终的结果会产生影响。
今年在Nature发表了一篇在单细胞核水平利用激光显微切割技术,将包裹在冰冻蔗糖中的细胞核进行切片,然后再利用片层之间的关系进行建模得到染色质三维结构,同时他们还利用该技术获得了大量多个增强子参与的互作连接。


相较于显微切割技术,今年7月份在science发表了一篇利用断层扫描电镜技术进行原位观察染色质三维结构的文章则更直接地揭示了染色质折叠并非像原有教科书讲的染色质折叠成30-120nm的螺线管,而是更多地以8-24nm直径大小存在,且结构散乱无章。



倘若将2002年Job Dekker发表3C作为三维基因组研究的真正起点,这一领域已经进入了第十五个年头,仔细想想过程中每一次技术的革新,从点(3C)到线(4C)再到面(HiC),从局部(3C,4C,5C)到整体(HiC,TCC,Micro-C)再到局部(ChIA-PET,Capture HiC,Capture C ),看似简单的一小步,似乎都包含了一次思维上的突破。随着新技术的不断发展,尤其是高分辨率显微镜技术在染色质构象中的使用,将不断给这一领域制造更多的惊喜。

毋庸置疑,在现有知识没有很好地回答是结构和生物学功能 这个“蛋” 与 “鸡” 的问题之前,似乎我们还有很长的路要走。何况我们还对 RNA是否参与了最初构象形成知之甚少。



上一篇:系统发育树(Phylogenetic tree)
下一篇:ChIPseeker数据可视化大礼包
回复

使用道具 举报

0

主题

15

帖子

215

积分

中级会员

Rank: 3Rank: 3

积分
215
QQ
发表于 2018-8-27 10:44:07 | 显示全部楼层
为什么没有人呢??梳理的很好
只是4C之后,没有介绍5C,就突然说5C,有点儿突兀。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-19 12:47 , Processed in 0.050210 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.