搜索
查看: 2354|回复: 0

翻译-NIH负责的roadmap计划

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2016-9-11 10:36:30 | 显示全部楼层 |阅读模式
The NIH Roadmap Epigenomics Mapping Consortium - NCBI
www.ncbi.nlm.nih.gov › NCBI › Literature › PubMed Central (PMC)
作者:BE Bernstein - ‎2010 - ‎被引用次数:565 - ‎相关文章
Here we describe the aims and scope of the US National Institutes of Health (NIH) Roadmap Epigenomics Mapping Consortium, which has set out to provide a ...
下面是总结性的译文:

近些年,我们对human genetics的理解有着显著的加深,得益于人类基因组计划的成功和高通量测序技术的发展。但仅仅是探索DNA序列方面的特征无法解决 human biology的一些核心问题,比如,一个人的同一套基因组是如何通过发育分化,产生超过200种大不一样的细胞及组织类型的。而这一生命过程的重点就在于epigenesis,它调控基因表达的功能已经广为人知了。
genomic DNA在细胞体内被组装成chromatin结构是非常值得探究的现象,chromatin 包括 DNA binding factors, accessory protein complexes and noncoding RNAs ,是高度动态变化的,染色质上面的DNA和蛋白质都是可以修饰的,epigenome 一词通常被用来描述 chromatin的各个组分是如何被修饰的,结构和功能发生了何种的变化。它们的变化构成了epigenomic landscapes,有transcription factors, chromatin regulators, histone modifications and variants, and RNAs这5个研究热点,而且到目前为止,在哺乳动物内研究都很缺乏。

尽管具体机制还是很模糊的,但大量研究证据表明 epigenomic changes是跟disease susceptibility and pathogenesis 有关系的。很多疾病发生发展,尤其是癌症,跟  the patterns of chromatin, DNA methylation and gene expression 的改变关系密切。
由于高通量测序技术的发展,大量的epigenomic features  已经很容易被研究了,可以产生全基因组范围的 cytosine methylation, histone modifications, chromatin accessibility and RNA transcripts  数据,能够在感兴趣的特定的细胞系内系统性的描述基因组的调控状态,数据分析的结果可以定位很多调控功能元件的位置以及它们的激活状态,包括 genes and their transcriptional control elements (e.g., promoters, enhancers and insulators), noncoding transcripts and epigenetic effectors, such as imprinting control regions。
这里不得不提的就是NIH host的roadmap 计划,该计划开始于2008年,目标是产出大量关于stem cells and primary ex vivo tissues 的表观遗传学数据,包括DNA methylation, histone modifications and related chromatin features,同时为 human development, diversity and disease 的研究提供参考表观遗传学数据。下面,我们将从组织形式,目标,以及待克服的困难,这3个方面来描述roadmap计划!

epigenomic landscape 的组织特异性和个体差异性非常强,所以是不可能有单独的一个参考表观基因组的。roadmap联盟希望能从不同的组织以及个体收集样本,并产出一系列的正常的参考表观基因组。联盟主要将集中于4种数据: DNA methylation, histone modifications, chromatin accessibility and RNA transcripts , 样本就来源于 stem cells and primary ex vivo tissues  。但即使是有了这些数据,仍然是不够的,从raw sequence data 到profiles of epigenomic features 还有很长一段路有走,给了数据不会合理利用和解释,也是白瞎。更别说还要整合多种数据了,所以roadmap联盟除了要host这些raw data 外,还要复杂 标准化分析流程,包括实验的 protocols,还要 抗体试剂的评价等,达到最大化的利用,整合所产出的数据。

epigenomic features 的选择
epigenomic features 是很复杂的,但是本roadmap联盟主要将集中于4种数据:DNA methylation, histone modifications, chromatin accessibility and RNA expression。The Epigenomics Mapping Centers已经建立好一些数据收集已经分析的pipelines,包括产出高质量的测序数据,以及综合性的表观基因组图。Mapping Centers 将会和 Data Analysis and Coordination Center  通力合作,一起完成对上面4种数据的评价,比较和整合,来保证数据质量和标准,这样全世界各地的其它组织才能更好的利用这些数据。
第一种数据就是 DNA methylation ,现在主要有3种测序手段,包括 BS-seq,MeDIP-seq和 MRE-seq
第二种数据就是 histone modifications,主要靠CHIP-seq啦
第三种数据就是 chromatin accessibility,主要是DNase-seq
第四种数据就是 RNA expression,这个就是mRNA-seq啦,也有少量的smallRNA-seq

考虑到现在主要研究的细胞系就有上百种,我们受到的资助也有限,我们必须要在细胞系种类的覆盖程度,测序深度已经数据种类方面做出平衡。部分有着非常高的研究价值的细胞系,比如 human embryonic stem cells (hESCs) 我们会重点关注,进行超深度测序,也会测到一系列的 histone modifications种类,DNA methylation也会做到单碱基的分辨率。但是对其它大部分细胞系,我们会优先做到6个核心的组蛋白修饰数据,包括(H3K4me1, H3K4me3, H3K9me3, H3K9ac, H3K27me3 and H3K36me3),其余的组蛋白修饰,看看情况咯。至于chromatin accessibility and RNA expression数据我们肯定会做的啦。

接下来我们看看 cells and tissues的优先级的选择。
我们挑选的能进入roadmap计划的细胞系主要基于broad scientific and biomedical interest, tractability, phenotypic diversity 来考虑,入选的有hESCs and major lineage derivatives  , 还有 primary cells and tissues relevant to metabolic and cardiovascular disease, cancer, neuropsychiatric disease, aging and other leading health issues.还要Prioritized cell types include sorted hematopoietic lineages, liver, muscle and adipose, as well as selected cell types from breast and neural tissues.还包括fetal tissues用来探索早期发育过程中的epigenomic landscapes 。之所以集中探究这些cellline,是因为目前科研界大部分数据本身就来源于 either transformed cell lines or cultured cells。总的来说,profiles for these diverse cell models 是可以offer unprecedented insight into the breadth and dynamics of human epigenomes, 对以后人类疾病在表观遗传学方面的探索是很有帮助的。

数据的整合分享:
所有数据均可下载,从 raw sequencing data 到我们处理好的 epigenomic profiles,我们已经提供好了一个非常好的数据access  portal:
The primary web portal for the consortium (http://www.roadmapepigenomics.org/)
The portal links to companion sites managed by NCBI (http://www.ncbi.nlm.nih.gov/geo/roadmap/epigenomics/)
and the Data Analysis and Coordination Center (http://www.epigenome atlas.org/)

roadmap联盟将会开发一系列软件工具和算法来更好的挖掘这些数据背后的生物学意义,包括epigenomic signatures,Chromatin state 还要or to identify distinguishing features of cell lineages, developmental stages, cellular environments or derivation history.

进展和挑战
关于前面提到的4种epigenomic features数据的实验,测序,数据分析流程我们都已经建立好了,而且数据获取的接口也做好了。roadmap联盟也已经做好了关于数据分享相关的法律法规。
Any effort of this scope inevitably faces challenges and obstacles. 现在主要的挑战在于3个方面:Cell type selection and acquisition,Standardization of assays,还有Data integration and dissemination。
细胞系的选择和获取是一个长期存在的挑战,理论是来讲,是否选择某个细胞系进入roadmap计划,是基于pervasive biological and medical importance。但理论实施起来总会有困难的,比如某些具有非常高研究价值的primary tissues的样品制备和获取并不简单。而且,本身某些组织里面的细胞类型就比较复杂,想把它们分离开来不是很容易的事情。而且,对一个指定的 tissue type 我们需要需要分析多大的样品量才能得到一个有代表性的参考epigenomic maps呢?解决这些问题,我们的很多技术本身就又有显著的提升。
因为高通量测序技术本身也是在持续不断的进步,我们roadmap联盟也需要不停的更新和测试自己的实验操作技术。尤其是组蛋白修饰这种实验,抗体的选择非常重要。CHIP-seq实验的准确性和特异性需要保证。对于DNA甲基化数据,不仅仅是BS-seq技术,还有很多其它新的甲基化测序技术也在出现,需要我们联盟做评价。
最后的挑战就是数据整合和分享了,(笔者:这是2008年开始的计划, 到现在都8年了,我觉得roadmap做的很差,在数据的整合和分享上面),大多数人压根就不懂这些数据,更别说数据的sensitivity, specificity and precision 。而且产生的数据也的确太多了,也太复杂了,现有的分析工具和可视化工具都有很大的局限性。开发一些新的工具或者算法来深度挖掘已有数据,或者多维整合利用并且解释这些数据也是至关重要的,而且应该多做一些workshop来宣传数据的意义。

未来和展望,我就懒得说了,这个roadmap计划做的不好。等我彻底了解该计划了回过头来看看把




上一篇:2017考研政治教程肖秀荣
下一篇:招聘平台-jobs.com持续更新bioinformatics相关工作
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-23 18:01 , Processed in 0.041370 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.