搜索
查看: 2541|回复: 0

基因变异常用数据库一览表

[复制链接]

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
发表于 2017-9-4 14:49:59 | 显示全部楼层 |阅读模式
文献和数据库的使用

对于文献就不用说了,通过查阅文献获取基因、疾病等信息。
数据库,通俗的理解就是将那些信息放在一起呗!目前免费的、不免费的数据库为我们提供了很大的便利,不用再一篇一篇文献去看,去提取信息,或者有些信息并未发表文章,上传到数据库大家共享,想必也是极好的。


先说一个数据库,大家应该比较常用,即PubMed,就是这个数据库收录了很多文献,可以方便读者查阅,基因变异数据库则是存储了基因、变异、疾病等信息,可以更好的查阅。下图为PubMed数据库界面(不过话说我一般不怎么用,一般用Google学术,因为有些文献它搜不到)




注意:通过数据库对信息收集需要非常小心。
以下为常用数据库的列表,有些数据库的内容会有所交叉,不过每一个都有自己的特点。

表:人群、疾病和序列数据库   


人群数据库
Exome Aggregation Consortium
http://exac.broadinstitute.org/
本库汇总了60,706个无血缘关系的个体完整外显子序列,其中不包括儿科疾病样本。
Exome Variant Server
http://evs.gs.washington.edu/EVS
本库主要包含欧洲人和非裔美国人外显子序列变异信息。
1000 Genomes Project
http://browser.1000genomes.org
本库包含26个人群遗传变异信息,这些数据既有高覆盖率和低覆盖率的基因组信息,也有靶向序列捕获信息,相比Exome Variant Server,数据更加丰富和多样,但是也存在低质量数据问题,另外部分研究中,样本人群可能存在血缘关系。
dbSNP
http://www.ncbi.nlm.nih.gov/snp
本库主要收录短片段遗传变异数据(≤50bp),数据来源多样,有些数据缺乏详细的原始研究资料,另外还包含一些致病性变异位点。
dbVar
http://www.ncbi.nlm.nih.gov/dbvar
该数据库主要为结构变异信息(>50bp),数据来源多样。
疾病数据库
ClinVar
http://www.ncbi.nlm.nih.gov/clinvar
本库主要包含临床表型与遗传变异相关性信息,并对变异的临床相关性进行了评级。
OMIM
http://www.omim.org
本数据库涵盖丰富详细的人类基因遗传信息,并且收录了一些典型的疾病遗传相关性样本研究信息。
Human Gene Mutation Database
http://www.hgmd.org
本数据库主要为已文献发表的变异注释,且为付费使用。
Locus/disease/ethnic/other-specific databases Human Genome Variation Society
http://www.hgvs.org/dblist/dblist.html
这个站点开发了上千数据库,提供人类特定位点变异注释,大部分数据库在Leiden Open Variation Database system
Leiden Open Variation Database
http://www.lovd.nl

DECIPHER
http://decipher.sanger.ac.uk
本库分子细胞遗传学数据库,主要为医生和研究者提供临床表型与基因芯片相关性信息。
序列数据库
NCBI Genome
http://www.ncbi.nlm.nih.gov/genome
人类基因组参考序列
RefSeqGene
http://www.ncbi.nlm.nih.gov/refseq/rsg
医学相关的基因参考序列
Locus Reference Genomic (LRG)
http://www.lrg-sequence.org

MitoMap
http://www.mitomap.org/MITOMAP/HumanMitoSeq
人类线粒体DNA参考序列



人群数据库介绍
特点及优点:可以获得大样本人群中的变异频率;不仅包括健康个体的变异还包括致病变异。
缺点:不包括变异功能注释或者相关表型(其实这个缺点就可以通过疾病数据库来弥补)。
注意事项:
是健康队列还是疾病队列?(研究对象是健康人群和疾病人群,得到的结果绝对不一样)
家系中是否包括多个个体?(如果多于一个,则数据不离散,不够随机)
研究对象的年龄范围是什么?(比如白血病分儿童和成人,是不一样的)

小编按:总的来说,感觉这个要求挺高的,不过如果用于临床是非常有必要的,就像前几天讲的关于乳腺癌的研究,需要根据年龄,不同亚型、种族分类探讨(回复12阅读)

举个栗子,在Exome Aggregation Consortium中搜索BRCA1,可以查到在人群中的频率,也会展示不同人群的频率,如图所示




疾病数据库介绍
特点及优点:包含患病者的变异和关于致病变异的评价。
缺点:变异经常被错误分类,包含已发表文献中的错误论断,主要是因为这些数据库没有执行评审。不过ClinVar是有的,后边作者对这个数据库可是大肆表扬啊!如图




当使用疾病数据库时,临床实验室应该注意以下问题:
  1.   数据库更新频率,是否支持数据管理以及采用什么方法支持管理。


  2. 是否使用HGVS命名和是否使用参考基因组组装和转录本用以变异命名(具体可参考上期讲解,回复13)。
  3. 哪些数据是经过验证的,例如是否是低通过率(low-pass)的二代测序,或者是否经过sanger验证。评价数据的质量可能需要读一些已发表的文献。
  4. 数据的来源是什么和是否数据来源之间不存在依赖关系。

对于变异评价,也应该包括文献检索,需要注意的事项如下所示:
  1.  尤其要小心那些使用较老的命名规则和分类的文献,也要注意那些只基于一个观察报告而来的变异。
  2. 当鉴定一个个体和家系中的一个变异和表型时,要注意是如何确定患者的。
因为患者和相关个体可能对被多篇文献报道,这些报道可能作者有交叉,或者有相关合作,或者一个家庭成员被不同的临床系统随访,这样会导致变异频率有一定的提高。
鉴定的方法就是:看作者是否有交叉,且发表单位是否一样。

对于临床实验室的要求
  1. 实验室应该有自己的一套系统,这样当每一个基因和临床论断的序列变异报道时,都可以跟踪到。
  2. 鼓励大家对一些变异数据库做贡献,比如ClinVar,这数据库包括临床论断和变异分类,帮助大家更好的理解变异,很不错的一个数据库。


  3. 只要可能,提供的临床信息应该遵循隐私权,依照Health Insurance Portability and Accountability Act regulations。
  4. 临床实验室可合作提供临床信息,这样可以更好的理解基因型如何影响临床表型,去解决不同实验室的不同。(期待这一天的到来!)
  5.  标准化将会更加容易获得最新更新的信息和促进临床实验室提交的信息。例如,ClinVar数据库存储变异和论断,并且有审核状态跟踪展示,确保每一步质量管理是透明的。

原文献:
Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology.



上一篇:如何写出一篇完美的临床基因检测报告?
下一篇:求指导安装EMBOSS
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-20 19:23 , Processed in 0.030430 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.