搜索
查看: 2766|回复: 0

Complete Genomics平台

[复制链接]

633

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-3-22 09:47:05 | 显示全部楼层 |阅读模式
随着二代测序技术在科研、临床等领域大规模推广,华大基因于2013年正式收购美国上市测序公司CG(Complete Genomics)。作为人类基因组测序的创新领导者,CG以其卓越的测序质量、超高的变异检测准确性和灵敏性赢得了市场青睐。同时,不断发展优化的CG纳米芯片技术、高性能的计算机系统和高通量的测序技术推动了人类基因组研究的革命。CG的目标是将独特的具有创新意义的技术和信息分析方法应用于临床医学和科研的各个领域,从而使几年前昂贵的测序技术深入到医院、科研院校乃至有需要的个体人群成为可能。在人类全基因组重测序的基础上,CG平台现已推出人外显子组测序和临床诊断服务助力您的科学研究。
技术流程
  CG平台采用了高密度DNA纳米芯片技术,在芯片上嵌入DNA纳米球,然后用复合探针-锚定分子连接(cPAL)技术来读取碱基序列,这两项技术的应用减少了试剂的消耗和成像的时间。该系统整合了文库、芯片、测序分析、仪器以及软件上的技术进步,与目前流行的第二代测序技术相比,此建库和测序方法能在消耗更少试剂的前提下获得更多的数据。以人全基因组测序的工作流程举例(图1)(人外显子测序流程会稍有不同,请参考我们的官网)。
图1. CG测序技术
1. 文库构建:DNA纳米球(DNB)芯片制备
  CG平台的DNA文库由DNA片段和两个接头组成 (图2)。测试时接头作为读取起始位点,可从DNA-接头连接处每次最多读取10个连续碱基。 两接头的方法可支持52 bp的读长(每边26 bp)。
图2. 两接头文库构建流程
  然后单链环状DNA分子通过滚环复制,形成一个包含200多个拷贝的DNA纳米球(DNB)(图3)。1ml反应液可产生超过109个DNB,足够一个完整的人类基因组测序。
图3. DNA纳米球形成示意图
  将建库得到的DNBs采用高密度DNA纳米芯片技术,加到芯片上的网状小孔内,每个小孔只能容纳一个DNA纳米球(当一个DNB结合到芯片上的小孔后,会排斥其他DNB的结合)(图4),DNA纳米芯片的占用量超过90%,每一个制备好的芯片可容纳1800亿个碱基用于成像。

图4. DNA纳米球芯片制备
2. 测序:组合探针锚定连接法(cPALTM)
  cPAL 利用四种不同颜色标记的探针去读取接头附近的碱基,每次最多读取10个连续碱基且每次测序是相互独立的,即测序结果不受前一个碱基测序结果的影响,因此不会发生错误累积的现象,测序结果精准性高。在测序时,加入anchor 与接头互补配对,然后DNA连接酶将四种不同颜色标记的探针结合到模板的相应碱基上,通过对荧光基团的成像来判断碱基类型(图5)。cPAL技术的另一个优势是采用了非连续、非连锁联合探针锚定连接技术来读取碱基可大大减少探针和酶的浓度;与边合成边测序不同, cPAL每个cycle可一次性读取数个碱基,这样消耗的测序试剂和成像时间都大大减少。
图5. 复合探针-锚定分子连接 (cPALTM)
3. 完善的数据分析和挖掘方案
  CG测序平台配套的自动化信息分析系统能够通过自动化数据传输和分析来处理CG测序仪的下机数据,包含碱基读取、数据比对、组装和分析软件,可以迅速将数十亿的序列组装成基因组,灵敏准确地检测和注释各种变异类型,包括SNPs, InDels, CNVs, SVs, 和mobile element insertions (MEIs)。

比对和组装
  采用局部从头拼接(local de novo)技术,可精确检测等位基因杂合子突变,灵敏性高,这种从头拼接的方法由CG开创。另外这种合成方法使得其可以在独立的位置上识别两个等位基因,这就使得它可以在两个等位基因与参照均不一致的情况下进行复杂的识别。
  • 首先将测序得到的序列比对到参考序列上;
  • 局部组装,将与参考序列有差异的区域进行组装;
  • 将最终的组装序列与参考序列比较,检测各种类型的变异。

数据分析
  我们针对CG的下机数据专门开发了一套信息分析工具。我们不仅提供专有的分析报告,客户还可以根据自己的科研需求进行个性化分析。相关的几个主要公共数据库简介如下:
  • RefSeq:NCBI 筛选过的非冗余数据库,可提供变异的功能注释;
  • miRBase:microRNA序列数据库,提供包括miRNA序列数据、注释、预测基因靶标等信息的全方位数据库,是存储miRNA信息最主要的公共数据库之一;
  • COSMIC:体细胞突变数据库,用来检测肿瘤样本中的变异;
  • dbSNP:单核苷酸多态性数据库,可检测SNP突变;
  • DGV (Database of Genomic Variants):可注释CNV。

  为了比较基于CG平台与Illumina平台的变异检测结果的准确性,2012年发表在Nature biotechnology上的文章结果显示Illumina和CG平台一致性位点有3,295,023 个(88.1%)。Illumina特异性的位点是345,100个,CG平台特异性位点是99,578个。利用Sanger测序随机验证,挑选的20个一致性位点全部得到验证,15个Illumina特异性的位点验证到2个,18个CG特异性位点验证了17个,反应CG平台特异性SNPs位点较Illumina具有更高的准确性(图6)。
图6.不同平台间SNV变异检测的比较

CG文章列举:

1. Genome sequencing identifies major causes of severe intellectual disability. Christian Gilissen et al. Nature(2014) doi:10.1038/nature13394

2.   Truncating mutations of MAGEL2 cause Prader-Willi phenotypes and autism.Christian P Schaaf et al.Nature Genetics (2013) 45, 1405–1408

3.   Evolutionary History and Adaptation from High-Coverage Whole-Genome Sequences of Diverse African Hunter-Gatherers. Joseph Lachance et al. Cell (2012) 150, 457–469

4.  Optimized filtering reduces the error rate in detecting genomic variants by short-read sequencing. Joke Reumers et al. Nature Biotechnology (2012) 30, 61–68

5.  Accurate Whole-Genome Sequencing and Haplotyping from 10 to 20 Human Cells. Nature. 2012 Jul 11;487(7406):190-5.

6.  The Mutation Spectrum Revealed by Paired Genome Sequences from a Lung Cancer Patient.Nature. 2010 May 27;465(7297):473-7.

7.  Computational Techniques for Human Genome Resequencing Using Mated Gapped Reads. J Comput Biol. 2012 Mar;19(3):279-92.  

8.  Sequencing of Neuroblastoma Identifies Chromothripsis and Defects in Neuritogenesis Genes.Nature. 2012 Feb 22;483(7391):589-93.   

9.  Analysis of Genetic Inheritance in a Family Quartet by Whole-Genome Sequencing. Jared C. Roach et al.Science (2010) p636-639.




上一篇:DEXSeq使用说明(1/3)
下一篇:一些分子标记可以直接对应植物的性状
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-12-6 12:23 , Processed in 0.044694 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.