搜索
查看: 682|回复: 0

基因组de novo组装的5种gap

[复制链接]

608

主题

1072

帖子

3571

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3571
发表于 2016-10-5 11:17:07 | 显示全部楼层 |阅读模式
看了一篇综述,分享一下读书笔记吧~

文章中提到了5Gap:
1,测序覆盖度较低而导致某些区域未能覆盖以前克隆步移(clone by clone)的方法测序成本高,会有这样的问题。目前主流的大规模平行测序技术(massiveparallel sequencing,MPS) 方法可以尽可能的达到高深度测序,但是技术本身的局限会造成GCAT富集区的序列缺失
2, 片段重复导致的; 目前人基因组版本中至少三分之一的gaps都是这一类型,特别是长的高度相似的片段重复,目前仍然没有好的方法来拼接。
3, 微卫星序列造成的gaps这些短串联重复序列很难用现有的拼接策略克服,虽然最近采用单分子测序技术补上了约80%的低于10kb的微卫星gaps,现有基因组版本中仍然没有包含着丝粒、端粒和其他异染色体区序列,原因就是这些区域大量的微卫星序列的存在。
4, 沉默的gapsmuted gaps,这类gaps主要是因为拼接的错误导致的,也有一部分是在基于克隆的测序过程中,由于这些序列对细菌有毒性而无法扩增而产生的。
5, 等位序列变异导致的。人基因组有一些区域的等位序列是高度变异的,比如HLA区和17q21.31区域,这些多变的等位序列导致拼接软件认为是重复序列而终止.
高质量完整基因组序列对理解遗传疾病和精准医学有着非常重要的意义,作者列举出了几个例子:一些由于高GC、微卫星序列或者重复序列而导致的一些和遗传疾病相关的基因无法被正确测序和检测的,如MCKD1/MUCI/KCNJ18等等,然后作者展望了几个改进基因组gap的方法,主要是测序方法及测序技术的更新。
参考文献:Genetic variationand the de novo assembly of human genomes. Mark J.P. Chaisson, Richard K.Wilson and EvanE. Eichler. Nature Reviews Genetics.2015.doi:10.1038/nrg3933





上一篇:交换各种培训班资料
下一篇:二代测序的图象处理和碱基识别
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|关于我们|手机版|小黑屋|生信技能树    

GMT+8, 2017-6-27 20:06 , Processed in 0.029910 second(s), 33 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.