搜索
查看: 4010|回复: 3

泛基因组测序(学习与探究)

[复制链接]

3

主题

5

帖子

264

积分

中级会员

Rank: 3Rank: 3

积分
264
发表于 2017-8-15 11:25:02 | 显示全部楼层 |阅读模式
本帖最后由 lakeseafly 于 2017-8-15 11:30 编辑

  • 什么是泛基因组?
泛基因组(Pangenome)是近年来比较流行的一种研究方向,通过对不同品种基因组进行测序,组装,然后 将组装好的基因序列进行整合注释,进而获取这个物种全部的遗传信息并且对每一个个体间遗传变异信息进行解析。

泛基因组进而可以分为,核心基因组和可变基因组。一般来说,核心基因组控制着生命体基本生成代谢的功能。另外,可变基因是泛基因组的重点研究对象,因为可变基因组就是使个体产生不同性状(抗病性,抗寒性等)的原因。最近,BGI还发表了一篇关于人的泛基因组的文章,有兴趣的同学可以参考,下面的代表文献。


  • 为什么我们要开展泛基因组测序?
首先,最重要的原因。在漫长的进化过程中,由于地域因素,环境因素等的影响,每个个体都形成了极其特别的遗传性状,单一个体的基因组已经不能涵盖这个物种的所有遗传信息了,另外一个原因,由于基因测序变得更加廉价,为近年来火爆的泛基因组的研究提供了可能性。

  • 技术原理


目前比较流行的研究方法与三种:下面分别介绍其中两种(因为K-mer based method 与 De novo assembly的method本质是一样的)

De novo assembly method:


分别对多个个体进行,De novo assembly,然后将所得的每个个体的assembly与reference基因组mapping,找出不同unmapped的区域,再进行进一步的assembly,然后注释。此方法需要更多的电脑资源,因为需要对每一个个体进行de novo assembly,然后还需要whole genome alignment。

Iterative assembly method:


相当于一种迭代的方式,将每一个种系map to reference,然后找出unmapped的部分进行assembly,得到新的基因序列进而扩展原有的reference。一步一步这样迭代,直到所有的种系都处理完。最后建立起的泛基因组,再进行注释。这种方法,相对需要更少电脑资源,但是可能会产生更多的小片段。
  • 总体的流程图



参考文献:
  • Golicz, Agnieszka A., Jacqueline Batley, and David Edwards. "Towards plant pangenomics." Plant biotechnology journal 14.4 (2016): 1099-1105.
  • Golicz, Agnieszka A., et al. "The pangenome of an agronomically important crop plant Brassica oleracea." Nature communications 7 (2016): 13390.

代表文献:
  • Li, Ying-hui, et al. "De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits." Nature Biotechnology32.10 (2014): 1045-1052.
  • Maretty, Lasse, et al. "Sequencing and de novo assembly of 150 genomes from Denmark as a population reference." Nature (2017).

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:转录组入门(7-8)从差异基因到富集分析
下一篇:转录组入门——6
回复

使用道具 举报

2

主题

16

帖子

147

积分

注册会员

Rank: 2

积分
147
发表于 2017-8-20 21:10:14 | 显示全部楼层
也就是说能更好地比较个体和群体的差异了,那么这个和SNP有什么出入吗?
回复 支持 反对

使用道具 举报

3

主题

5

帖子

264

积分

中级会员

Rank: 3Rank: 3

积分
264
 楼主| 发表于 2017-8-24 09:18:21 | 显示全部楼层
本帖最后由 lakeseafly 于 2017-9-13 17:37 编辑
hwoihann 发表于 2017-8-20 21:10
也就是说能更好地比较个体和群体的差异了,那么这个和SNP有什么出入吗?

这个问题非常好,我也需要补充一下这方面的知识点,pangenome 对snp call有着很重要的作用,可以说利用pangenome进行snp calling,是它最大的应用。

我总结为大概以下几点:
首先:对比单一的reference基因,可以有效提高可发现的snps数量
第二:用pangenome 去calling snps 意味着你可以节省很多电脑资源和分析时间。(正常snap calling需要比对到不同的个体上,但如果通过pangenome去calling snps,就可以一步到位,因为这个pangenome 相当于所有个体的集合。)另外,这也意味着,你得出的snps 组不需要整合(传统的snp calling需要整合,因为需要比对到不同个体上)
第三:利用pangenome calling snps,还有一个好处就是,因为pangenome 包括了一步presence/absence variations 的分析,我们可以区别出这种snp是属于核心基因的,还是属于可变基因的。然后,再结合你表现型的数据,这对利用snp提高农作物产量是很有意义的。

下面是一篇review paper:重点讲述了如何应用pangenome 进行snp的发现。

Hurgobin, Bhavna, and David Edwards. "SNP Discovery Using a Pangenome: Has the Single Reference Approach Become Obsolete?." Biology 6.1 (2017): 21.
回复 支持 反对

使用道具 举报

2

主题

16

帖子

147

积分

注册会员

Rank: 2

积分
147
发表于 2017-9-13 13:00:28 | 显示全部楼层
lakeseafly 发表于 2017-8-24 09:18
这个问题非常好,我也需要补充一下这方面的知识点,pangenome 对snap call有着很重要的作用,可以说利用p ...

这么一看还是挺有趣的,多谢回答
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-22 15:07 , Processed in 0.032211 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.