搜索
查看: 5177|回复: 19

进化转录组流程

[复制链接]

7

主题

32

帖子

220

积分

版主

Rank: 7Rank: 7Rank: 7

积分
220
发表于 2016-9-28 20:00:12 | 显示全部楼层 |阅读模式
本帖最后由 shuboy 于 2016-9-28 20:05 编辑

####最近一直在学习进化转录组#确切一点来说就是系统发育转录组学(phylotranscriptomic)
在这里整理一下大致的流程,也看看自己学了多少,欢迎大家交流指正!
              ###注意###注意###注意###
我只是介绍一下大致流程,详细内容以后再一步一步整理
              #####################

系统发育转录组学:指运用高通量测序技术获得不同物种的转录组数据,结合系统发育学(phylogenetic)来重建物种之间的进化历史的新兴学科。相比较phylogenetic,其数据量更丰富,而与phylogenomic相比,更加便宜,所以可行性比较好。(以上都是本人理解,如有错误,欢迎讨论)

~~~~~~~~~~~我是分割线~~~~~~~~~~~~~

流程简介:

1.收集样品样品的收集主要看你的研究问题,基本策略和phylogenetic类似。(研究啥你就收集啥,最好完全覆盖研究内容,并选取较近物种为外类群)

2.提RNA,测序,质控,过滤...
这部分知识和其他转录组一样,我就不班门弄斧了!也说的不是很明白

3.组装(有参or无参)
我做的是没有参考基因组的,因此,只能是de novo 组装了,我选的是trinity软件,具体使用网上也有很多资源,如(http://fhqdddddd.blog.163.com/bl ... 154201352402914706/

4.筛选unigene(由于后续要做phylogenetic,所以筛一下。如果做表达量差异,貌似不用筛)
目前用的比较多得软件是cd-hit(http://weizhongli-lab.org/cd-hit/)好像是一个中国人做的,为了支持国产,于是我也用了!可能是还没能完全参透,有点坑!
还有一种方法是直接在trinity组装结果中,同一group直接选取最长的。

5.预测ORF,功能注释
这部分主要是拿筛选的unigene来做,预测到ORF的进行功能注释,没预测到的也拿来注释一下。
~~~~~~~~~~以上基本和其他转录组学分析差不太多~~~~~~~~~~~~~~

6.筛选直系同源基因orthologous
我觉得整个分析中,这一步非常重要!这里有好几个重要的概念:直系同源,旁系同源,同源性,相似性等等!!!
目前这方面也有很多软件:InParanoid;orthomcl;PhyloTreePruner;HaMStR等等,这些目前都有人用,具体谁更好,可能需要更深入的学习,我也没完全掌握!

7.系统发育分析
这一步相对来说比较成熟了,毕竟phylogenetic发展很久了。获得基因矩阵matrix后,(以前我做少数几个基因的时候一般都会用modeltest来检测数据模型,但是在转录组数据相关的文章一般都没见到有这个,估计是数据量太大,做不出来)就是选择建树方法重建进化历史了!

8.选择压力
选择压力分析最出名的莫过于杨子恒老师的PAML了,大家有兴趣可以好好研究研究,只不过这些算法对于我这样没有数学基础的白菜来说,看的快吐血了,但是操作上不是很难。但是我想说的是不懂原理,操作都是没有灵魂的
当然还有一些其他的软件:比如章张老师他们的KaKs_Calculator

9.分歧时间估计
目前没怎么关注,它主要还是借助分子钟的思想,认为进化速率在不变,从而估计进化时间。因为现在中性理论认为物种演化过程中,大部分的碱基突变都是中性的,受选择的基因很少,物种进化是中性突变随机漂变造成的。所以现在做进化研究,一般都会分析一下大致的演化时间。

10.其他
其他有些研究也会考虑表达量等因素,继续深入研究特定基因的功能,及分子进化相关的内容。

~~~额,以上就是本人根据自己的理解及实践,一字一句敲出来的分析流程,希望能有参考价值,也希望大家多和我交流~~~
最后引用一句名言,愿做进化的人共勉!

“Nothing in Biology Makes Sense Except in the Light of Evolution”  
                                                                                     --Theodosius Dobzhansky






上一篇:Linux命令行下如何备份到百度网盘?
下一篇:ENCODE计划中enhance和promoter的确定-文献辑
“Nothing in Biology Makes Sense Except in the Light of Evolution”  --Theodosius Dobzhansky
回复

使用道具 举报

634

主题

1180

帖子

4008

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4008
发表于 2016-9-28 20:06:01 | 显示全部楼层
这个流程很棒,能看得出你在进化分析方面做了很长时间的工作!
看起来前五个步骤,就是转录组de novo的分析:http://www.biotrainee.com/thread-243-1-1.html
的确跟大部分文章流程差不多,后面的步骤我就没有做过了,但是InParanoid和orthomcl我用过,还写过教程
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

7

主题

32

帖子

220

积分

版主

Rank: 7Rank: 7Rank: 7

积分
220
 楼主| 发表于 2016-9-28 20:10:55 | 显示全部楼层
Jimmy 发表于 2016-9-28 20:06
这个流程很棒,能看得出你在进化分析方面做了很长时间的工作!
看起来前五个步骤,就是转录组de novo的分析 ...

后面需要更进一步学习,在和大神们交流
“Nothing in Biology Makes Sense Except in the Light of Evolution”  --Theodosius Dobzhansky
回复 支持 反对

使用道具 举报

3

主题

10

帖子

168

积分

注册会员

Rank: 2

积分
168
发表于 2016-10-10 09:18:38 | 显示全部楼层
Jimmy 发表于 2016-9-28 20:06
这个流程很棒,能看得出你在进化分析方面做了很长时间的工作!
看起来前五个步骤,就是转录组de novo的分析 ...

求分享InParanoid和orthomcl的安装使用教程吗?????
回复 支持 反对

使用道具 举报

7

主题

32

帖子

220

积分

版主

Rank: 7Rank: 7Rank: 7

积分
220
 楼主| 发表于 2016-10-10 19:25:05 | 显示全部楼层
sunshine-girl 发表于 2016-10-10 09:18
求分享InParanoid和orthomcl的安装使用教程吗?????

群主的教程我没看到,这里有一个比较详细的教程你可以看看
http://yangl.net/2015/08/11/orthomcl_install/
“Nothing in Biology Makes Sense Except in the Light of Evolution”  --Theodosius Dobzhansky
回复 支持 反对

使用道具 举报

3

主题

10

帖子

168

积分

注册会员

Rank: 2

积分
168
发表于 2016-10-11 11:26:11 | 显示全部楼层
shuboy 发表于 2016-10-10 19:25
群主的教程我没看到,这里有一个比较详细的教程你可以看看
http://yangl.net/2015/08/11/orthomcl_instal ...

恩,谢谢。群主的的教程找到了,你需要吗?
回复 支持 反对

使用道具 举报

3

主题

10

帖子

168

积分

注册会员

Rank: 2

积分
168
发表于 2016-10-11 11:27:08 | 显示全部楼层
shuboy 发表于 2016-10-10 19:25
群主的教程我没看到,这里有一个比较详细的教程你可以看看
http://yangl.net/2015/08/11/orthomcl_instal ...

你提供的而这个教程很好
回复 支持 反对

使用道具 举报

7

主题

32

帖子

220

积分

版主

Rank: 7Rank: 7Rank: 7

积分
220
 楼主| 发表于 2016-10-12 12:44:00 | 显示全部楼层
sunshine-girl 发表于 2016-10-11 11:26
恩,谢谢。群主的的教程找到了,你需要吗?

你可以一起分享在这里
“Nothing in Biology Makes Sense Except in the Light of Evolution”  --Theodosius Dobzhansky
回复 支持 反对

使用道具 举报

11

主题

50

帖子

275

积分

版主

Rank: 7Rank: 7Rank: 7

积分
275
发表于 2016-10-14 22:42:48 | 显示全部楼层
学习了,想问下你预测ORF用的是?我曾经用transdecor预测ORF,但是基因的LOCI都是从每条染色体0开始数起,后期要自己处理非常不方便,所以请教你有没有别的好软件。在此谢谢先
回复 支持 反对

使用道具 举报

7

主题

32

帖子

220

积分

版主

Rank: 7Rank: 7Rank: 7

积分
220
 楼主| 发表于 2016-10-15 15:03:45 | 显示全部楼层
Mint 发表于 2016-10-14 22:42
学习了,想问下你预测ORF用的是?我曾经用transdecor预测ORF,但是基因的LOCI都是从每条染色体0开始数起, ...

我现在学习的也不是很深入,用的也是transdecoder,这个应该是以六种读码框分别翻译成蛋白质,然后选取ORF最长的一条作为结果。
“Nothing in Biology Makes Sense Except in the Light of Evolution”  --Theodosius Dobzhansky
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2018-9-22 04:30 , Processed in 0.115832 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.