搜索
12
返回列表 发新帖
楼主: shuboy

进化转录组流程

[复制链接]

11

主题

50

帖子

275

积分

版主

Rank: 7Rank: 7Rank: 7

积分
275
发表于 2016-10-18 22:33:30 | 显示全部楼层
shuboy 发表于 2016-10-15 15:03
我现在学习的也不是很深入,用的也是transdecoder,这个应该是以六种读码框分别翻译成蛋白质,然后选取OR ...

噢。握个爪子
回复 支持 反对

使用道具 举报

0

主题

3

帖子

48

积分

新手上路

Rank: 1

积分
48
发表于 2017-1-31 12:18:05 | 显示全部楼层
Mint 发表于 2016-10-14 22:42
学习了,想问下你预测ORF用的是?我曾经用transdecor预测ORF,但是基因的LOCI都是从每条染色体0开始数起, ...

可以尝试一下EMBOSS中的getorf脚本,使用起来很方便
回复 支持 反对

使用道具 举报

0

主题

3

帖子

48

积分

新手上路

Rank: 1

积分
48
发表于 2017-1-31 12:22:58 | 显示全部楼层
InParanoid貌似只可以找两个物种间的直系同源基因,要是做大的类群的系统发育关系,orthomcl和HaMStR用的多一点。对应InParanoid好想有个叫multiParanoid的软件可以用。
回复 支持 反对

使用道具 举报

0

主题

3

帖子

48

积分

新手上路

Rank: 1

积分
48
发表于 2017-1-31 12:23:48 | 显示全部楼层
sunshine-girl 发表于 2016-10-11 11:26
恩,谢谢。群主的的教程找到了,你需要吗?

麻烦分享学习一下
回复 支持 反对

使用道具 举报

5

主题

26

帖子

284

积分

中级会员

Rank: 3Rank: 3

积分
284
发表于 2017-3-26 16:12:29 | 显示全部楼层
本帖最后由 公子不要脸 于 2017-10-5 16:03 编辑

现在分析到Trinity组装结果出来了,但是接下里,按照文章里的说法是要删除一部分高度相似的序列,这个功能可以用哪一些软件来做呢?后面开始预测低拷贝基因来进行建树~这一部分,低拷贝基因和文里说道的unigene有什么关系吗?(原谅转专业的白痴问题)
回复 支持 反对

使用道具 举报

7

主题

32

帖子

228

积分

版主

Rank: 7Rank: 7Rank: 7

积分
228
 楼主| 发表于 2018-5-14 10:50:55 | 显示全部楼层
公子不要脸 发表于 2017-3-26 16:12
现在分析到Trinity组装结果出来了,但是接下里,按照文章里的说法是要删除一部分高度相似的序列,这个功能 ...

抱歉,好久没来,不知道你的问题解决没有。
去冗余一般用CDHIT软件,也有的直接选取组装得到转录本中最长的一条作为unigene。
unigene 默认是去完冗余以后保留的唯一转录本,而低拷贝基因一般来说是用这些unigene进行同源基因预测(orthomcl软件等)后,得到每个物种里面只有一条序列的group,称为低拷贝基因。之所以这样做,是因为这是转录组,尽管是每个物种只有一条序列的group,你也不能说是单拷贝。
希望对你有帮助,欢迎继续讨论。
“Nothing in Biology Makes Sense Except in the Light of Evolution”  --Theodosius Dobzhansky
回复 支持 反对

使用道具 举报

7

主题

37

帖子

412

积分

中级会员

Rank: 3Rank: 3

积分
412
发表于 2018-5-17 09:40:15 | 显示全部楼层
你好,直系同源基因能用脚本来提取吗 ?EvolMarkers: a database for mining exon and intron markers for evolution, ecology and conservation studies: EVOLMARKERS: MINING EXON AND INTRON MARKERS   这篇文献就是通过参考基因组来提取exon
回复 支持 反对

使用道具 举报

5

主题

26

帖子

284

积分

中级会员

Rank: 3Rank: 3

积分
284
发表于 2018-5-20 14:58:57 | 显示全部楼层
shuboy 发表于 2018-5-14 10:50
抱歉,好久没来,不知道你的问题解决没有。
去冗余一般用CDHIT软件,也有的直接选取组装得到转录本中最长 ...

额,现在其实流程已经走完了,但是还是有这么几个问题还想请教一下:
1、cd-hit 一般使用多少的相似性,是默认的0.9还是大家一般有其它常用的值?
2、hamstr 的输入文件只接受一个文件,如果有很多类群要找低拷贝,是把序列都集合到一个文件里面吗?
先谢谢大佬指导~
回复 支持 反对

使用道具 举报

7

主题

32

帖子

228

积分

版主

Rank: 7Rank: 7Rank: 7

积分
228
 楼主| 发表于 2018-9-7 17:38:39 | 显示全部楼层
xiao7462 发表于 2018-5-17 09:40
你好,直系同源基因能用脚本来提取吗 ?EvolMarkers: a database for mining exon and intron markers for  ...

这个我还不清楚,一般直系同源的分析都是需要blast比对,还是主要遵循“相似即同源”的原理
“Nothing in Biology Makes Sense Except in the Light of Evolution”  --Theodosius Dobzhansky
回复 支持 反对

使用道具 举报

7

主题

32

帖子

228

积分

版主

Rank: 7Rank: 7Rank: 7

积分
228
 楼主| 发表于 2018-9-7 17:41:31 | 显示全部楼层
公子不要脸 发表于 2018-5-20 14:58
额,现在其实流程已经走完了,但是还是有这么几个问题还想请教一下:
1、cd-hit 一般使用多少的相似性, ...

1, 主要还是看你自己的数据吧,如果设置的太高,直接去没了,太低去不干净。可以用0.95或0.98
2,这个软件我没用过
“Nothing in Biology Makes Sense Except in the Light of Evolution”  --Theodosius Dobzhansky
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-2-19 03:31 , Processed in 0.097556 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.