搜索
查看: 11726|回复: 10

[other] 超快速比对软件 diamond 测试结果

[复制链接]

5

主题

37

帖子

487

积分

中级会员

Rank: 3Rank: 3

积分
487
发表于 2017-5-9 15:12:50 | 显示全部楼层 |阅读模式
本帖最后由 W.Peng 于 2017-5-9 15:14 编辑

在论坛里看到一篇介绍比 blastx 快很多很多的diamond 软件介绍
然后我测试了一下diamond 软件和 blastx 的结果,两个软件的参数尽量调成了一样的。
测试数据是牛基因组的 CDS 序列 Bos_taurus.fa,其中有 26740 条序列,比对的数据库是 NR 库的 animal 分库,数据库文件 animal.fa 有 17G 大。

blastx 运行参数如下:
[mw_shl_code=bash,true]blastx -seg no -query Bos_taurus.fa -db nr_animal.fa -num_threads 8 -evalue 1e-5 -out Bos_taurus.blast.nr[/mw_shl_code]
在服务器上跑了将近两周才跑完……

diamond 也用 NR 库中的 animal.fa 先建库,然后运行参数如下:
[mw_shl_code=bash,true]diamond blastx --seg no -query Bos_taurus.fa -d nr_animal --sensitive -evalue 1e-5 -o dianomd_test.m8[/mw_shl_code]
diamond 的超快速不是吹的,软件默认自动检测可用线程数,用满了64个线程,三个小时就跑完了!

好了看看两个软件的比对结果吧,每条 Query 序列的比对结果按照 bitscore 由大到小排序取前 25 个,然后两个软件结果如下:

看起来还不错。

然后看看两个软件比对结果的 top1,因为通常注释都选 top1 来做嘛

看到这个结果,我有点纠结了,虽然想到前 25 的比对结果中应该有些序列很类似,但是 top1 的这种结果,要做注释的话要考虑一下了。




上一篇:16sRNA扩增子测序看这几篇文献就够了吧
下一篇:全外显子组测序在癫痫疾病中的应用
回复

使用道具 举报

5

主题

37

帖子

487

积分

中级会员

Rank: 3Rank: 3

积分
487
 楼主| 发表于 2017-5-11 14:24:03 | 显示全部楼层
准备把 daimond 比对的结果也用 blast2go 注释一下,看看 GO 注释的结果跟 blastx 差别大不大。
但是现在遇到问题,diamond 输出的 xml 格式不被 blast2go 识别,查了部分资料,目前还没解决……
麻烦有经验的同学告知一下……
回复 支持 反对

使用道具 举报

1

主题

11

帖子

254

积分

中级会员

Rank: 3Rank: 3

积分
254
发表于 2017-7-24 10:22:18 | 显示全部楼层
W.Peng 发表于 2017-5-11 14:24
准备把 daimond 比对的结果也用 blast2go 注释一下,看看 GO 注释的结果跟 blastx 差别大不大。
但是现在遇 ...

请问楼主解决blast2go使用diamond的结果了吗?我这边用的是blast2go 2.5版本,现在也是不能直接用
回复 支持 反对

使用道具 举报

5

主题

37

帖子

487

积分

中级会员

Rank: 3Rank: 3

积分
487
 楼主| 发表于 2017-7-24 11:03:22 | 显示全部楼层
php_duck 发表于 2017-7-24 10:22
请问楼主解决blast2go使用diamond的结果了吗?我这边用的是blast2go 2.5版本,现在也是不能直接用 ...

我折腾了几天没搞定,后来就做别的去了。 GitHub 上一直都有关于 diamond 输出结果适配 blast2go 的讨论,你可以看一下最近的讨论,看看能不能解决:
https://github.com/bbuchfink/dia ... uecomment-317188137
回复 支持 反对

使用道具 举报

1

主题

11

帖子

254

积分

中级会员

Rank: 3Rank: 3

积分
254
发表于 2017-7-24 11:07:05 | 显示全部楼层
W.Peng 发表于 2017-7-24 11:03
我折腾了几天没搞定,后来就做别的去了。 GitHub 上一直都有关于 diamond 输出结果适配 blast2go 的讨论 ...

好的,谢谢
回复 支持 反对

使用道具 举报

5

主题

26

帖子

291

积分

中级会员

Rank: 3Rank: 3

积分
291
发表于 2017-11-20 16:30:30 | 显示全部楼层
前来marke!未来两天我也要组装了,如果我的gcc能缓过来的话!我也想评测一下这俩,慕名已久!
回复 支持 反对

使用道具 举报

5

主题

26

帖子

291

积分

中级会员

Rank: 3Rank: 3

积分
291
发表于 2017-11-20 16:39:42 | 显示全部楼层
我想问NR的分库在哪里下载,我想下载植物的?
回复 支持 反对

使用道具 举报

58

主题

103

帖子

756

积分

版主

Rank: 7Rank: 7Rank: 7

积分
756
QQ
发表于 2017-12-14 10:14:21 | 显示全部楼层
W.Peng 发表于 2017-5-11 14:24
准备把 daimond 比对的结果也用 blast2go 注释一下,看看 GO 注释的结果跟 blastx 差别大不大。
但是现在遇 ...

输出m8格式?或者转成m8
回复 支持 反对

使用道具 举报

5

主题

37

帖子

487

积分

中级会员

Rank: 3Rank: 3

积分
487
 楼主| 发表于 2017-12-15 09:56:35 | 显示全部楼层
Panda姐 发表于 2017-12-14 10:14
输出m8格式?或者转成m8

是输出的 m8 格式,但是 diamond 的 m8 格式跟 blastx 的 m8 格式并不完全相同,所以才导致不兼容。
这是当时的代码:
[mw_shl_code=shell,true]diamond blastx --seg no -query Bos_taurus.fa -d nr_animal --sensitive -evalue 1e-5 -o dianomd_test.m8[/mw_shl_code]

不知道这个问题现在有没有解决
回复 支持 反对

使用道具 举报

58

主题

103

帖子

756

积分

版主

Rank: 7Rank: 7Rank: 7

积分
756
QQ
发表于 2017-12-17 15:31:49 | 显示全部楼层
W.Peng 发表于 2017-12-15 09:56
是输出的 m8 格式,但是 diamond 的 m8 格式跟 blastx 的 m8 格式并不完全相同,所以才导致不兼容。
这是 ...

可以定制输出结果的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-3-31 10:01 , Processed in 0.029531 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.