搜索
查看: 2330|回复: 2

关于Seqclean和Blast(我会继续更新)

[复制链接]

23

主题

37

帖子

374

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
374
发表于 2017-2-17 23:15:26 | 显示全部楼层 |阅读模式
Seqclean软件在做454序列预处理的时候大家可能使用的比较多,前期我也使用它,用法比较简单,很容易上手,同时有个cln2qual程序也可以去除掉对应的质量分数文件,使用方法大家自己看。但是后来发现该软件在去除接头序列的时候有些问题。
现总结如下:
这里仅仅针对去除接头序列的功能(-v):
1. 如果你的reads两端确实存在接头序列,且这些接头序列和你接头文件中的序列是一样的,那么该软件的结果还可以。
2. 如果reads两端的接头序列可能由于测序错误发生了变化(经常发生),与你接头文件中的序列不一样了,那么该软件可能不会识别。
3. 如果你的reads中在非两端的区域也存在接头序列(454 reads中会出现这种情况),那么该软件不会识别。一条reads中出现多个接头序列(一样的或者是不一样的)是存在的,至少我们的数据中是存在的,大家感兴趣可以自己判断一下。

总体来说,该软件使用比较简单,但是对于一些非常规的序列,该软件结果不好。推荐使用blast的方法来判断reads中接头序列的位置,然后自己写程序去除掉。


不过我还是菜鸟,希望前辈有相关经验分享给我。206920051@qq.com



上一篇:MeDIP-seq,ChIP-seq,RNA-seq实战指南!
下一篇:三代测序建库-1
回复

使用道具 举报

633

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-2-18 00:48:16 | 显示全部楼层
给初学者的忠告,不要拿一套垃圾数据入门!http://www.bio-info-trainee.com/2321.html
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 1 反对 0

使用道具 举报

23

主题

37

帖子

374

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
374
 楼主| 发表于 2017-2-18 07:26:44 | 显示全部楼层
Jimmy 发表于 2017-2-18 00:48
给初学者的忠告,不要拿一套垃圾数据入门!http://www.bio-info-trainee.com/2321.html ...

我就是ESTs去除序列中的载体,引物和接头,然后将预处理的序列中含有4条以上同源序列重叠群进行分析。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-11-15 16:53 , Processed in 0.028635 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.