搜索
查看: 1861|回复: 0

你永远无法知道你的傻X用户会给什么样的input给你的程序。

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-6-4 18:05:10 | 显示全部楼层 |阅读模式
为什么总是会遇到奇怪的报错呢?因为我们搞不明白软件的作者到底默认需要什么样的输入文件

假如你走WGS或者WES等variant-calling的流程,fastq文件里面有重复ID,那么会怎么样呢?

本来准备做个测试, 发现这个问题,很有趣,但是我不想继续测下去了。
[AppleScript] 纯文本查看 复制代码
grep ST-E00142:330:H33KVALXX:7:1122:7781:26466 *fq
jmzeng_chr10_1.fq:@ST-E00142:330:H33KVALXX:7:1122:7781:26466/1
jmzeng_chr10_1.fq:@ST-E00142:330:H33KVALXX:7:1122:7781:26466/1
jmzeng_chr10_1.fq:@ST-E00142:330:H33KVALXX:7:1122:7781:26466/1
jmzeng_chr10_2.fq:@ST-E00142:330:H33KVALXX:7:1122:7781:26466/2
jmzeng_chr10_2.fq:@ST-E00142:330:H33KVALXX:7:1122:7781:26466/2
jmzeng_chr10_2.fq:@ST-E00142:330:H33KVALXX:7:1122:7781:26466/2


很明显,我给的fastq文件里面同样的ID居然有3条序列。

还是那句话,你永远无法知道你的傻X用户会给什么样的input给你的程序。

但是我无意中解决了这个问题,https://support.bioconductor.org/p/74023/  



上一篇:通过识别共表达模式聚类高通量测序数据——clusterSeq包
下一篇:chip-peaks anno 的rmarkdown 快速四步peaks 注释
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-7-18 09:29 , Processed in 0.026358 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.