搜索
查看: 3750|回复: 6

[mRNA-seq] [Solved]求助htseq-count出错

[复制链接]

9

主题

15

帖子

130

积分

注册会员

Rank: 2

积分
130
发表于 2017-8-28 23:43:26 | 显示全部楼层 |阅读模式
本帖最后由 laofuzi 于 2017-8-29 03:42 编辑

最近在做RNA-seq基础的练习。

在用htseq-count跑read count时候,出现一个很奇怪的报错问题,谷歌了一下,也没找到答案。先把代码附上:
[AppleScript] 纯文本查看 复制代码
hisat2 -t -x /mnt/d/reference/index/hisat/mm10/genome -1 /mnt/d/AKAP95/fastq/SRR3589959_1.fastq.gz -2 /mnt/d/AKAP95/fastq/SRR3589959_2.fastq.gz -S /mnt/d/AKAP95/aligned/SRR3589959.sam

cd /mnt/d/AKAP95/aligned

samtools view -S SRR3589959.sam -b > SRR3589959.bam
samtools sort -n SRR3589959.bam -o SRR3589959.nsorted.bam

cd /mnt/d/reference/genomes/mm10

wget [url=ftp://ftp.sanger.ac.uk/pub/gencode/Gencode_mouse/release_M10/gencode.vM10.chr_patch_hapl_scaff.annotation.gtf.gz]ftp://ftp.sanger.ac.uk/pub/genco ... f.annotation.gtf.gz[/url]
gunzip gencode.vM10.chr_patch_hapl_scaff.annotation.gtf.gz

cd /mnt/d/AKAP95/matrix
htseq-count -s no -f bam /mnt/d/AKAP95/aligned/SRR3589959.nsorted.bam /mnt/d/reference/genomes/mm10/gencode.vM10.chr_patch_hapl_scaff.annotation.gtf >SRR3589959.count


报错如下:
Error occurred when processing SAM input (record #151 in file /mnt/d/AKAP95/aligned/SRR3589959.nsorted.bam):
  my_showwarning() takes from 3 to 5 positional arguments but 6 were given
  [Exception type: TypeError, raised in warnings.py:99]
本人看了一下,第151行:
SRR3589959.66   385     chr1    72088105        1       51M     =       51940753        0       GTGTTAACCAGCTGAAATTTGCCCGAAGCCTTCAGTCTGTTGCTGAGGAGA     B<BFFFFFFFFFFFFIIFFIFIIIIIIIIIIIFIFFFFFIIIIFIFFFBFF  AS:i:0  ZS:i:0  XN:i:0  XM:i:0  XO:i:0  XG:i:0  NM:i:0  MD:Z:51 YT:Z:UP NH:i:5

貌似也没有问题。
以下是Title文件
samtools view -H  /mnt/d/AKAP95/aligned/SRR3589959.nsorted.bam
@HD     VN:1.0  SO:queryname
@SQ     SN:chr1 LN:195471971
@SQ     SN:chr10        LN:130694993
@SQ     SN:chr11        LN:122082543
@SQ     SN:chr12        LN:120129022
@SQ     SN:chr13        LN:120421639
@SQ     SN:chr14        LN:124902244
@SQ     SN:chr15        LN:104043685
@SQ     SN:chr16        LN:98207768
@SQ     SN:chr17        LN:94987271
@SQ     SN:chr18        LN:90702639
@SQ     SN:chr19        LN:61431566
@SQ     SN:chr1_GL456210_random LN:169725
@SQ     SN:chr1_GL456211_random LN:241735
@SQ     SN:chr1_GL456212_random LN:153618
@SQ     SN:chr1_GL456213_random LN:39340
@SQ     SN:chr1_GL456221_random LN:206961
@SQ     SN:chr2 LN:182113224
@SQ     SN:chr3 LN:160039680
@SQ     SN:chr4 LN:156508116
@SQ     SN:chr4_GL456216_random LN:66673
@SQ     SN:chr4_GL456350_random LN:227966
@SQ     SN:chr4_JH584292_random LN:14945
@SQ     SN:chr4_JH584293_random LN:207968
@SQ     SN:chr4_JH584294_random LN:191905
@SQ     SN:chr4_JH584295_random LN:1976
@SQ     SN:chr5 LN:151834684
@SQ     SN:chr5_GL456354_random LN:195993
@SQ     SN:chr5_JH584296_random LN:199368
@SQ     SN:chr5_JH584297_random LN:205776
@SQ     SN:chr5_JH584298_random LN:184189
@SQ     SN:chr5_JH584299_random LN:953012
@SQ     SN:chr6 LN:149736546
@SQ     SN:chr7 LN:145441459
@SQ     SN:chr7_GL456219_random LN:175968
@SQ     SN:chr8 LN:129401213
@SQ     SN:chr9 LN:124595110
@SQ     SN:chrM LN:16299
@SQ     SN:chrUn_GL456239       LN:40056
@SQ     SN:chrUn_GL456359       LN:22974
@SQ     SN:chrUn_GL456360       LN:31704
@SQ     SN:chrUn_GL456366       LN:47073
@SQ     SN:chrUn_GL456367       LN:42057
@SQ     SN:chrUn_GL456368       LN:20208
@SQ     SN:chrUn_GL456370       LN:26764
@SQ     SN:chrUn_GL456372       LN:28664
@SQ     SN:chrUn_GL456378       LN:31602
@SQ     SN:chrUn_GL456379       LN:72385
@SQ     SN:chrUn_GL456381       LN:25871
@SQ     SN:chrUn_GL456382       LN:23158
@SQ     SN:chrUn_GL456383       LN:38659
@SQ     SN:chrUn_GL456385       LN:35240
@SQ     SN:chrUn_GL456387       LN:24685
@SQ     SN:chrUn_GL456389       LN:28772
@SQ     SN:chrUn_GL456390       LN:24668
@SQ     SN:chrUn_GL456392       LN:23629
@SQ     SN:chrUn_GL456393       LN:55711
@SQ     SN:chrUn_GL456394       LN:24323
@SQ     SN:chrUn_GL456396       LN:21240
@SQ     SN:chrUn_JH584304       LN:114452
@SQ     SN:chrX LN:171031299
@SQ     SN:chrX_GL456233_random LN:336933
@SQ     SN:chrY LN:91744698
@SQ     SN:chrY_JH584300_random LN:182347
@SQ     SN:chrY_JH584301_random LN:259875
@SQ     SN:chrY_JH584302_random LN:155838
@SQ     SN:chrY_JH584303_random LN:158099
@PG     ID:hisat2       PN:hisat2       VN:2.1.0        CL:"/home/huiguang/anaconda3/bin/hisat2-align-s --wrapper basic-0 -t -x /mnt/d/reference/index/hisat/mm10/genome -S /mnt/d/AKAP95/aligned/SRR3589959.sam -1 /tmp/126.inpipe1 -2 /tmp/126.inpipe2"
[main_samview] failed to write the SAM header
samtools view: error closing standard output: -1


另外,其他几个bam文件也是报错,一样的问题,就不再重复贴出。
特求助各位,看看到底是哪出问题了。多谢!!!

问题解决!!!

查看了安装的htseq-count版本,发现是0.7.2。又上官网看了看,最新的版本是0.9.1,怀疑问题可能是软件版本不同造成的。原先是用anaconda安装的,装的不是最新的版本。所以用pip重新安装了最新的 版本。再跑了一遍,虽然也出现一次报错“ Read SRR3589959.66 claims to have an alignedmate which could not be found in an adjacent line.” 但,本人搜索了一下,问题不大,可以忽略。另,本人发现panda姐的帖子中对于“an alignedmate ...in an adjacent line.”有详细的说明,各位感兴趣的话,可以自己搜一下。

那么问题来了,我们是要对reads进行计数,有必要剔除这样的序列吗?还是just keep it?



小总结:折腾了两天,终于搞定这一步了,感触很多。首先,别人的代码还是要认真体会,光抄没用。其次,如果代码没问题,那么出问题的就有可能是软件了。anaconda虽然好使,但安装的软件并不是最新的,这就是有可能出问题的地方。最后,最重要的是,出问题还是首先要自己独立解决。

有句话怎么说来着,继续和bioinformatics死磕!











上一篇:chip-seq findMotifsGenome.pl出问题了
下一篇:急!急!急!有没有人拥有玉米的HC-confidence lncRNA的转录本...
回复

使用道具 举报

3

主题

34

帖子

300

积分

中级会员

Rank: 3Rank: 3

积分
300
发表于 2017-8-30 10:18:13 | 显示全部楼层
我当初用htseq报错,后来发现原因是Python的版本装的不对
回复 支持 反对

使用道具 举报

9

主题

15

帖子

130

积分

注册会员

Rank: 2

积分
130
 楼主| 发表于 2017-8-30 10:32:30 | 显示全部楼层
本帖最后由 laofuzi 于 2017-8-30 10:45 编辑
hxoxh 发表于 2017-8-30 10:18
我当初用htseq报错,后来发现原因是Python的版本装的不对

看来软件版本还确实是个大问题!!!我后来是在python2.7的环境中装的,用了一下,没有问题。查了一下官网,python2.7和python3.6均可以用。
回复 支持 反对

使用道具 举报

9

主题

30

帖子

412

积分

中级会员

Rank: 3Rank: 3

积分
412
发表于 2017-8-31 21:02:54 | 显示全部楼层
今天我也遇到了这样的问题,htseq是用anaconda3装的、版本也是0.7.2的,然后各种百度和Google,也没能找到好的解决方法,只看到有些地方提及了一些samtools,不知是否也与这个软件的版本有关(明天我也试试看)?
请问最后你是换了最新版本就解决问题了是吗?
回复 支持 反对

使用道具 举报

9

主题

15

帖子

130

积分

注册会员

Rank: 2

积分
130
 楼主| 发表于 2017-8-31 22:27:36 | 显示全部楼层
蚊子 发表于 2017-8-31 21:02
今天我也遇到了这样的问题,htseq是用anaconda3装的、版本也是0.7.2的,然后各种百度和Google,也没能找到 ...

是的。先用anaconda卸载htseq,然后去htseq官网上找pip安装命令,就一行命令,安装最新的htseq即可用。
回复 支持 反对

使用道具 举报

9

主题

30

帖子

412

积分

中级会员

Rank: 3Rank: 3

积分
412
发表于 2017-9-1 10:21:16 | 显示全部楼层
laofuzi 发表于 2017-8-31 22:27
是的。先用anaconda卸载htseq,然后去htseq官网上找pip安装命令,就一行命令,安装最新的htseq即可用。 ...

我也在Python2.7的环境下使用conda重新安装了htseq,虽然版本还是0.7.2,但是还是能用了。尽管官方说htseq在Python3和Python2环境下都能用,但Python版本影响还是挺大的啊
回复 支持 反对

使用道具 举报

9

主题

15

帖子

130

积分

注册会员

Rank: 2

积分
130
 楼主| 发表于 2017-9-1 13:52:20 | 显示全部楼层
蚊子 发表于 2017-9-1 10:21
我也在Python2.7的环境下使用conda重新安装了htseq,虽然版本还是0.7.2,但是还是能用了。尽管官方说htse ...

htseq的版本影响也挺大的。不管哪种方法,只要装上能用就行。毕竟每个人的情况不同,解决方法也不一样。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-5-22 17:54 , Processed in 0.038264 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.