搜索
查看: 1754|回复: 1

[tutorial] 如何利用emboss筛除ORF超过100个氨基酸的转录本

[复制链接]

17

主题

42

帖子

269

积分

中级会员

Rank: 3Rank: 3

积分
269
发表于 2017-9-6 10:32:48 | 显示全部楼层 |阅读模式
我想用emboss的getorf来预测转录本中的ORF编码氨基酸的长度,超过100个氨基酸的转录本就筛除,可是getorf的输出结果是这样的,不知道哪个ORF属于哪一条转录本,无法作出筛选,不知道有什么方法解决。下图是getorf的输出结果

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

3

主题

17

帖子

380

积分

中级会员

Rank: 3Rank: 3

积分
380
发表于 2017-9-7 13:03:09 | 显示全部楼层
[AppleScript] 纯文本查看 复制代码
open (IN,"$ARGV[0]");#!/usr/bin/perl -w


my(%h1, %h2);
$/="\>";
<IN>;
while(<IN>){
        chomp;
        my($g_t, @fastq) = (split /\n/);
        my($gene, $tran) = (split /_/,$g_t);
        push @{$h2{$tran}},@fastq;
        $h1{$gene} ||= $tran ;
        $h1{$gene} = $tran  if length(join("",@{$h2{$h1{$gene}}})) < length(join("",@fastq));        
}
$/="\n";
foreach my $gene(keys %h1){
        print ">$gene|$h1{$gene}\n";
        print join("\n",@{$h2{$h1{$gene}}});
        print $/;
}
回复 支持 1 反对 0

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-20 19:27 , Processed in 0.028731 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.