搜索
查看: 2350|回复: 1

Perl-043

[复制链接]

1

主题

16

帖子

180

积分

注册会员

Rank: 2

积分
180
发表于 2017-1-4 20:02:01 | 显示全部楼层 |阅读模式
本帖最后由 disheng 于 2017-1-4 20:03 编辑

题目:
人类基因组的外显子区域到底有多长?占全基因比例是多少?



[Perl] 纯文本查看 复制代码
格式化文件:
while(<>){
next if /^#/;
@F =split;
/\[(.*?)\]/;
@tmp = split /,/,$1;
foreach(@tmp){
$_ =~ s/-/\t/;
print "$F[2]\t$F[6]\t$F[0]\t$_\n";
}
}

打印格式化话后的文件:

[Perl] 纯文本查看 复制代码
 perl -alne '{$tmp+=($F[4]-$F[3])}END {print $tmp}' format.txt

得到57746136bp 57M  #但是其中外显子有重复信息,如外显子之间的重复

[Perl] 纯文本查看 复制代码
 perl -alne '{ foreach ($F[3]..$F[4]) {$hash{$_}=1 }} END {$tmp++ foreach keys %hash;print $tmp}' format.txt

外显子最后找出有31M


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:统计蛋白质互作hug gene degree(每个基因连接数)
下一篇:UTR区域count数的统计
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-16 09:14 , Processed in 0.029364 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.