搜索
查看: 6268|回复: 1

[Perl] 生信perl脚本求助

[复制链接]

2

主题

8

帖子

141

积分

注册会员

Rank: 2

积分
141
发表于 2016-9-24 20:00:35 | 显示全部楼层 |阅读模式
1. 从 gff 文件(/home/share/users/luowenchun2010/perl_test/gff/Ptrichocarpa.thin.gff,染色体序列文件 /home/share/users/luowenchun2010/perl_test/gff/Ptrichocarpa.ch01.fa)提取基因的如下信息,基因长度,外显子个数,在正链还是负链。”
补充一下基因长度信息,增加一些提取的内容,每个组件的长度(外显子,内含子,UTR),可以考虑以字符串来展示,形如:
{12}->(36)->[10]->(24)->{10}
-> 表示序列 5' 到 3’的方向
{} 大括号表示 utr区,里面写具体长度
() 小括号表示 外显子,里面数字表示长度
[] 中括号表示 内含子,里面的数字同样是序列长度
Ps: 注意分别的长度是否等于基因总长度。
2. 将fasta文件中的CDS翻译成蛋白序列。
3.从1中的gff中提取基因的cds并且翻译成蛋白序列。
回复

使用道具 举报

2

主题

8

帖子

141

积分

注册会员

Rank: 2

积分
141
 楼主| 发表于 2016-10-3 10:22:51 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2022-1-27 02:21 , Processed in 0.297814 second(s), 35 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.