搜索
查看: 1155|回复: 0

从gencode.v22.annotation.gtf注释文件中提取编码蛋白质的gene_id

[复制链接]

4

主题

11

帖子

85

积分

注册会员

Rank: 2

积分
85
发表于 2018-4-6 18:09:02 | 显示全部楼层 |阅读模式
cat gencode.v22.annotation.gtf | grep $'\t'gene$'\t' | grep protein_coding | cut -f 9 | cut -d '"' -f 2 > Protein_Coding_Gene.txt
head -5 Protein_Coding_Gene.txt
#ENSG00000186092.4
#ENSG00000279928.1
#ENSG00000279457.2
#ENSG00000278566.1
#ENSG00000273547.1

wc -l Protein_Coding_Gene.txt
#19814 Protein_Coding_Gene.txt

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-6-16 19:44 , Processed in 0.030067 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.