搜索
查看: 3422|回复: 3

人类有多少基因是有KEGG数据库注释信息的呢?

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2016-8-27 21:36:53 | 显示全部楼层 |阅读模式
需要去KEGG数据库里面下载数据库文本文件,然后用脚本统计有多少条KEGG通路,有多少能mapping到KEGG通路的基因!
参考:http://www.bio-info-trainee.com/1188.html
结果是:

可以很清楚的看到,共有299条KEGG通路,共有6992个基因被KEGG数据库注释过,那么人类总共有多少个基因呢?建议看gencode数据库。





上一篇:人类hg19这个参考基因组里面各个染色体都分别有多少基因?
下一篇:人类基因或转录本的长度分布特征如何?
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

0

主题

22

帖子

183

积分

注册会员

Rank: 2

积分
183
发表于 2016-10-23 14:34:33 | 显示全部楼层
怎么感觉这么少呢,人类编码基因都有两万多个
回复 支持 反对

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
 楼主| 发表于 2016-10-23 17:17:26 | 显示全部楼层
naturehunger 发表于 2016-10-23 14:34
怎么感觉这么少呢,人类编码基因都有两万多个

既然做了这个题目,就写一下自己的处理笔记吧
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

0

主题

6

帖子

129

积分

注册会员

Rank: 2

积分
129
发表于 2018-4-26 08:42:25 | 显示全部楼层
尝试了很久都没成功,虽然没学习过perl,但是还是在楼主的perl代码中得到灵感:abc=$2
cat hsa00001.keg | awk '$1 == "C"{ abc = $2} $1 == "D"{print abc "\t" $2}' >> kegg_gene_num4.txt
下面就简单了
cut -f 1 kegg_gene_num4.txt | sort -u | wc -l
==> 334
cut -f 2 kegg_gene_num4.txt | sort -u | wc -l
==> 7423
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-21 01:41 , Processed in 0.038481 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.