搜索
查看: 1457|回复: 1

gene symbol 中的奇怪开头基因

[复制链接]

633

主题

1172

帖子

3947

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3947
发表于 2016-11-22 11:47:56 | 显示全部楼层 |阅读模式
gene symbol 是非常官方的,由HUGO 组织负责维护,有专门的数据库HGNC database of human gene names | HUGO
以前分析数据的时候,有一些基因的symbol很奇怪,让我百思不得其解,比如
C orf 系列基因,
HS.系列基因,
KRTAP系列基因,
LOC系列基因,
MIR系列基因,
LINC系列基因
它们往往一个系列,就有好几百个基因;
C12orf44; Chromosome 12 Open Reading Frame 44;  这个是C orf系列基因的意思
MIR系列基因应该是 miRNA相关的基因
LINC系列基因应该就是long intergenic non-protein coding RNA
LOC系列基因,是非正式的,推定的,日后可能被更合适的名字替代

还有一些RNA基因,根本就没有symbol,比如:CTA/B/C/D系列的
Aliases for ENSG00000271971 Gene
Quality Score for this RNA gene is 1
Aliases for ENSG00000271971 Gene
CTD-2006H14.2 5
External Ids for ENSG00000271971 Gene
Ensembl: ENSG00000271971
还有,如果你看到HS.开头的基因,它是unigene的ID了,已经不再是symbol啦。



上一篇:利用R画染色体分段标记
下一篇:这篇转录组文章用到了BGI数据?
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

9

主题

29

帖子

152

积分

注册会员

Rank: 2

积分
152
发表于 2017-1-15 18:10:36 | 显示全部楼层
想问一下,TCGA中的gene_ID,如 ENSG00000000005.5表示的是什么?尤其是后面的".5"是什么?是说Ensembl格式的基因名+版本名还是什么?求解,非常感谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2017-12-18 03:31 , Processed in 0.093389 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.