搜索
查看: 225|回复: 1

gene symbol 中的奇怪开头基因

[复制链接]

274

主题

473

帖子

1715

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1715
发表于 2016-11-22 11:47:56 | 显示全部楼层 |阅读模式
gene symbol 是非常官方的,由HUGO 组织负责维护,有专门的数据库HGNC database of human gene names | HUGO
以前分析数据的时候,有一些基因的symbol很奇怪,让我百思不得其解,比如
C orf 系列基因,
HS.系列基因,
KRTAP系列基因,
LOC系列基因,
MIR系列基因,
LINC系列基因
它们往往一个系列,就有好几百个基因;
C12orf44; Chromosome 12 Open Reading Frame 44;  这个是C orf系列基因的意思
MIR系列基因应该是 miRNA相关的基因
LINC系列基因应该就是long intergenic non-protein coding RNA
LOC系列基因,是非正式的,推定的,日后可能被更合适的名字替代

还有一些RNA基因,根本就没有symbol,比如:CTA/B/C/D系列的
Aliases for ENSG00000271971 Gene
Quality Score for this RNA gene is 1
Aliases for ENSG00000271971 Gene
CTD-2006H14.2 5
External Ids for ENSG00000271971 Gene
Ensembl: ENSG00000271971
还有,如果你看到HS.开头的基因,它是unigene的ID了,已经不再是symbol啦。



上一篇:利用R画染色体分段标记
下一篇:这篇转录组文章用到了BGI数据?
回复

使用道具 举报

5

主题

18

帖子

79

积分

注册会员

Rank: 2

积分
79
发表于 7 天前 | 显示全部楼层
想问一下,TCGA中的gene_ID,如 ENSG00000000005.5表示的是什么?尤其是后面的".5"是什么?是说Ensembl格式的基因名+版本名还是什么?求解,非常感谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|关于我们|手机版|小黑屋|生信技能树    

GMT+8, 2017-1-22 11:49 , Processed in 0.309413 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.