搜索
查看: 2515|回复: 2

[mRNA-seq] clusterProfile org.Hs.eg.db

[复制链接]

3

主题

20

帖子

156

积分

注册会员

Rank: 2

积分
156
发表于 2017-11-6 23:54:51 | 显示全部楼层 |阅读模式

大家好,

大家使用clusterProfile进行聚类分析的时候首先要使用org.Hs.eg.db进行id转换,我是由ENSEMBL转为ENTREZID或SYMBOL,但是进行两种转换的时候都显示2.99% 没有转换成功。具体来说,x$GeneID共有134个元素,转换后eg中有132个元素。

> eg = bitr(x$GeneID, fromType="ENSEMBL", toType=c("ENTREZID"), OrgDb="org.Hs.eg.db")
'select()' returned 1:many mapping between keys and columns
Warning message:
In bitr(x$GeneID, fromType = "ENSEMBL", toType = c("ENTREZID"),  : 2.99% of input gene IDs are fail to map...
> eg = bitr(x$GeneID, fromType="ENSEMBL", toType=c("SYMBOL"), OrgDb="org.Hs.eg.db")
'select()' returned 1:many mapping between keys and columns
Warning message:
In bitr(x$GeneID, fromType = "ENSEMBL", toType = c("SYMBOL"), OrgDb = "org.Hs.eg.db") :2.99% of input gene IDs are fail to map...



本以为仅仅少了两个没有转换成功。然而。。。。。。。。。。。


> a<-setdiff(x$GeneID,eg$ENSEMBL)
> a
[1] "ENSG00000198035" "ENSG00000228589" "ENSG00000232561"
[4] "ENSG00000214223"


所以居然四个没有转换成功,而x$GeneID其中应该还有两个ENSEMBL元素各多转换了一个????


所以,我的问题有两个:


第一:大家有出现部分id转换不成功?
第二:ENSEMBL可以对应多个"SYMBOL"?和"ENTREZID"??


多谢大神们指导啊?



上一篇:Python小测005
下一篇:单细胞转录组UMI和CPM如何转化?
回复

使用道具 举报

29

主题

131

帖子

1208

积分

金牌会员

Rank: 6Rank: 6

积分
1208
发表于 2017-11-16 12:35:33 | 显示全部楼层
我也遇到过,ID转化不成功是正常的,而且一个ENSEMBL对应多个ENTREZID也是有的,应该是两个数据库之间的有些ID没处理好吧
回复 支持 反对

使用道具 举报

3

主题

20

帖子

156

积分

注册会员

Rank: 2

积分
156
 楼主| 发表于 2017-11-20 09:59:24 | 显示全部楼层
anlan 发表于 2017-11-16 12:35
我也遇到过,ID转化不成功是正常的,而且一个ENSEMBL对应多个ENTREZID也是有的,应该是两个数据库之间的有 ...

所以大家都是这么做的,没问题是吧?
我记得有大神说过,没有转化成功的就不要考虑了,反正基因功能也没有得到注释。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-18 07:40 , Processed in 0.028834 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.