搜索
查看: 1565|回复: 9

GO,Kegg,GSEA富集分析神包clusterprofiler

[复制链接]

6

主题

35

帖子

339

积分

中级会员

Rank: 3Rank: 3

积分
339
发表于 2017-1-6 22:24:07 | 显示全部楼层 |阅读模式
  原来本菜鸟做玩差异分析后通路注释都是喜欢跑到DAVID里面的网页搞定,感觉还要整理表格之类,贼烦。最近翻了翻群主大大的富集分析帖子,发现了该bioconductor神包clusterprifiler,于是参照群主自己探索了一下用法,确实太好用了,代码非常简单和简洁。据说写该包的作业也是NB人物。


接下来切入正题:先要转化成entrezID,这个参考博客中的http://www.biotrainee.com/thread-404-1-1.html,大神写很清楚了
                                 1.做GO和KEGG:


接下来就是clusterprofiler的函数:

library(clusterProfiler)
ego=enrichGO(OrgDb="org.Hs.eg.db", gene = gene1,pvalueCutoff = 0.01,readable=TRUE)#一行代码完成GO富集,gene1就是上图的entrezID的list
Pvalue可自己调节
接下来输出结果:
write.csv(summary(ego),"G-enrich.csv",row.names =F)
同样的KEGG:
ekk <- enrichKEGG(gene         = gene1,
                 organism     = 'hsa',
                 pvalueCutoff = 0.05)
write.csv(summary(ekk),"KEGG-enrich.csv",row.names =F);

那么这样我们就用4行代码完成了GO和kegg的富集分析。

后面我在bioconductor的Rscript里还发现这包还能玩GSEA富集.....(TM好强啊我去)
代码也是极其简单的:
gmtfile <- system.file("extdata", "c5.cc.v5.0.entrez.gmt", package="clusterProfiler")
c5 <- read.gmt(gmtfile)#前面俩行大概就是来选择GSEA的数据库用的,c5.cc.v5.0.entrez.gmt这里他事例用的是GO的cc数据库,这个可以调整的,参考GSEA的网站来选择

egmt <- enricher(gene1, TERM2GENE=c5)
write.table()write.csv(summary(egmt),"Gsea-enrich.csv",row.names =F)#后面俩行就调整你的GENElist,我这里是上述的gene1。



到此,GO,Kegg,GSEA完成。这包真的是强。。。。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

6

主题

35

帖子

339

积分

中级会员

Rank: 3Rank: 3

积分
339
 楼主| 发表于 2017-1-8 10:49:19 | 显示全部楼层
这个包可能有点问题,做出来结果和DAVID不一样,大家仅供参考
回复 支持 反对

使用道具 举报

0

主题

1

帖子

14

积分

新手上路

Rank: 1

积分
14
发表于 2017-1-9 18:53:41 | 显示全部楼层
难道你不知道DAVID很有问题吗?结果不一样就对了,因为DAVID基本上是错的。

看看这个比较:https://guangchua[url]ngyu.github.io/2015/08/functional-enrichment-for-gtex-paper/
回复 支持 反对

使用道具 举报

6

主题

35

帖子

339

积分

中级会员

Rank: 3Rank: 3

积分
339
 楼主| 发表于 2017-1-11 21:20:58 | 显示全部楼层
ygc 发表于 2017-1-9 18:53
难道你不知道DAVID很有问题吗?结果不一样就对了,因为DAVID基本上是错的。

看看这个比较:https://guangc ...

y叔,我错了,大驾光临,蓬荜生辉,请多指导。。。
回复 支持 反对

使用道具 举报

10

主题

23

帖子

230

积分

版主

Rank: 7Rank: 7Rank: 7

积分
230
发表于 2017-1-12 13:28:02 | 显示全部楼层
也有可能是用的数据库不一样。不知道为个包的数据库有没有更新。
回复 支持 反对

使用道具 举报

0

主题

6

帖子

113

积分

注册会员

Rank: 2

积分
113
发表于 2017-2-6 16:55:29 | 显示全部楼层
ygc 发表于 2017-1-9 18:53
难道你不知道DAVID很有问题吗?结果不一样就对了,因为DAVID基本上是错的。

看看这个比较:https://guangc ...

请问下Y叔 这个clusterprofililer的KEGG富集结果中 第三列的结果中分母值为什么是一样的啊 这个是怎么计算出来的啊
回复 支持 反对

使用道具 举报

0

主题

6

帖子

113

积分

注册会员

Rank: 2

积分
113
发表于 2017-2-6 16:56:23 | 显示全部楼层
ygc 发表于 2017-1-9 18:53
难道你不知道DAVID很有问题吗?结果不一样就对了,因为DAVID基本上是错的。

看看这个比较:https://guangc ...

请问下Y叔 这个clusterprofililer的KEGG富集结果中 第三列的结果中分母值为什么是一样的啊 这个是怎么计算出来的啊
回复 支持 反对

使用道具 举报

608

主题

1072

帖子

3571

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3571
发表于 2017-2-22 20:38:33 | 显示全部楼层
lixuenan 发表于 2017-2-6 16:56
请问下Y叔 这个clusterprofililer的KEGG富集结果中 第三列的结果中分母值为什么是一样的啊 这个是怎么计 ...

y叔的包 的说明书里面有讲
回复 支持 反对

使用道具 举报

7

主题

23

帖子

241

积分

版主

Rank: 7Rank: 7Rank: 7

积分
241
发表于 2017-3-21 21:52:29 | 显示全部楼层
包的名字里面有的地方打错了,clusterProfiler
回复 支持 反对

使用道具 举报

7

主题

23

帖子

241

积分

版主

Rank: 7Rank: 7Rank: 7

积分
241
发表于 2017-3-21 22:26:27 | 显示全部楼层
最后一张图看的不是很完整,"GO:0022838"表示一个生物学功能的分类,这样理解对吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|关于我们|手机版|小黑屋|生信技能树    

GMT+8, 2017-6-27 20:11 , Processed in 0.036508 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.