搜索
查看: 763|回复: 5

使用clusterProfiler包对非模式生物进行GO和KEGG的富集分析

[复制链接]

4

主题

8

帖子

211

积分

中级会员

Rank: 3Rank: 3

积分
211
发表于 2018-8-24 20:55:39 | 显示全部楼层 |阅读模式
[AppleScript] 纯文本查看 复制代码
# 使用clusterProfiler包对非模式生物进行GO和KEGG的富集分析
library(clusterProfiler)
setwd("/Users/liang/Desktop")
# 读取GO注释文件
go <- read.table("test_go_annot.txt",sep="\t",quote="")
# 读取KEGG注释文件
kegg <- read.table("test_kegg_annot.txt",sep="\t",quote="")
# 读取差异基因列表
gene <- read.table("test_gene.txt")
head(go)
head(kegg)
head(gene)
# 设置TERM2GENE
go_term2gene <- data.frame(go$V1,go$V4)
# 设置TERM2NAME
go_term2name <- data.frame(go$V1,go$V2)
names(go_term2gene) <- c("go_term","gene")
names(go_term2name) <- c("go_term","name")

kegg_term2gene <- data.frame(kegg$V2,kegg$V1)
kegg_term2name <- data.frame(kegg$V2,kegg$V3)
names(kegg_term2gene) <- c("ko_term","gene")
names(kegg_term2name) <- c("ko_term","name")
# 查看数据
head(go_term2gene)
head(go_term2name)
head(kegg_term2gene)
head(kegg_term2name)
gene <- as.vector(gene$V1)
head(gene)

# 使用enrichr函数进行GO富集分析
go_enrich <- enricher(gene=gene,pvalueCutoff = 0.05,pAdjustMethod = "BH",TERM2GENE = go_term2gene,TERM2NAME = go_term2name)
head(as.data.frame(go_enrich))
write.csv(as.data.frame(go_enrich),"GO_enrichment.csv",row.names = F)
# 对富集结果进行可视化
barplot(go_enrich, showCategory=8)
dotplot(go_enrich)
## categorySize can be scaled by 'pvalue' or 'geneNum'
cnetplot(go_enrich, categorySize="pvalue")
#emapplot(go_enrich)

# 使用enrichr函数进行KEGG的富集分析
kegg_enrich <- enricher(gene=gene,pvalueCutoff = 0.05,pAdjustMethod = "BH",TERM2GENE = kegg_term2gene,TERM2NAME = kegg_term2name)
head(as.data.frame(kegg_enrich))
write.csv(as.data.frame(kegg_enrich),"KEGG_enrichment.csv",row.names = F)
barplot(kegg_enrich, showCategory=8)
dotplot(kegg_enrich)
## categorySize can be scaled by 'pvalue' or 'geneNum'
cnetplot(kegg_enrich, categorySize="pvalue")
#emapplot(kegg_enrich)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:trim_galore去除RRBS数据的接头后再切掉2bp
下一篇:1KG数据库的妙用:利用连锁和重组补全缺失基因型
回复

使用道具 举报

0

主题

4

帖子

41

积分

新手上路

Rank: 1

积分
41
发表于 2018-8-30 21:25:06 | 显示全部楼层
大神 膜拜~
我最近才刚下载R语言 第一次接触这些编程的东西 弄了好几天才下好Y叔的R包 找了很多帖子 试了很久 自己的基因富集还是失败。。。都快崩溃了  导师催着要论文 结果我卡在数据处理这里了  累觉不爱。
回复 支持 反对

使用道具 举报

4

主题

8

帖子

211

积分

中级会员

Rank: 3Rank: 3

积分
211
 楼主| 发表于 2018-8-31 10:35:55 | 显示全部楼层
毕业一年贱 发表于 2018-8-30 21:25
大神 膜拜~
我最近才刚下载R语言 第一次接触这些编程的东西 弄了好几天才下好Y叔的R包 找了很多帖子 试了很 ...

你可以按着这个流程试一下,希望能对你有用处
回复 支持 反对

使用道具 举报

0

主题

4

帖子

41

积分

新手上路

Rank: 1

积分
41
发表于 2018-8-31 22:53:00 | 显示全部楼层
谢谢您的回复呀~我还有一个问题想请教一下,若有空答复,简直感激不尽~
就是注释文件里面是什么格式的呀,我是自己在别的数据库拉的注释,做成了EXCEL表格,有两列,一列是基因ID,另一列是相应的GO注释,请问这样的格式是对的吗,因为我试着跑了一下代码,结果0 map。。。可以说很悲伤了
回复 支持 反对

使用道具 举报

0

主题

2

帖子

37

积分

新手上路

Rank: 1

积分
37
发表于 2018-11-20 16:59:40 | 显示全部楼层
你好 能提供一下您用的数据吗?想用您的数据跑跑练习一下 谢谢
回复 支持 反对

使用道具 举报

4

主题

22

帖子

309

积分

中级会员

Rank: 3Rank: 3

积分
309
发表于 2018-11-29 14:59:45 | 显示全部楼层
毕业一年贱 发表于 2018-8-31 22:53
谢谢您的回复呀~我还有一个问题想请教一下,若有空答复,简直感激不尽~
就是注释文件里面是什么格式的呀, ...

kegg: http://www.genome.jp/kegg/catalog/org_list.html
go:http://bioconductor.org/packages/release/BiocViews.html#___OrgDb
这两个网站对应的注释库文件,你可以下载来看看
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2018-12-12 05:26 , Processed in 0.033119 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.