本帖最后由 yanfei 于 2017-3-7 22:53 编辑
1. DESeq2 介绍
1.1 用途高通量数据分析过程中,基于count数据,对其进行标准化处理,并对两个样本的差异做定量比较。 在RNA-seq分析经常用到,偶尔在ChIP-seq/HiC等数据中。
1.2 与DESeq的差异
2. DEseq2 安装[Python] 纯文本查看 复制代码
# source("http://bioconductor.org/biocLite.R")
# biocLite("DESeq2", dependencies=T)
3. DESeq2 使用
3.1 输入数据[Python] 纯文本查看 复制代码 library(DESeq2)
library(limma)
library(pasilla)
data(pasillaGenes)
exprSet <- counts(pasillaGenes) ## 表达矩阵
group_list <- pasillaGenes$condition ## 分组因子
colData <- data.frame(row.names=colnames(exprSet), group_list=group_list)
dds <- DESeqDataSetFromMatrix(countData = exprSet, colData = colData, design = ~ group_list) 3.2 运行DESeq2
[Python] 纯文本查看 复制代码
## 运行deseq2
dds2 <- DESeq(dds)
## 提取结果
res <- results(dds2)
## 按照padj排序
resOrdered <- res[order(res$padj),]
## 输出结果
write.table(as.data.frame(resOrdered),
file="deseq_output.txt",
sep="\t",
quote = F)
## 获得normalize的count
dds <- estimateSizeFactors(dds)
norcounts <- counts(dds, normalized=T)
## 用rlog对count进行log转化(后续可视化分析)
rld <- rlog(dds, blind=FALSE)
rld <- assay(rld)
4.参考
|