搜索
查看: 3961|回复: 0

[expression-profile] 使用DESeq2寻找差异表达的基因中result函数

[复制链接]

29

主题

131

帖子

1208

积分

金牌会员

Rank: 6Rank: 6

积分
1208
发表于 2016-11-30 14:08:30 | 显示全部楼层 |阅读模式
最近我在学习使用DESeq2来寻找差异表达基因,在看了其文档后,发现在提取差异分析结果的步骤中results函数有个可选参数alpha。
一般我都是用默认参数 res <- results(dds2)
DESeq2的说明文档:
Note that the results function automatically performsindependent filtering based on the mean of normalized counts for each gene, optimizingthe number of genes which will have an adjusted p value below a givenFDR cutoff, alpha.
意思应该是results函数会基于每个基因的reads counts个数来过滤那些FDR值低于给定的alpha阀值的基因。


因此我就试用了下:res05 <- results(dds2,alpha = 0.05)
然后比较了下:
> sum(res$padj < 0.05, na.rm = TRUE)
[1] 8082
> sum(res05$padj < 0.05, na.rm = TRUE)
[1] 8082
两者FDR的个数没变额,再看了下:
> metadata(res)$filterThreshold
13.57143%
2.871128
> metadata(res05)$filterThreshold
13.57143%
2.871128

两者的阈值的基因平均reads数都是2.87


请教下各位,为什么我把alpha调小,应该筛选标准更加严格了,但最终的FDR<0.05的个数以及mean of normalized counts阈值还是一样呢?是本身数据的原因吗?因为我把alpha调为0.01时就有差别了。

我的理解是这样的:当默认alpha参数是0.1时,results函数会对那些FDR大于0.1的基因的mean of normalized counts进行筛选,按照他内在的指标删除一定比例低counts的基因(其实就是将padj变为NA)。当alpha参数人为设定为0.05时,results函数则是对FDR大于0.05的基因的mean of normalized counts进行筛选,然后删除一定比例低counts的基因。只是不晓得也没找到它这个一定比例是怎么算出来的。水平不够,文档实在没有全部看懂。


我实在不懂其中的算法,想请教下各位对alpha这个参数的理解。多谢!!!




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-21 09:36 , Processed in 0.040470 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.