搜索
查看: 837|回复: 4

[mRNA-seq] 关于DESeq2包升级的一些问题

[复制链接]

1

主题

16

帖子

244

积分

中级会员

Rank: 3Rank: 3

积分
244
发表于 2018-5-12 19:09:47 | 显示全部楼层 |阅读模式
本帖最后由 btrainee 于 2018-5-12 19:09 编辑

近期在用DESeq2做转录组学的差异分析时,发现两个不同版本的DESeq2包,分析出来的差异基因结果有一些比较大的改变,觉得有点不好理解,特把分析整理过程,贴出来,希望大家可以一起探讨,发表看法。

输入文件
  • count矩阵,count.xls
  • 分组文件,condition.txt (15个样本的生物学重复)


由于文中所涉及输入文件以及结果文件稍微较大,放至百度网盘共享,有需要下载即可。
链接:https://pan.baidu.com/s/100PYAy_aMD8tKZuJJ5Q5Kg 密码:7xrw

差异分析

分别使用1.6.3版本和1.18.1版 目前最新版本为1.20.0,经测试结果与1.18.1版基本一致

[Python] 纯文本查看 复制代码
library(DESeq2)
packageVersion("DESeq2")
new_data=read.table("D:/count.xls",header=T,row.names=1)
design=read.table("D:/condition.txt",header=T,row.names=1)
cmp=unlist(strsplit("A,C",','))
ddsFullCountTable <- DESeqDataSetFromMatrix(countData = new_data, colData = design , design = ~condition)
dds = DESeq(ddsFullCountTable)
res = results(dds , contrast = c("condition",cmp[1],cmp[2]))
file_name = paste(cmp[1],cmp[2],"transcript.xls",sep="_")
write.table(res,file=file_name,sep="\t", quote = FALSE, row.names = TRUE)
[Python] 纯文本查看 复制代码
##筛选差异基因,|log2FC|>1,q<0.05
python3 deseq2_report.py -i A_C_transcript.xls -c A C -o A_C.report.xls

结果分析

按照以上标准进行差异基因筛选后,神奇的结果发生了: 首先是1.6.3版本DESeq2包的分析结果,筛选到2个显著差异基因,而1.8.1版本DESeq2包的分析结果,筛选到6个显著差异基因,筛选到的数目增多,结果见附件(结果比对);

更神奇的是,标黄的两个基因,其中基因“VIT_06s0009g02830”的baseMean结果一致,Log2FoldChange值却差距很大,而基因“VIT_12s0028g00560”的各项值均不同,amazing~

思考

据了解,DESeq2相较DEseq包,筛选条件更为严格,去掉了很多的假阳性结果,因此往往得到的差异基因个数要比DEseq结果少很多,猜想两次大版本升级,算法优化是否矫枉过正,而此次DESeq2包的升级,又进行了矫正?



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:关于clusterprofiler的一些疑问(结果和教程不一致)
下一篇:pycharn 激活安装 解决激活码问题
回复

使用道具 举报

361

主题

482

帖子

1617

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1617
发表于 2018-5-13 23:40:16 | 显示全部楼层
很有趣哦,既然logFC变化了,说明两个不同版本的包对原始的counts矩阵的归一化发生了变化哦
回复 支持 反对

使用道具 举报

1

主题

16

帖子

244

积分

中级会员

Rank: 3Rank: 3

积分
244
 楼主| 发表于 2018-5-16 09:29:22 | 显示全部楼层
ydchen 发表于 2018-5-13 23:40
很有趣哦,既然logFC变化了,说明两个不同版本的包对原始的counts矩阵的归一化发生了变化哦 ...

但是,有个基因的basemean竟然一样,没绕过弯儿~
回复 支持 反对

使用道具 举报

1

主题

54

帖子

672

积分

高级会员

Rank: 4

积分
672
发表于 2018-6-10 19:46:46 | 显示全部楼层
请问另一个问题,baseMeanA baseMeanB表达均值是否可以用来换算FPKM?
回复 支持 反对

使用道具 举报

1

主题

16

帖子

244

积分

中级会员

Rank: 3Rank: 3

积分
244
 楼主| 发表于 2018-6-12 09:06:43 | 显示全部楼层
生信小小菜鸟 发表于 2018-6-10 19:46
请问另一个问题,baseMeanA baseMeanB表达均值是否可以用来换算FPKM?

均一化的方法不一样,应该不可以换算。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2018-7-22 14:23 , Processed in 0.091838 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.