搜索
查看: 2244|回复: 3

[其他] 如何理解 差异基因列表

[复制链接]

1

主题

7

帖子

684

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
684
发表于 2017-3-30 15:04:11 | 显示全部楼层 |阅读模式
求大神讲解一下 差异基因列表


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

5

主题

37

帖子

485

积分

中级会员

Rank: 3Rank: 3

积分
485
发表于 2017-3-30 16:17:07 | 显示全部楼层
本帖最后由 W.Peng 于 2017-7-29 12:51 编辑

Sample1 和 Sample2 之间表达量有差异的基因列表,后面的 logFC,P,Padj 含义可以看这个帖子
http://www.jianshu.com/p/07ecff240548
#查找有表达差异的探针位点

回复 支持 反对

使用道具 举报

1

主题

7

帖子

684

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
684
 楼主| 发表于 2017-3-30 16:29:38 | 显示全部楼层
W.Peng 发表于 2017-3-30 16:17
Sample1 和 Sample2 之间表达量有差异的基因列表,后面的 logFC,P,Padj 含义可以看这个帖子
https://www. ...

谢谢 我研究一下
回复 支持 反对

使用道具 举报

3

主题

17

帖子

380

积分

中级会员

Rank: 3Rank: 3

积分
380
发表于 2017-3-30 16:49:43 | 显示全部楼层
前四列顾名思义。
pvalue 和 p adj都是衡量差异显著性的,p adj比pvalue更加的严格,你可以根据你的实验情况选择使用pvalue 或者p adj。为什么在有了pvalue基础上又有p adj?
p value 表示接受H0A基因=B基因的概率。如果pvalue 小于一个临界值,我们认为它是小概率事件,从而接收A !=B,认为两者是差异基因。
pvalue 在衡量一个基因是不是差异表达,没有问题。
但是
小概率事件仍然有发生的可能性,但是在处理转录组数据的时候动则上W个基因。当有100个基因pvalue <0.05, 里面可能混着 (100 *0.05)个假阳性。
如果运气不好,恰好拿这部分假阳性的基因做实验验证, overexpression 或者knowdown后就郁闷了。
因此需要对pvalue进行多重检验的矫正,减少假阳性,提高筛选标准。最常见的是Benjamini and Hochberg矫正。

BH矫正的公式 p*(m/k)  m表示数目,k表示pvalue的排名
如果有2000个基因,a 基因的pvalue =0.00001, 排名第32
p adj= 0.00001(2000/32) , p值变大,这样如果仍然用0.05做cut off,筛选的差异基因就少得多了。
怎么在R中进行计算?
p=c("0.002","0.0001","0.004","0.05","0.00002");
p.adjust(p,method ="BH" ,n=length(p))

[1] 0.003333333 0.000250000 0.005000000 0.050000000 0.000100000






                                                                                                                                                [size=28.000000pt]

                               
                       
               





回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-19 01:22 , Processed in 0.040753 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.