搜索
查看: 41|回复: 1

LDA原理 statQuest

[复制链接]

3

主题

3

帖子

66

积分

注册会员

Rank: 2

积分
66
发表于 2018-9-13 16:24:06 | 显示全部楼层 |阅读模式

在某些例子中,比如一个药物对哪些病人有效,哪些无效,我们可以尝试依据病人的基因表达来区分。我们可以选取一个或多个基因,但目的是要选取那些可以最大化提升区分这两组病人能力的基因。和PCA类似,但是PCA目的是提取variation最大的基因。

LDA is like PCA, but it focuses on maxmizing seperatibility among known categories.

例子:

从2维图降维1维图:

LDA用2个基因的信息去创造一个新的坐标,并把点投射到这个新坐标,从而使得2个categories区分最大化。

多维图2个group,或者多维图3个group:

PCA和LDA相似点:

两个方法会基于新坐标的重要性排序。

​ 1, PC1(PCA创建的第一个坐标)解释了数据最多的variation。

​ 2,LD1(LDA第一个创建的坐标)解释了categories之间最多的variation。

两个方法都可以让我们知道哪些基因构建了这新的坐标。(比如PCA可以看loading scores,LDA which gene or variable correlate with the new axis)。

总结:

来源:StatQuest





上一篇:clusterProfiler包
下一篇:DEGs是不是都要是upregulated才能作为prognostic signature
回复

使用道具 举报

365

主题

511

帖子

1701

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1701
发表于 2018-9-14 09:55:17 | 显示全部楼层
应该是PCA是无监督的,LDA是有监督的!
建议加上两个测试数据,和R包例子,大家可以直接复制代码重现你的流程。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2018-9-22 04:31 , Processed in 0.138470 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.