搜索
查看: 705|回复: 0

我的StatQuest生物统计学专题——线性模型Pt1.5:多重回归

[复制链接]

3

主题

3

帖子

32

积分

新手上路

Rank: 1

积分
32
发表于 2018-9-16 08:52:01 | 显示全部楼层 |阅读模式
本帖最后由 竹叶 于 2018-9-16 08:51 编辑

我的StatQuest生物统计学专题——线性模型Pt1.5:多重回归

在学习线性回归时,我们常常疑惑简单回归和多重回归的异同。我们来做个比较……
图1中左边的图为简单回归,我们会根据数据拟合出一条合适的直线,并通过R2和p值来评价拟合结果是否合适;图1中右边的图为多重回归,我们根据数据拟合出了一个平面以适应新加入的变量,当我们加入更多的变量时,情况会变得更为复杂,我们需要更多的坐标轴来对数据进行描述和拟合。


无论是简单回归还是多重回归,我们都需要计算R2来对拟合结果进行评价。
R2 = (SS(mean) - SS(fit)) / SS(mean)
不同的是,对于多重回归,我们需要对R2进行矫正来补偿新变量的加入对于方程式的影响,因此,我们需要计算F值和p值来评价R2是否具有统计显著性。图2



由图2中的公式可以看出,R2显著性的计算本质上是SS(fit)和SS(mean)之间的差异显著性计算。而在简单回归和多重回归中的SS(mean)均为Y轴变量的离均差平方和(图3),因此,我们也可以比较不同SS(fit)之间的差异显著性,亦即不同回归之间的差异显著性。通过这种比较我们可以判断新加入的变量是否有益于数据的拟合。


在进行简单回归和多重回归的比较时,F值的计算略有不同,图4:


其中SS(simple)和p(simple)分别代表简单回归中的SS(fit)和p(fit),SS(multiple)和p(multiple)分别代表多重回归中的SS(fit)和p(fit)。简单回归与多重回归之间R2值的差异越大,p值越小,则新加入的变量对回归拟合的提升效果越显著。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:我的StatQuest笔记: 富集分析(1)
下一篇:R for Data Science-008 dplyr包-filter()函数
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-6-20 05:53 , Processed in 0.028338 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.