搜索
查看: 808|回复: 1

我的StatQuest生物统计学专题_I-标准差、标准误和置信区间

[复制链接]

3

主题

6

帖子

56

积分

注册会员

Rank: 2

积分
56
发表于 2018-9-3 23:26:08 | 显示全部楼层 |阅读模式
本帖最后由 JaneJia18 于 2018-9-4 09:28 编辑

标准差和标准误的区别   在样本变异度的测定方法中,标准差是对样本方差的修正以使测定单位和原始观测值一致,即方差的平方根。由于平均值之间比原数据值之间彼此更接近,因而用样本平均数的标准差,称为平均数的标准误来描述数据的变异度。呈正态分布的样本平均数的频率分布也呈正态分布,故与单个样本观测值的方差计算方法相同。
  • 标准差是对一组测量值变异度的定量,代表数据本身的分布情况,即距离均值的远近。标准差是以图表描述数据时最常用的参数。
  • 标准误是对多组测量值的均值的变异度进行定量,说明平均值的分布情况。然而,标准误也可以对单独的一组测量值进行估计,以说明所测量数据的分布情况。

        几乎在所有情况下,都应该绘制标准误图形,因为图形能更好地描述所测量数据的分布情况。

  • 标准误的计算应该在获得多个具有相同数量测量值的样本之后,从而保证每个样本具有相同的样本量。然后,可以计算每个样本的平均值,以及平均值的标准误。

靴带抽样   重复随机抽取样本量进行参数统计,分别计算代表数据离散度和变异度的参数,包括平均值/中位数等;重复计算直到获得足够的平均数和中值,计算所有平均值/中值的标准差。该过程称为靴带抽样法(Bootstrap),具体步骤如下:
  • 从原数据随机选取样本,可以重复选取;


  • 计算随即样本对平均值;
  • 重复以上两个步骤,直到获得足够多的平均值(> 10,000)。


置信区间  在Z值正态分布转换中,可以确定样本平均数离真实的总体平均数(样本平均数的平均数)有多大差距,即对样本平均数的信任程度。统计学习惯用95%的平均数出现在样本平均数中,即95%的置信值落在样本平均数的+/-1.96倍区间内,称为置信区间(如下图)。标准误是样本平均数分布标准差的1.96倍,因此置信区间和标准误相关。
  • 样本平均值和总体平均值。在95%置信区间以外,若仍然包括95%的平均值,那么总体平均值在该区域为< 5%,即P值<0.05,将这种小概率事件称为统计显著性差异。

  • 可视化统计检验,即用统计图形比较两组样本。如下图所示,可以看出靴带取样的两组样本的平均值分布和95%置信区间。由于雌雄白鼠体重样本的95%置信区间没有重叠,可以认为两者之间有统计显著性差异。


  • 如果两个样本组的95%置信区间出现重叠,仍然存在显著性差异的可能性,此时可以进行t检验。

      

        综上所述,标准差和标准误都是描述数据变异程度的参数,后者更能对总体样本的变异程度作出估计。通过标准误估计的样本平均值变异显著性程度,为置信区间,但是不能解释为总统平均数的概率分布。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:R数据可续写 啃书
下一篇:R数据科学(三)
回复

使用道具 举报

3

主题

6

帖子

56

积分

注册会员

Rank: 2

积分
56
 楼主| 发表于 2018-9-3 23:29:14 | 显示全部楼层
直接复制Typora内容,图片丢失了....
只好附件加上pdf,请问如何解决?该怎么上传呢?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-5-22 17:53 , Processed in 0.032729 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.