搜索
查看: 234|回复: 0

StatQuest生物统计学专题(02)-样本量与重复

[复制链接]

3

主题

3

帖子

62

积分

注册会员

Rank: 2

积分
62
发表于 2018-9-14 20:48:21 | 显示全部楼层 |阅读模式
本帖最后由 张云 于 2018-9-14 20:53 编辑

前言
本笔记主要内容为样本量与重复,对应视频6-7。
技术重复与生物学重复??Technical and Biological Replicates??
假设我们需要采集血液样本进行基因表达量测定,如果针对于某个人的同一血液样本进行了3次或多次测定,这3次或多次测定就被称为技术重复

技术重复的特点:
1)对于单一样本进行多次测定因此结果相对准确;2)可以评估某次的测定是否准确,进一步提高结果的可靠性,试验中多次技术重复是必不可少的。注:对于同一个样本同时同部位取了多次样,对这些样本的测定依然属于技术重复,如下图:

生物学重复:同样是采集血液样本,如果我们对3个人分别取他们的血样进行基因检验,这种来自于不同个体的重复即生物学重复。生物学重复可用来研究动物、植物或细胞系这样一个群体的基因表达情况。

技术重复和生物学重复的应用
一般而言,试验中一般需联合使用技术重复和生物学重复,具体使用应当依据试验类型而定;当你有大量的生物学重复可以不用技术重复,但是这往往消耗了更多的金钱和精力。总而言之,如果你想研究单独个体或试验方法技术重复更适用;如果你的研究对象是群体生物学重复则是必需的。

样本与有效样本?? Sample and Effective Sample ??
同样是采集血液情景,我们对3个男性采取血液用以基因检测,那么样本大小是3;即使我们针对每个人血液均做了2次技术重复,样本大小依然是3,因为此时技术重复仅仅是为了结果的准确性而不会告诉我们样本之间的差异。但是如果我们的目的是检测女性血液样本的差异,无论取了多少男性血液样本,样本的大小依然是0。

然而在一些特殊的情况,如仅仅是评估一个方法时,4次技术重复就得到了4个样本。

有效样本:如果我们对3个群体的人(蓝,橘,绿)采集血液进行基因检测(如下图)此时样本量为3。
如果,此时我们用从蓝色群体中又采集了一管血液(如下图),那么样本量会是多少?

两个蓝色群体的血液样本来自于两个不同且独立的个体,他们的基因虽有差异但高度相似(与橘和绿两个群体比较而言),那么样本量应如何确定?如果此时我们知道这两个样本的相关系数,我们就可以算出有效样本量(effective sample size)即可解决这一问题。且看下面的例子:如果两蓝色个体相关系数是0.7,那么有效样本量即可通过下图公式计算,可得出结果为1.18。如果两个体相关较弱,相关系数为0.1,则有效样本量为1.82,这说明这两个血液样本在样本量计算中相当于1.82个样本。

在实际情况中有效样本的计算更为复杂但其原理是一致的,当两个相似样本出现时它们就不应当视为单独的样本个体参与总样本的计算。
总结
在实际研究中技术重复一般不计入样本量,当有高相似样本出现时应计算其有效样本量。



上一篇:StatQuest生物统计学专题(01)-基础
下一篇:StatQuest生物统计学专题(03)-标准误、标准差与置信区间
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2018-11-16 22:52 , Processed in 0.045204 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.