标准差的范围规则

标准偏差和范围都是数据集扩展的度量。每个数字都以自己的方式告诉我们数据的间隔方式,因为它们都是变化的度量。虽然范围和标准偏差之间没有明确的关系,有一个经验法则可以将这两个统计量联系起来。这种关系有时被称为标准差的范围规则。

范围规则告诉我们,样本的标准偏差大约等于数据范围的四分之一。换句话说,s=(**-最小)/4。这是一个非常直接的使用公式,只能用作标准偏差的非常粗略的估计。

教育_1

一个例子

要查看范围规则如何工作的示例,我们将查看以下示例。假设我们从12,12,14,15,16,18,18,20,20,25的数据值开始。这些值的平均值为17,标准偏差约为4.1。相反,如果我们首先将数据范围计算为25–12=13,然后将该数字除以四,则我们对标准偏差的估计为13/4=3.25。这个数字相对接近真实的标准偏差,对粗略估计很好。

为什么有效?

似乎范围规则有点奇怪。为什么它有效?将范围划分为四个似乎并不完全随意?为什么我们不除以不同的数字?实际上在事后有一些数学理由。

回想一下钟形曲线的属性和标准正态分布的概率。一个特征与落在一定标准偏差范围内的数据量有关:

  • 大约68%的数据与平均值相差一个标准偏差(更高或更低)。
  • 大约95%of数据与平均值相差两个标准差(较高或较低)。
  • 大约99%与平均值相差三个标准差(较高或较低)。

我们将使用的数字与95%有关。我们可以说95%从低于平均值的两个标准偏差到高于平均值的两个标准偏差,我们有95%的数据。因此,我们几乎所有的正态分布都会延伸到总共四个标准偏差的线段上。

糖健康知识

并非所有数据都是正态分布且呈钟形曲线。但是大多数数据的行为都足够好,以至于偏离平均值两个标准差几乎可以捕获所有数据。我们估计并说四个标准偏差大约是范围的大小,因此范围除以四是标准偏差的粗略近似值。

用于范围规则

范围规则在许多设置中都很有用。首先,它是对标准偏差的非常快速的估计。标准差要求我们首先找到平均值,然后从每个数据点中减去该平均值,将差异平方,加上这些,除以小于数据点数量的一个,然后(**)取平方根。另一方面,范围规则只需要一次减法和一次除法。

范围规则有帮助的其他地方是我们信息不完整的地方。确定样本量的公式需要三条信息:所需的误差范围,置信水平和我们正在调查的人口的标准差。很多时候不可能知道人口标准差是什么。使用范围规则,我们可以估计这个统计量,然后知道我们应该做多少样本。