平均值,中位数和模式之间的经验关系

在数据集中,有各种描述性统计数据。平均值,中位数和模式都给出了数据中心的度量,但是它们以不同的方式计算:

  • 通过将所有数据值加在一起,然后除以值的总数来计算平均值。
  • 通过按升序列出数据值,然后在列表中找到中间值来计算中位数。
  • 通过计算每个值发生多少次来计算模式。频率**的值是模式。

从表面上看,这三个数字之间似乎没有联系。然而,事实证明,这些中心指标之间存在经验关系。

理论与经验

在我们继续之前,重要的是要了解我们在提及经验关系时所说的内容,并将其与理论研究进行对比。统计和其他知识领域的一些结果可以从理论上的一些先前的陈述中得出。我们从我们所知道的开始,然后使用逻辑,数学和演绎推理,看看这在哪里引导我们。结果是其他已知事实的直接后果。

与理论相比,是获取知识的经验方式。我们可以观察周围的世界,而不是从已经确立的原则推理。从这些观察中,我们可以对我们所看到的进行解释。大部分科学都是以这种方式完成的。实验给了我们经验数据。然后目标是制定适合所有数据的解释。

经验关系

在统计中,均值,中位数和模式之间存在经验关系。无数数据集的观察表明,大多数时候平均值之间的差异模式是平均值和中位数之差的三倍。等式中的这种关系是:

平均模式=3(平均值-中位数)。

示例

要了解上述与现实世界数据的关系,我们来看看2010年的美国州人口。以百万计,人口为:加利福尼亚州-36.4,德克萨斯州-23.5,纽约-19.3,佛罗里达州-18.1,伊利诺伊州-12.8,宾夕法尼亚州-12.4,俄亥俄州-11.5,密歇根州-10.1,格鲁吉亚-9.4,北卡罗来纳州-8.9,新泽西州社区开展健康知识讲座-8.7,弗吉尼亚州-7.6,马萨诸塞州-6.4,华盛顿州-6.4,印第安纳州-6.3,亚利桑那州-6.2,田纳西州-6.0,密苏里州-5.8,马里兰州-5.6,威斯康星州-5.6,明尼苏达州-5.2,科罗拉多州-4.8,阿拉巴马州-4.6,南卡罗来纳州-4.3,路易斯安那州-4.3,肯塔基州-4.2,俄勒冈州-3.7,俄克拉荷马州-3.6,康涅狄格州-3.5,爱荷华州-3.0,密西西比州-2.9,阿肯色州-2.8,堪萨斯州-2.8,犹他州-2.6,内华达州-2.5,新墨西哥州-2.0,西弗吉尼亚州-1.8,内布拉斯加州-1.8,爱达荷州-1.5,缅因州-1.3,新罕布什尔州-1.3,夏威夷-1.3,罗德岛-1.1,蒙大拿州-.9,特拉华州-.9,南达科他州-.8,阿拉斯加-.7,北达科他州-.6,佛蒙特州-.6,怀俄明州-.5

平均人口为600万。中位人口为425万。该模式是130万。现在我们将计算出与上述差异:

  • 平均模式=600万–130万=470万。
  • 3(平均中位数)=3(600万–425万)=3(175万)=525万。

虽然这两个差异数字不完全匹配,但它们彼此相对接近。

应用程序

上述公式有几个应用程序。假设我们没有数据值列表,但知道平均值,中位数或模式中的任何两个。上述公式可用于估算第三个未知数量。

例如,如果我们知道我们的平均值是10,那么一个月de of 4,我们的数据集的中位数是多少?由于平均模式=3(平均值-中位数),我们可以说10-4=3(10中位数)。通过一些代数,我们看到2=(10中位数),因此我们数据的中位数为8。

上述公式的另一个应用是计算偏度。由于偏度测量平均值和模式之间的差异,我们可以计算3(平均值-模式)。为了使这个数量无量纲,我们可以将其除以标准偏差,给出一种计算偏度的替代方法,而不是使用统计中的矩。

教育资源网_1

注意事项

如上所述,以上不是确切的关系。相反,这是一个很好的经验法则,类似于范围规则,它在标准偏差和范围之间建立了近似的联系。平均值,中位数和模式可能不完全符合上述经验关系,但很有可能它会相当接近。