方差分析计算的例子

单因素方差分析,也称为方差分析,为我们提供了一种对几种总体均值进行多重比较的方法。我们可以同时查看所有正在考虑的方法,而不是以成对的方式执行此操作。要进行ANOVA测试,我们需要比较两种变化,样本均值之间的变化以及每个样本内的变化。

我们将所有这些变化组合成一个统计量,称为F统计量,因为它使用F分布。我们通过将样本之间的差异除以每个样本内的差异来做到这一点。这样做的方法通常由软件处理,但是,看到一个这样的计算结果有一定的价值。

很容易在接下来的事情中迷路。以下是我们将在下面的示例中遵循的步骤列表:

  1. 计算每个样本的样本均值以及所有样本数据的均值。
  2. 计算误差平方和。在每个样本中,我们将每个数据值与样本均值的偏差平方。所有平方偏差的总和是误差平方和,缩写为SSE。
  3. 计算处理平方和。我们将每个样本均值与总体均值的偏差平方。所有这些平方偏差的总和乘以我们拥有的样本数量的一个。这个数字是处理的平方和,缩写为SST。饮水健康知识
  4. 计算自由度。自由度的总数比我们样本中的数据点总数少一个,或n-1。处理自由度的数量少于所用样品的数量,或m-1。误差自由度的数量是数据点的总数减去样本数,或n-m
  5. 计算误差的均方。这表示为MSE=SSE/(n-m)。
  6. 计算治疗的均方。这表示为MST=SST/m-`1。
  7. 计算F统计量。这是我们计算的两个均方的比率。所以F=MST/MSE。

软件可以很容易地完成所有这些工作,但很好地知道后台发生了什么。在下文中,我们按照上面列出的步骤编写一个方差分析的例子。

数据和样本均值

假设我们有四个独立的群体满足单因素方差分析的条件。我们希望检验零假设H:μ=μ=μ=μ。出于本示例的目的,我们将使用来自每个正在研究的群体的大小为3的样本。我们样本中的数据是:

  • 来自群体的样本#1:12,9,12。样本平均值为11.
  • 来自群体#2:7,10,13的样本。样本平均值为10.
  • 来自群体#3:5,8,11的样本。样本平均值为8.
  • 来自群体的样本#4:5,8,8。样本平均值为7.

所有数据的平均值是9。

误差平方和

我们现在计算每个样本均值的平方偏差之和。这被称为误差平方和。

    (12-11)2+(9-11)2+(12-11)2=6
  • (2:(7-10)2+(10-10)2++(13-10)2
  • 对于来自群体的样本1:(12-11)2+(9-11)2++(12-11)2=6
  • (2:(7-10)2++(10-10)2

    +(13-10)2

    +(13-10)2+(11–8)2=18
  • 来自群体#4的样本:(5-7)2+(8-7)2+(8-7)2=6。

然后我们加上所有这些平方偏差之和,得到6+18+18+6=48。

治疗平方和

现在我们计算治疗的平方和。在这里,我们查看每个样本均值与总体均值的平方偏差,并将此数字乘以小于总体数的一个:

3[(11-9)2+(10-9)2+(8-9)2+(7-9)2]=3[4+1+1+4]=30。

自由度

在进行下一步之前,我们需要自由度。有12个数据值和4个样本。因此,治疗自由度的数量是4-1=3。误差自由度的数量是12-4=8。

均方

现在,我们将平方和除以适当数量的自由度,以获得均方。

  • 治疗的均方为30/3=10。
  • 误差的均方为48/8=6。

F统计量

**一步是将治疗的均方除以误差的均方。这是数据的F统计量。因此,对于我们的示例F=10/6=5/3=1.667。

值表或软件可用于确定仅凭偶然性获得与该值一样极端的F统计量值的可能性。