什么是方差分析?

很多时候,当我们研究一个群体时,我们真的在比较两个群体。根据我们感兴趣的这个小组的参数和我们处理的条件,有几种技术可用。涉及两个种群比较的统计推断程序通常不能应用于三个或更多种群。为了一次研究两个以上的人群,我们需要不同类型的统计工具。方差分析或ANOVA是一种来自统计干扰的技术,它允许我们处理几个种群。

均值比较

为了了解出现什么问题以及为什么我们需要方差分析,我们将考虑一个例子。假设我们试图确定绿色,红色,蓝色和橙色M&M糖果的平均重量是否彼此不同。我们将分别说明每个群体的平均权重,μ,μ,μ和。我们可以多次使用适当的假设检验,并检验C(4,2)或六个不同的零假设:

  • H:μ=μ检查红色念珠菌种群的平均重量是否不同于蓝色念珠菌种群的平均重量。
  • H:μ=μ检查蓝色念珠菌种群的平均重量是否不同于绿色念珠菌种群的平均重量。
  • H:μ=μ检查平均值绿色糖果种群的重量不同于橙色糖果种群的平均重量。
  • H:μ=μ检查橙色糖果种群的平均重量是否不同于红色糖果种群的平均重量。
  • H:μ=μ检查红色糖果不同于绿色糖果种群的平均重量。
  • H:μ=μ检查蓝色糖果种群的平均重量是否不同于人口的平均重量橙色糖果。

这种分析存在许多问题。我们将有六个p-值。即使我们可以以95%的置信水平进行测试,但我们对整个过程的信心也小于此,因为概率乘以:.95 x.95 x.95 x.95 x.95大约是.74,或74%的信心水平。因此,I型错误的可能性增加了。

在更基本的层面上,我们无法通过一次比较两个参数来比较这四个参数。红色和蓝色M&Ms的平均值可能很重要,红色的平均重量相对大于蓝色的平均重量。但是,当我们考虑所有四种糖果的平均重量时,可能没有显着差异。

方差分析

为了处理我们需要进行多重比较的情况,我们使用ANOVA。该测试允许我们一次考虑几个群体的参数,而无需通过一次对两个参数进行假设检验来解决我们面临的一些问题。

为了用上面的M&M实施例进行ANOVA,我们将测试零假设H:μ=μ=μ=μ。这表明红色,蓝色和绿色M&Ms的平均权重之间没有差异。另一种假设是红色,蓝色,绿色和橙色M&Ms的平均权重之间存在一些差异。这个假设实际上是几个陈述的组合H:

  • 红色念珠菌群体的平均重量不等于蓝色念珠菌群体的平均重量,或
  • 蓝色念珠菌群体的平均重量不等于绿色念珠菌群体的平均重量,或
  • 绿色糖果种群的平均重量不等于橙色糖果种群的平均重量,或
  • 绿色糖果种群的平均重量不等于红色念珠菌群体的平均重量,或
  • 蓝色念珠菌群体的平均重量不等于橙色念珠菌群体的平均重量,或
  • 蓝色念珠菌群体的平均重量不等于红色念珠菌群体的平均重量。

在这个特定的例子中,为了获得我们的p值,我们将利用称为F分布的概率分布。涉及ANOVA F检验的计算可以手工完成,但通常用统计软件计算。

广州科普

多重比较

将ANOVA与其他统计技术分开的是它用于进行多重比较。这在整个统计数据中都很常见,因为有很多时候我们想比较两组以上。通常,总体测试表明我们正在研究的参数之间存在某种差异。然后,我们通过其他一些分析来确定哪个参数不同。