卡方拟合优度检验

卡方拟合优度检验是更一般的卡方检验的变体。此测试的设置是一个可以包含多个级别的单个分类变量。通常在这种情况下,我们将为分类变量考虑一个理论模型。通过这个模型,我们预计一定比例的人口将进入这些水平。拟合优度检验决定了我们理论模型中的预期比例与现实的匹配程度。

Null and Alternative hypothesis

拟合优度检验的零假设和替代假设看起来与我们其他一些假设检验不同。其中一个原因是卡方拟合优度检验是一种非参数方法。这意味着我们的测试不涉及单个总体参数。因此,零假设并不表示单个参数具有某个值。

我们从n水平的分类变量开始,令pi水平的人口比例。我们的理论模型对于每个比例具有q的值。零假设和替代假设的陈述如下:

健康小常识图片

  • H:p=q,p=q。p=q
  • H:对于至少一个ip不等于q

实际和预期计数

卡方统计量的计算涉及我们简单随机样本中数据的实际变量计数与这些变量的预期计数之间的比较。实际计数直接来自我们的样本。计算预期计数的方式取决于我们使用的特定卡方检验。

对于拟合优度测试,我们有一个理论模型来说明如何对我们的数据进行比例化。我们只需将这些比例乘以样本量n即可获得预期计数。

计算测试统计量

拟合优度检验的卡方统计量是通过比较我们分类变量每个级别的实际计数和预期计数来确定的。计算拟合优度检验的卡方统计量的步骤如下:

教育_1

  1. 对于每个级别,从预期计数中减去观察到的计数。
  2. 将这些差异中的每一个平方。
  3. 将这些平方差异中的每一个除以相应的预期值。
  4. 将前一步的所有数字加在一起。这是我们的卡方统计量。

如果我们的理论模型与观测数据完全匹配,那么预期计数将显示与我们变量的观测计数没有任何偏差。这意味着我们将具有零的卡方统计量。在任何其他情况下,卡方统计量将是一个正数。

自由度

自由度的数量不需要困难的计算。我们需要做的就是从分类变量的等级数量中减去一个。这个数字将告诉我们应该使用哪种无限卡方分布。

87>88>卡方表和P值

我们计算出的卡方统计量对应于具有适当自由度数的卡方分布上的特定位置。假设零假设为真,p值确定获得此极端检验统计量的可能性。我们可以使用卡方分布的值表来确定我们假设检验的p值。如果我们有可用的统计软件,那么这可以用来获得更好的p值估计。

决策规则

我们根据预定的显着性水平决定是否拒绝零假设。如果我们的p值是小于或等于此重要级别,则我们拒绝零假设。否则,我们不能拒绝零假设。