如何用卡方表找到临界值
统计表的使用是许多统计课程中的常见主题。虽然软件进行计算,阅读表格的技巧仍然是一个重要的。我们将看到如何使用卡方分布的值表来确定临界值。我们将使用的表格位于此处,但其他卡方表格的布置方式与此非常相似。
Critical Value
我们将检查的卡方表的使用是确定临界值。临界值在假设检验和置信区间中都很重要。对于假设检验,临界值告诉我们我们拒绝零假设所需的检验统计量的极端程度。对于置信区间,临界值是计算误差幅度的要素之一。
为了确定临界值,我们需要知道三件事:
- 自由度数
- 尾部的数量和类型
- 显着性水平。
自由度
**个重要的项目是自由度的数量。这个数字告诉我们在我们的问题中使用的多少个卡方分布中的哪一个。我们确定这个数字的方式取决于我们使用卡方分布的确切问题。下面是三个常见的例子。
- 如果我们进行拟合优度检验,则自由度数比模型的结果数少一个。
- 如果我们正在为总体方差构建置信区间,那么自由度数比我们样本中的值数少一个。
- 对于两个分类变量独立性的卡方检验,我们有一个双向列联表,r行和c列。自由度数dom是(r-1)(c-1)。
在此表中科普内容,自由度数对应于我们将使用的行。
如果我们使用的表格没有显示我们问题所要求的确切自由度,那么我们就有一个经验法则。我们将自由度数舍入到**的tabled值。例如,假设我们有59个自由度。如果我们的桌子只有50和60自由度的线条,那么我们使用50自由度的线条。
Tails
接下来我们需要考虑的是正在使用的尾部的数量和类型。卡方分布向右倾斜,因此通常使用涉及右尾的单侧测试。但是,如果我们计算的是双向置信区间,那么我们需要考虑在卡方分布中同时具有左右尾的两尾检验。
置信水平
我们需要知道的**一条信息是信心或重要性的水平。这是通常由alpha表示的概率。然后,我们必须将此概率(以及有关我们尾巴的信息)转换为与表格一起使用的正确列。很多时候,这一步取决于我们的表格是如何构建的。
示例
例如,我们将考虑十二面模具的适合度测试。我们的零假设是,所有方面都同样可能被滚动,因此每一方都有1/12的滚动概率。由于有12个结果,因此有12-1=11个自由度。这意味着我们将使用标记为11的行进行计算。
拟合优度测试是单尾测试。我们用于此的尾巴是右尾巴。假设显着性水平为0.05=5%。这是概率发行的右尾。我们的表格是根据左尾的概率设置的。所以我们临界值的左侧应该是1-0.05=0.95。这意味着我们使用对应于0.95和第11行的列给出临界值19.675。
如果我们从数据中计算出的卡方统计量大于或等于19.675,则我们拒绝5%显着性的零假设。如果我们的卡方统计量小于19.675,那么我们不能拒绝零假设。