如何在统计中找到自由度

许多统计推断问题要求我们找到自由度的数量。自由度数从无限多中选择单个概率分布。在置信区间的计算和假设检验的工作中,这一步骤是一个经常被忽视但至关重要的细节。

自由度数没有一个通用公式。但是,在推论统计中,每种类型的过程都使用特定的公式。换句话说,我们正在进行的设置将决定自由度的数量。接下来是一些最常见的推理过程的部分列表,以及每种情况下使用的自由度数。

Standard Normal Distribution

列出了涉及标准正态分布的程序的完整性并澄清了一些误解。这些程序不要求我们找到自由度的数量。原因是存在单个标准正态分布。这些类型的程序包括已知人口标准偏差时涉及人口平均数的程序,以及涉及人口比例的程序。

One Sample T Procedures

有时统计实践要求我们使用学生的t分布。对于这些程序,例如处理人口标准偏差未知的人口均值的程序,自由度数比样本量少一个。因此,如果样本大小为n,则存在n-1个自由度。

T程序与配对数据

很多时候将数据视为配对是有意义的。配对通常是由于我们对中**个和第二个值之间的连接而执行的。我们会在测量之前和之后配对很多次。我们的pai样本红色数据不是独立的;但是,每对之间的差异是独立的。因此,如果样本具有总共n对数据点(总共2n值),则存在n-1个自由度。

两个独立人群的T程序

对于这些类型的问题,我们仍在使用t分布。这次是我们每个人口的样本。尽管**将这两个样本的大小相同,但对于我们的统计程序而言这并不是必需的。因此,我们可以有两个大小分别为nn的样本家庭安全小常识。有两种方法可以确定自由度数。更准确的方法是使用韦尔奇公式,这是一个计算繁琐的公式,涉及样本量和样本标准偏差。另一种方法,称为保守近似,可用于快速估计自由度。这只是两个数字n-1和n-1中的较小者。

卡方独立

卡方检验的一个用途是查看两个分类变量(每个变量都有几个级别)是否表现出独立性。关于这些变量的信息记录在具有r行和c列的双向表中。自由度数是乘积(r-1)(c-1)。

卡方拟合优度

卡方拟合优度从单个分类变量开始,总共n个级别。我们测试这个变量与预定模型匹配的假设。自由度的数量比等级的数量少一个。换句话说,有n-1个自由度。

单因素方差分析

单因素方差分析(ANOVA)允许我们在几个群体之间进行比较,消除了多重成对假设的需要是测试。由于测试要求我们测量几个组之间的变化以及每个组内的变化,因此我们最终得到两个自由度。用于单因素方差分析的F统计量是一个分数。分子和分母各自具有自由度。令c为组数,n为数据值总数。分子的自由度数小于组数,或c-1。分母的自由度数是数据值的总数减去组数,或n-c

很明显,我们必须非常小心地知道我们正在使用哪种推理程序。这些知识将告诉我们正确的使用自由度数量。