统计和数学的自由度

在统计中,自由度用于定义可以分配给统计分布的独立数量的数量。这个数字通常是指一个正数,表示对一个人没有限制'从统计问题中计算缺失因子的能力。

自由度在统计量的最终计算中充当变量,用于确定系统中不同场景的结果,数学自由度定义确定完整向量所需的域中的维度数量。

为了说明自由度的概念,我们将查看有关样本均值的基本计算,并找到数据列表的均值,我们添加所有数据并除以值的总数。

样本均值

的插图

暂时假设我们知道数据集的平均值是25,并且该集中的值是20,10,50和一个未知数字。样本均值的公式给出了方程(20+10+50+x)/4=25,其中x表示未知,使用一些基本代数,可以然后确定缺失的数字x等于20。

让's稍微改变这种情况。我们再次假设我们知道数据集的平均值是25。但防溺水小知识是,这次数据集中的值是20,10和两个未知值。这些未知数可能不同,所以我们使用两个不同的变量xy,来表示这一点。所得方程为(20+10+x+y)/4=25。通过一些代数,我们得到y=70-x。该公式以这种形式编写,以显示一旦我们选择x的值,y的值就完全确定。我们有一个选择,这表明有一个自由度。

现在我们来看看一百分之一的样本量d、 如果我们知道这个样本数据的平均值是20,但不知道任何数据的值,那么就有99个自由度。所有值必须总计20 x 100=2000。一旦我们在数据集中有99个元素的值,那么**一个已经确定。

学生t分数和卡方分布

使用Studentt得分表时,自由度起着重要作用。实际上有几个t分数分布。我们通过使用自由度来区分这些分布。

在这里,我们使用的概率分布取决于样本的大小。如果我们的样本量为n,则自由度数为n-1。例如,样本量为22将要求我们使用具有21个自由度的t得分表的行。

卡方分布的使用还需要使用自由度。在此,以与t分数分布相同的方式,样本大小决定了使用哪个分布。如果样本量n,则存在n-1自由度。

标准偏差和先进技术

自由度出现的另一个地方是标准偏差的公式。这种情况并不那么明显,但是如果我们知道在哪里看,我们可以看到它。为了找到标准偏差,我们正在寻找"平均值"与平均值的偏差。但是,在从每个数据值中减去平均值并将差异平方后,我们最终除以n-1,而不是像我们预期的那样n

n-1的存在来自自由度数。由于公式中使用了n数据值和样本均值,因此存在n-1自由度。

更先进的统计技术es使用更复杂的计算自由度的方法。当计算具有nn元素的独立样本的两个均值的检验统计量时,自由度数具有相当复杂的公式。它可以用108 n-1109和110 n-1111的较小值来估计

另一个计算自由度的不同方法的例子是F测试。在进行118 F 119测试时,我们有120 k 121个样本,每个样本的大小为122 n 123--分子的自由度为124 k 125-1,分母为126 k 127(128 n 129-1)。