人口方差置信区间的例子

总体方差给出了如何展开数据集的指示。不幸的是,通常不可能确切地知道这个总体参数是什么。为了弥补我们缺乏知识,我们使用来自推理统计的主题,称为置信区间。我们将看到一个如何计算总体方差置信区间的例子

置信区间公式

关于总体方差的(1-α)置信区间的公式。由以下一系列不平等给出:

[(n-1)s2]/B2n-1)s2]/A

这里n是样本大小,s2是样本方差。数字A是具有n-1自由度的卡方分布点,其中曲线下面积的α/2恰好位于左侧>A。以类似的方式,数字B是相同卡方分布的点,曲线下面积的α/2正好在B的右侧。

预备

我们从具有10个值的数据集开始。这组数据值是通过简单的随机样本获得的:

97,7***4106120131,94,97,96102

需要一些探索性数据分析来表明没有异常值。通过构建茎叶图,我们可以看到这些数据可能来自近似正态分布的分布。这意味着我们可以继续寻找总体方差的95%置信区间。

样本方差

我们需要用样本方差来估计总体方差,用s2表示。所以我们首先计算这个统计量。本质上,我们是平均偏离平均值的平方和。然而,相当于将该总和除以n我们将其除以n-1。

我们发现样本均值是104.2。使用这个,我们得到的平均值的平方偏差之和由下式给出:

(97–104.2)2+(75–104.3)2+。+(96-104.2)96 2 97+(102-104.2)98 2 99 2495.6

我们将此总和除以10–1=9,以获得277的样本方差。生活常识百科宝典

卡方分布

我们现在转向我们的卡方分布。由于我们有10个数据值,因此我们有9个自由度。由于我们需要中间95%的分布,因此两个尾部中的每一个都需要2.5%。我们查阅卡方表或软件,看到2.7004和19.023的表值包含了分布面积的95%。这些数字分别为AB

我们现在拥有我们需要的一切,我们准备好组装我们的置信区间。左端点的公式为[(n-1)s2]/B。这意味着我们的左端点是:

(9 x 277)/19.023=133

通过用A替换B可以找到正确的端点:

(9 x 277)/2.7004=923

因此,我们有95%的信心人口差异在133到923之间。

人口标准差

当然,由于标准偏差是方差的平方根,因此该方法可用于构建总体标准偏差的置信区间。我们需要做的就是采取端点的平方根。结果将是标准偏差的95%置信区间。

科普_1