手段置信区间的例子

推理统计的主要部分之一是开发计算置信区间的方法。置信区间为我们提供了一种估计总体参数的方法。我们不是说该参数等于一个确切的值,而是说该参数落在一个值的范围内。这个值的范围通常是一个估计值,以及我们从估计值中添加和减去的误差范围。

附加到每个间隔是一个信心水平。置信水平可以衡量从长远来看,用于获得置信区间的方法捕获真实总体参数的频率。

了解统计数据时,看到一些例子是有帮助的。下面我们将看看几个关于人口平均数的置信区间的例子。我们将看到,我们用来构建关于均值的置信区间的方法取决于有关我们人口的更多信息。具体而言,我们采取的方法取决于我们是否知道人口标准差。

问题陈述

我们从25个特定种类的蝾螈的简单随机样本开始并测量它们的尾巴。我们样品的平均尾巴长度为5厘米。

  1. 如果我们知道0.2厘米是人口中所有蝾螈尾部长度的标准偏差,那么人口中所有蝾螈的平均尾部长度的90%置信区间是多少?
  2. 如果我们知道0.2厘米是人口中所有蝾螈尾部长度的标准偏差上海航宇科普中心,那么人口中所有蝾螈的平均尾部长度的95%置信区间是多少?
  3. 如果我们发现0.2厘米是我们样本中蝾螈尾部长度的标准偏差,那么人口中所有蝾螈的平均尾部长度的90%置信区间是多少?
  4. 如果我们发现0.2厘米是立场我们样本中蝾螈尾长的偏差人口,那么人口中所有蝾螈的平均尾长的95%置信区间是多少?

讨论问题

我们首先分析这些问题。在前两个问题中,我们知道人口标准差的价值。这两个问题之间的区别在于,2的置信水平大于1。

在后两个问题中,人口标准差是未知的。对于这两个问题,我们将使用样本标准偏差来估计此参数。正如我们在前两个问题中看到的那样,在这里我们也有不同程度的信心。

Solutions

我们将计算上述每个问题的解决方案。

  1. 由于我们知道总体标准差,因此我们将使用z分数表。对应于90%置信区间的z的值为1.645。通过使用误差范围的公式,我们的置信区间为5–1.645(0.2/5)至5+1.645(0.2/5)。(这里分母中的5是因为我们取了25的平方根)。进行算术后,我们将4.934 cm至5.066 cm作为总体平均值的置信区间。
  2. 由于我们知道总体标准差,因此我们将使用z分数表。对应于95%置信区间的z值为1.96。通过使用误差范围的公式,我们的置信区间为5–1.96(0.2/5)至5+1.96(0.2/5)。在进行算术之后,我们有4.922 cm到5.078 cm作为总体平均值的置信区间。
  3. 在这里,我们不知道总体标准偏差,只是样本标准偏差。因此,我们将使用t分数表。当我们使用t分数表时,我们需要知道我们有多少自由度。在这种情况下是24个自由度,比样本量25小一个。对应于90%置信区间的t的值是1.71。通过使用误差范围的公式,我们的置信区间为5–1.71(0.2/5)至5+1.71(0.2/5)。进行算术后,我们将4.932 cm至5.068 cm作为总体平均值的置信区间。
  4. 在这里,我们不知道总体标准偏差,只知道样本标准偏差。因此,我们将再次使用t分数表。有24个自由度,比样本量25小一个。对应于95%置信区间的t的值为2.06。通过使用误差范围的公式,我们的置信区间为5–2.06(0.2/5)至5+2.06(0.2/5)。进行算术后,我们将4.912 cm至5.082 cm作为总体平均值的置信区间。

讨论解决方案

比较这些解决方案有几点需要注意。首先,在每种情况下,随着我们信心水平的提高,我们最终得出的zt的值越大。其原因是,为了更确信我们确实在置信区间内捕获了人口均值,我们需要更宽的区间。

另一个需要注意的特征是,对于特定的置信区间,使用t的置信区间比使用z的置信区间宽。其原因是,与标准正态分布相比,at分布的尾巴变异性更大。

纠正这些类型问题的关键是,如果我们知道总体标准偏差,我们使用z-分数表。如果我们不知道总体标准差,那么我们使用t分数表。