计算平均值的置信区间

推论统计涉及从统计样本开始然后达到未知的总体参数值的过程。未知值不是直接确定的。相反,我们最终得出的估计值属于一系列值。该范围在数学术语中是实数的间隔,并且特别称为置信区间。

置信区间在几个方面都是相似的。双面置信区间都有相同的形式:

估计±误差范围

置信区间的相似性也扩展到用于计算置信区间的步骤。当人口标准偏差未知时,我们将研究如何确定人口平均数的双侧置信区间。一个基本的假设是我们是从正态分布的人口中抽样的。

具有未知Sigma

的均值的置信区间过程

我们将通过查找所需置信区间所需的步骤列表。尽管所有步骤都很重要,但**步尤其如此:

  1. 检查条件:首先确保满足我们置信区间的条件。我们假设用希腊字母sigmaσ表示的总体标准差的值是未知的,并且我们正态分布。只要我们的样本足够大并且没有异常值或极端偏度,我们可以放宽假设,即我们具有正态分布。
  2. 计算估计值:我们估计我们的人口参数,在这种情况下,通过使用统计量,总体平均值在这种情况下是样本平均值。这涉及从我们的人口中形成一个简单的随机样本。有时我们可以假设我们的样本是一个简单的随机样本,即使它不符合严格的定义。
  3. 临界值:我们获得与我们的置信度相对应的临界值t*。通过查阅t分数表或使用软件可以找到这些值。如果我们使用表格,我们需要知道自由度的数量。自由度数比我们样本中的个体数少一个。
  4. 误差幅度:计算误差幅度t*s/√n,其中n是我们形成的简单随机样本的大小,s是样本标准偏差,
  5. 结论:通过汇总估计值和误差范围来完成。这可以表示为估计±误差幅度女性生理健康常识估计-误差幅度估计+误差幅度。在我们置信区间的陈述中,重要的是要指出置信水平。这只是我们置信区间的一部分,与估计值和误差范围的数字一样。

示例

为了了解我们如何构建置信区间,我们将通过一个例子来解决。假设我们知道特定种类豌豆植物的高度是正态分布的。30个豌豆植物的简单随机样本的平均高度为12英寸,样本标准偏差为2英寸。整个豌豆植物种群的平均高度的90%置信区间是多少?

我们将完成上述步骤:

  1. 检查条件:由于人口标准偏差未知,我们正在处理正态分布,因此满足了条件。
  2. 计算估计值:我们已经被告知我们有30个豌豆植物的简单随机样本。此样本的平均高度为12英寸,因此这是我们的估计值。
  3. 临界值:我们的样本尺寸为30,因此有29个自由度。置信水平为90%的临界值由t*=1.699给出。
  4. 误差范围:现在我们使用误差范围公式并获得t*s/√n=(1.699)(2)/√(30)=0.620。
  5. 结论:我们把所有事情放在一起一起。人口平均身高得分的90%置信区间为12±0.62英寸。或者,我们可以将此置信区间声明为11.38英寸至12.62英寸。

实际考虑

上述类型的置信区间比统计课程中可能遇到的其他类型更现实。知道人口标准差但不知道人口平均数是非常罕见的。在这里,我们假设我们不知道这两个总体参数。