置信区间在推理统计中的应用

推理统计数据的名称来源于此统计分支中发生的事情。推理统计不是简单地描述一组数据,而是试图根据统计样本推断出有关人口的某些信息。推论统计中的一个具体目标涉及确定未知总体参数的值。我们用来估计这个参数的值的范围称为置信区间。

置信区间的形式

置信区间由两部分组成。**部分是人口参数的估计。我们通过使用简单的随机样本获得此估计值。从这个样本中,我们计算出与我们希望估计的参数相对应的统计量。例如,如果我们对美国所有一年级学生的平均身高感兴趣,我们将使用美国一年级学生的简单随机样本,测量所有这些样本,然后计算样本的平均身高。

置信区间的第二部分是误差范围。这是必要的,因为我们单独的估计可能与总体参数的真实值不同。为了允许参数的其他潜在值,我们需要生成一系列数字。误差范围是这样做的,每个置信区间都有以下形式:

估计±误差幅度

估计值位于区间的中心,然后我们从该估计值中减去并添加误差范围,以获得参数的值范围。

置信水平

附加到每个置信区间是一个信心水平。这是一个概率或百分比,表明我们应该归因于我们的置信区间的确定性。如果情况的所有其他方面相同,则置信水平越高,置信区间越宽。

这种信心水平可能会导致一些混乱。这不是关于抽样程序或人口的陈述。相反,它表明了建立置信区间的过程的成功。例如,从长远来看,置信度为80%的置信区间将每五次错过真实的总体参数。

从理论上讲,从零到一的任何数字都可以用于置信水平。在实践中,90%,95%和99%都是共同的信心水平。

误差范围

置信水平的误差幅度由几个因素决定。我们可以通过检查误差范围的公式来看到这一点。错误范围的形式是:

误差范围=(置信水平统计)*(标准偏差/误差)

置信水平的统计量取决于使用何种概率分布以及我们选择的置信水平。例如,如果C是我们的置信水平并且我们使用正态分布,则C优生健康知识是曲线下面积介于-z*z*。这个数字z*是我们的误差范围公式中的数字。

标准偏差或标准误差

我们的误差范围所需的另一个术语是标准偏差或标准误差。我们正在使用的分布的标准偏差在这里是**。但是,通常来自群体的参数是未知的。在实践中形成置信区间时,这个数字通常不可用。

为了解决知道标准偏差的这种不确定性,我们改为使用标准误差。对应于标准偏差的标准误差是该标准偏差的估计值。标准错误如此强大的原因在于它是从用于计算我们估计值的简单随机样本计算得出。没有额外的信息是必要的,因为样本为我们做了所有的估计。

不同的置信区间

有各种不同的情况需要置信区间。这些置信区间用于估计许多不同的参数。虽然这些方面不同,但所有这些置信区间都以相同的整体格式统一起来。一些常见的置信区间是人口平均数,人口方差,人口比例,两种人口均值的差异和两种人口比例的差异。