置信区间:4个常见错误

置信区间是推论统计的关键部分。我们可以使用概率分布中的一些概率和信息来使用样本来估计总体参数。置信区间的陈述以容易被误解的方式进行。我们将研究置信区间的正确解释,并调查有关这一统计领域的四个错误。

什么是置信区间?

置信区间可以表示为值的范围或以下形式:

估计±Margin of Error

置信区间通常以置信水平表示。共同置信水平分别为90%,95%和99%。

我们将看看一个例子,我们想用一个样本均值来推断总体的平均值。假设这导致置信区间从25到30。如果我们说我们有95%的信心在这个区间内包含未知的人口平均值,那么我们真的说我们使用一种方法找到了这个区间,这种方法在95%的时间内成功地给出了正确的结果。从长远来看,我们的方法在5%的时间内不会成功。换句话说,我们将无法捕捉到每20次中只有一次的真实人口。

错误#1

现在,我们将研究在处理置信区间时可以犯的一系列不同的错误。通常在95%置信水平下对置信区间做出的一个错误陈述是置信区间包含总体真实平均值的可能性为95%。

这是一个错误的原因实际上非常微妙。关于置信区间的关键思想是,在确定置信区间时,所使用的概率用所使用的方法进入图像,它指的是我那是用过的。

错误#2

第二个错误是将95%的置信区间解释为人口中所有数据值的95%落在区间内。再次,95%的人提到了测试方法。

为了解释为什么上述说法不正确,我们可以考虑标准差为1,平均值为5的正常人群。具有两个数据点的样本,每个数据点的值为6,样本平均值为6。人口平均值的95%置信区间为4.6至7.4。这显然与95%的正态分布不重叠,因此它将不包含95%的人口。

错误#3

第三个错误是说95%的置信区间意味着所有可能的样本均值的早餐小知识95%落在区间的范围内。重新考虑上一节中的示例。任何仅包含小于4.6的值的大小2的样本将具有小于4.6的平均值。因此,这些样本均值将超出此特定置信区间。符合此说明的样品占总量的5%以上。所以说这个置信区间占所有样本均值的95%是错误的。

错误#4

处理置信区间的第四个错误是认为它们是**的错误来源。虽然存在与置信区间相关的误差幅度,但还有其他地方误差可能会蠕变到统计分析中。这些错误的几个例子可能来自实验的不正确设计,采样偏差或无法从某一群体子集获得数据。

科普_1