两种人口比例差异的假设检验

在本文中,我们将针对两个人口比例的差异,通过执行假设检验或显着性检验所需的步骤。这使我们能够比较两个未知比例,并推断它们是否彼此相等或是否一个大于另一个。

假设检验概述和背景

在我们进入假设检验的具体细节之前,我们将看看假设检验的框架。在一个重要的检验中,我们试图证明关于人口参数的价值(或者有时是人口本身的性质)的陈述可能是正确的。

我们通过进行统计样本来积累这个陈述的证据,我们从这个样本中计算出一个统计量税务小知识,这个统计量的价值就是我们用来确定原始陈述的真实性,这个过程包含了不确定性,但是我们能够量化这个不确定性

假设检验的整个过程由下表给出:

  1. 确保满足我们测试所需的条件。
  2. 明确说明零假设和替代假设。另一种假设可能涉及单侧或双侧检验。我们还应该确定显着性水平,用希腊字母alpha表示。
  3. 计算检验统计量。我们使用的统计类型取决于我们正在进行的特定测试。计算依赖于我们的统计样本。
  4. 计算p值。检验统计量可以转换为p值.p值是在零假设为真的假设下单独产生检验统计量值的概率。总体规则是p值越小,反对原假设的证据就越大。
  5. 得出结论。**,我们使用已经选择的alpha值作为阈值ld值。决策规则是,如果p值小于或等于alpha,则我们拒绝零假设。否则我们不能拒绝零假设。

现在我们已经看到了假设检验的框架,我们将看到两个人口比例差异的假设检验的细节。

Conditions

对两种人口比例差异的假设检验要求满足以下条件:

  • 我们有两个来自大群体的简单随机样本。这里"大"意味着群体至少比样本大小大20倍。样本量用51 n 52和53 n 54表示。我们样本中的个体是彼此独立选择的。种群本身也必须是独立的。在我们的两个样本中,至少有10个成功和10个失败。59

只要满足这些条件,我们就可以继续进行假设检验。

科普_1

原假设和替代假设

现在我们需要考虑我们的显着性检验的假设。零假设是我们的无效陈述。在这种特定类型的假设检验中,我们的零假设是两个人口比例之间没有差异。我们可以写这为H:p=p

另一种假设是三种可能性之一,具体取决于我们正在测试的具体情况:

  • H:p大于p。这是一个单尾或单侧测试。
  • H:p小于p。这也是单面测试。
  • H:p不等于p。这是一个双尾或双面测试。

和往常一样,为了谨慎起见,如果我们这样做,我们应该使用双面替代假设在我们获得样本之前没有一个方向。这样做的原因是很难用双面检验来拒绝零假设。

可以通过说明p-p如何与值零相关来重写这三个假设。更具体地说,零假设将变为H:p-p=0。潜在的替代假设将写为:

  • H:p-p>0等于语句&\#34;pp大于p&\35; 34;
  • H:p-p&

    p小于pp-p&>gt;0等于语句#>34;

    pp-ppppp≠0等于语句"p不等于p"

这个等效公式实际上向我们展示了事后发生的事情。我们在这个假设检验中所做的是将两个参数pp转换为单个参数p-p然后我们根据值零测试这个新参数。

检验统计量

测试统计的公式在上图中给出。每个术语的解释如下:

    **个种群的样本大小为177178个,这个样本的成功数量(在上面的公式中没有直接看到)为179个k 180个181个182个,第二个种群的样本大小为183个n 184个,这个样本的成功数量为185个k 186 187个,样本比例为p-hat 189k 190/191/n 192和p 193-hat k 194/195/n 196/197.198/199/200然后我们结合或汇集这两个样本的成功,得到:201 p-hat(k+k)/(n+n).202.203

与往常一样,在计算时要小心操作顺序。Everythi在取平方根之前,必须计算根下方的ng。

P值213 214

下一步是计算与我们的测试统计数据相对应的p值。我们使用标准正态分布进行统计,并查阅值表或使用统计软件。

我们的p值计算的细节取决于我们使用的替代假设:

  • 对于H:p-p>0,我们计算正态分布的比例大于Z
  • 对于H:p-p

    Z。

  • 对于H:p-p≠0,我们计算正态分布大于|Z|,**值Z。此后,为了说明我们进行了两尾检验的事实,我们将比例加倍。

决策规则

现在我们决定是否拒绝零假设(从而接受替代方案),或者不拒绝零假设。我们通过将我们的p值与显着性水平α进行比较来做出这个决定。

  • 如果p值小于或等于alpha,则我们拒绝零假设。这意味着我们有一个统计上显着的结果,并且我们将接受替代假设。
  • 如果p值大于alpha,则我们不能拒绝零假设。这并不能证明零假设是正确的。相反,这意味着我们没有获得足够令人信服的证据来拒绝零假设。

特别说明

两个种群比例差异的置信区间并不能集中成功,而假设检验确实如此。原因是在我们的零假设假设p-p=0。置信区间不假设这一点。一些统计学家没有将这一假设检验的成功集中起来,而是使用稍微修改的版本的上述测试统计。

311