两种人口比例差异的假设检验
在本文中,我们将针对两个人口比例的差异,通过执行假设检验或显着性检验所需的步骤。这使我们能够比较两个未知比例,并推断它们是否彼此相等或是否一个大于另一个。
假设检验概述和背景
在我们进入假设检验的具体细节之前,我们将看看假设检验的框架。在一个重要的检验中,我们试图证明关于人口参数的价值(或者有时是人口本身的性质)的陈述可能是正确的。
我们通过进行统计样本来积累这个陈述的证据,我们从这个样本中计算出一个统计量税务小知识,这个统计量的价值就是我们用来确定原始陈述的真实性,这个过程包含了不确定性,但是我们能够量化这个不确定性
假设检验的整个过程由下表给出:
- 确保满足我们测试所需的条件。
- 明确说明零假设和替代假设。另一种假设可能涉及单侧或双侧检验。我们还应该确定显着性水平,用希腊字母alpha表示。
- 计算检验统计量。我们使用的统计类型取决于我们正在进行的特定测试。计算依赖于我们的统计样本。
- 计算p值。检验统计量可以转换为p值.p值是在零假设为真的假设下单独产生检验统计量值的概率。总体规则是p值越小,反对原假设的证据就越大。
- 得出结论。**,我们使用已经选择的alpha值作为阈值ld值。决策规则是,如果p值小于或等于alpha,则我们拒绝零假设。否则我们不能拒绝零假设。
现在我们已经看到了假设检验的框架,我们将看到两个人口比例差异的假设检验的细节。
Conditions
对两种人口比例差异的假设检验要求满足以下条件:
- 我们有两个来自大群体的简单随机样本。这里"大"意味着群体至少比样本大小大20倍。样本量用51 n 52和53 n 54表示。我们样本中的个体是彼此独立选择的。种群本身也必须是独立的。在我们的两个样本中,至少有10个成功和10个失败。59
只要满足这些条件,我们就可以继续进行假设检验。
原假设和替代假设
现在我们需要考虑我们的显着性检验的假设。零假设是我们的无效陈述。在这种特定类型的假设检验中,我们的零假设是两个人口比例之间没有差异。我们可以写这为H:p=p。
另一种假设是三种可能性之一,具体取决于我们正在测试的具体情况:
- H:p大于p。这是一个单尾或单侧测试。
- H:p小于p。这也是单面测试。
- H:p不等于p。这是一个双尾或双面测试。
和往常一样,为了谨慎起见,如果我们这样做,我们应该使用双面替代假设在我们获得样本之前没有一个方向。这样做的原因是很难用双面检验来拒绝零假设。
可以通过说明p-p如何与值零相关来重写这三个假设。更具体地说,零假设将变为H:p-p=0。潜在的替代假设将写为:
- H:p-p>0等于语句&\#34;pp大于p&\35; 34;
- H:p-p&
p小于pp-p&>gt;0等于语句#>34;
pp-ppppp≠0等于语句"p不等于p"
这个等效公式实际上向我们展示了事后发生的事情。我们在这个假设检验中所做的是将两个参数p和p转换为单个参数p-p然后我们根据值零测试这个新参数。
检验统计量
测试统计的公式在上图中给出。每个术语的解释如下:
- **个种群的样本大小为177178个,这个样本的成功数量(在上面的公式中没有直接看到)为179个k 180个181个182个,第二个种群的样本大小为183个n 184个,这个样本的成功数量为185个k 186 187个,样本比例为p-hat 189k 190/191/n 192和p 193-hat k 194/195/n 196/197.198/199/200然后我们结合或汇集这两个样本的成功,得到:201 p-hat(k+k)/(n+n).202.203
与往常一样,在计算时要小心操作顺序。Everythi在取平方根之前,必须计算根下方的ng。
P值213 214下一步是计算与我们的测试统计数据相对应的p值。我们使用标准正态分布进行统计,并查阅值表或使用统计软件。
我们的p值计算的细节取决于我们使用的替代假设:
- 对于H:p-p>0,我们计算正态分布的比例大于Z。
- 对于H:p-p
Z。
- 对于H:p-p≠0,我们计算正态分布大于|Z|,**值Z。此后,为了说明我们进行了两尾检验的事实,我们将比例加倍。
决策规则
现在我们决定是否拒绝零假设(从而接受替代方案),或者不拒绝零假设。我们通过将我们的p值与显着性水平α进行比较来做出这个决定。
- 如果p值小于或等于alpha,则我们拒绝零假设。这意味着我们有一个统计上显着的结果,并且我们将接受替代假设。
- 如果p值大于alpha,则我们不能拒绝零假设。这并不能证明零假设是正确的。相反,这意味着我们没有获得足够令人信服的证据来拒绝零假设。
特别说明
两个种群比例差异的置信区间并不能集中成功,而假设检验确实如此。原因是在我们的零假设假设p-p=0。置信区间不假设这一点。一些统计学家没有将这一假设检验的成功集中起来,而是使用稍微修改的版本的上述测试统计。
311