双样本T检验和置信区间的例子

有时在统计中,找出问题的例子是有帮助的。这些例子可以帮助我们找出类似的问题。在本文中,我们将详细介绍对两种人口均值进行推论统计的过程。我们不仅会看到如何对两种总体均值的差异进行假设检验,我们还将为此差异构建置信区间。我们使用的方法有时称为双样本t检验和双样本t置信区间。

问题陈述

假设我们希望测试小学生的数学能力。我们可能有的一个问题是,更高年级的平均考试成绩是否更高。

对27名三年级学生的简单随机样本进行数学测试,对他们的答案进行评分,结果发现平均得分为75分,样本标准差为3分。

对20名五年级学生的简单随机样本进行相同的数学测试,并对他们的答案进行评分。五年级学生的平均得分为84分,样本标准差为5分。

在这种情况下,我们提出以下问题:

  • 样本数据小学生生活小常识是否为我们提供证据表明所有五年级学生的平均考试成绩超过所有三年级学生的平均考试成绩?
  • 三年级和五年级人群平均考试成绩差异的95%置信区间是多少?

条件和程序

我们必须选择使用哪个程序。在这样做时,我们必须确保并检查是否满足此程序的条件。我们被要求比较两种人口手段。可以用来做到这一点的一组方法是双样本t程序的方法。

为了使用这些t-程序对于两个样品,我们需要确保以下条件成立:

  • 我们从两个感兴趣的人群中获得了两个简单的随机样本。
  • 我们的简单随机样本不占总人口的5%。
  • 这两个样本彼此独立,
  • 变量是正态分布的。
  • 两个总体的总体均值和标准差均未知。

我们看到大多数这些条件都得到了满足。我们被告知我们有简单的随机样本。我们正在研究的人口很多,因为这些年级有数百万学生。

我们无法自动假设的条件是测试分数是否正态分布。由于我们的样本量足够大,因此通过t过程的鲁棒性,我们不一定需要变量正态分布。

由于条件得到满足,我们进行了一些初步计算。

标准错误

标准误差是标准偏差的估计值。对于此统计信息,我们添加样本的样本方差,然后取平方根。这给出了公式:

s2/n+s2/n1/2

通过使用上面的值,我们可以看到标准错误的值是

(32/27+52/20)1/2=(1/3+5/4)1/2=1.2583

自由度

我们可以对我们的自由度使用保守的近似值。这可能低估了自由度的数量,但计算比使用Welch's公式要容易得多。我们使用两个样本中较小的一个,然后从这个数字中减去一个。

例如,两个样本中较小的一个是20。这意味着自由度数是20-1=19。

假设检验127 128

我们希望检验这样的假设:五年级学生的平均考试成绩大于三年级学生的平均成绩。设μ为所有五年级学生人口的平均分。同样,我们让μ是所有三年级学生人口的平均得分。

假设如下:

  • H:μ-μ=0
  • H:μ-μ>0

测试统计量是样本均值之间的差值,然后除以标准误差。由于我们使用样本标准差来估计总体标准差,因此t分布的检验统计量。

测试统计量的值是(84-75)/1.2583。这大约是7.15。

我们现在确定这个假设检验的p值是多少。我们查看测试统计量的值,以及它位于具有19个自由度的t分布上的位置。对于此分布,我们有4.2 x 10-7作为p值。(确定这一点的一种方法是使用T。DIST.RT在Excel中的功能。)

由于我们的p值很小,因此我们拒绝零假设。结论是五年级学生的平均考试成绩高于三年级学生的平均考试成绩。

置信区间

由于我们已经确定平均分数之间存在差异,因此我们现在确定这两种方法之间差异的置信区间。我们已经有了我们需要的大部分。差异的置信区间需要同时具有估计值和误差范围。

两种方法的差异的估计很容易计算。我们只是找到d样本均值的差异。样本均值的这种差异估计了总体均值的差异。

教育资源网_1

对于我们的数据,样本均值的差异为84–75=9。

误差幅度稍难计算。为此,我们需要将适当的统计量乘以标准误差。我们需要的统计数据是通过查阅表格或统计软件找到的。

再次使用保守近似,我们有19个自由度。对于95%的置信区间,我们看到t*=2.09。我们可以使用Excel中的T.INV函数来计算这个值。

我们现在把所有事情放在一起,看看我们的误差幅度是2.09 x 1.2583,大约是2.63。置信区间为9±2.63。在五年级和三年级学生选择的测试中,间隔为6.37至11.63分。