有或没有更换的取样

统计抽样可以通过多种不同的方式完成。除了我们使用的抽样方法的类型之外,还有另一个问题涉及我们随机选择的个人具体发生了什么。抽样时出现的问题是"在我们选择个人并记录测量值之后我们'重新学习,我们对个人做什么?"

有两种选择:

  • 我们可以将个人替换回我们正在采样的池中。
  • 我们可以选择不替换个人。

我们可以很容易地看到这些导致两种不同的情况。在**种选择中,替换留下了第二次随机选择个体的可能性。对于第二种选择,如果我们在没有替换的情况下工作,则不可能选择同一个人两次。我们将看到这种差异将影响与这些样本相关的概率的计算。生理健康知识

对概率的影响

要了解我们如何处理替换会影响概率的计算,请考虑以下示例问题。从标准甲板上抽取两个ACE的概率是多少?

这个问题是模棱两可的。一旦我们画了**张卡会发生什么?我们是把它放回甲板上,还是把它放出来?

我们从计算替换概率开始。共有四张ace和52张卡片,因此绘制一张ace的概率为4/52。如果我们更换此卡并再次绘制,则概率再次为4/52。这些事件是独立的,因此我们将概率(4/52)x(4/52)=1/169或大约0.592%乘以。

现在我们将把它与同样的情况进行比较,除了我们不更换卡片。**次抽奖时绘制ace的概率仍然是4/52。对于第二张卡,我们我们现在必须计算一个条件概率。换句话说,我们需要知道绘制第二个ace的概率,因为**张卡也是ace。

现在共有51张牌中剩余3张牌。因此,绘制ace后第二个ace的条件概率为3/51。绘制两个ace而不进行替换的概率为(4/52)x(3/51)=1/221,或约0.425%。

我们直接从上面的问题中看到,我们选择替换的内容会影响概率值。它可以显着改变这些值。

人口规模

在某些情况下,有或没有替换的抽样并没有实质性地改变任何概率。假设我们是从一个人口为50000的城市中随机选择两个人,其中30000人是女性。

如果我们用替换样本,那么**次选择女性的概率为30000/50000=60%。第二次选择女性的概率仍然为60%。两个人都是女性的概率为0.6 x 0.6=0.36。

如果我们在没有替换的情况下进行采样,那么**个概率不受影响。第二个概率现在是29999/49999=0.5999919998…,这非常接近60%。两者都是女性的概率是0.6 x 0.5999919998=0.359995。

概率在技术上是不同的,然而,它们足够接近几乎无法区分。因此,很多时候,即使我们在没有替换的情况下进行抽样,我们也会将每个人的选择视为独立于样本中的其他人。

其他应用程序

在其他情况下,我们需要考虑是否在有或没有更换的情况下进行采样。例如,这是自举. 该统计技术属于重采样技术的标题。

在引导中,我们从人口的统计样本开始。然后,我们使用计算机软件来计算引导程序样本。换句话说,计算机重新采样并更换初始样本。

教育资源网_1