什么是抽样分布

统计抽样在统计中经常使用。在这个过程中,我们的目标是确定一些关于人口的事情。由于种群通常规模较大,我们通过选择具有预定大小的种群子集来形成统计样本。通过研究样本,我们可以使用推论统计来确定有关人口的信息。

大小n的统计样本涉及从人群中随机选择的n个人或受试者的单个组。与统计样本的概念密切相关的是抽样分布。

采样分布的起源

当我们从给定群体形成多个相同大小的简单随机样本时,就会发生抽样分布。这些样本被认为是彼此独立的。因此,如果一个人在一个样本中,那么它与下一个样本中的可能性相同。

我们为每个样本计算一个特定的统计量。这可以是样本均值,样本方差或样本比例。由于统计量取决于我们拥有的样本,因此每个样本通常会为感兴趣的统计量产生不同的值。已经产生的值的范围是我们的抽样分布。

均值的抽样分布

例如,我们将考虑均值的抽样分布。总体的平均值是通常未知的参数。如果我们选择大小为100的样本,则可以通过将所有值加在一起然后除以数据点总数(在这种情况下为100)来轻松计算此样本的平均值。一个大小为100的样本可以给我们平均值50。另一个这样的样本可能有49的平均值。另外51个样本的平均值可能为50.5。

这些样本均值的分布给了我们一个抽样分布ibution。如上所述,我们希望考虑的不仅仅是四种样本方法。有了更多的样本意味着我们可以很好地了解样本分布的形状英文健康知识

为什么我们关心?

抽样分布可能看起来相当抽象和理论。但是,使用这些会产生一些非常重要的后果。主要优点之一是我们消除了统计数据中存在的可变性。

例如,假设我们从平均值为μ且标准差为σ的总体开始。标准偏差给我们一个分布分布的度量。我们将其与通过形成大小n的简单随机样本获得的采样分布进行比较。平均值的采样分布仍将具有μ的平均值,但标准偏差是不同的。采样分布的标准偏差变为σ/√n

因此,我们有以下几点

  • 4的样本量允许我们具有标准偏差为σ/2的抽样分布。
  • 9的样本量允许我们具有标准偏差为σ/3的抽样分布。
  • 25的样本量允许我们具有标准偏差为σ/5的抽样分布。
  • 样本量为100允许我们具有标准偏差为σ/10的抽样分布。

在实践中

在统计实践中,我们很少形成抽样分布。取而代之的是,我们将从大小n的简单随机样本得出的统计数据视为沿着相应采样分布的一个点。这再次强调了为什么我们希望拥有相对较大的样本量。样本量越大,我们在统计数据中获得的变化就越小。

请注意,除了中心和传播,我们无法就samp的形状说任何话岭分布。事实证明,在一些相当广泛的条件下,中心极限定理可以用来告诉我们关于抽样分布形状的非常惊人的事情。

教育_1