什么是标准正态分布?

钟形曲线出现在整个统计数据中。各种测量,例如种子的直径,鱼鳍的长度,SAT上的分数以及单个纸张的重量,在绘制它们时都形成钟形曲线。所有这些曲线的一般形状是相同的。但是所有这些曲线都是不同的,因为它们中的任何一个都不太可能具有相同的平均值或标准偏差。标准偏差较大的钟形曲线较宽,标准偏差较小的钟形曲线较细。具有较大平均值的钟形曲线比具有较小平均值的钟形曲线向右移动更多

一个例子

为了让这更具体一些,让我们假装我们测量了500粒玉米的直径。然后我们记录,分析和绘制这些数据。发现数据集的形状像钟形曲线,平均值为1.2厘米,标准偏差为0.4厘米。现在假设我们用500个豆类做同样的事情,我们发现它们的平均直径为0.8厘米,标准偏差为0.04厘米。

上面绘制了这两个数据集的钟形曲线。红色曲线对应于玉米数据,绿色曲线对应于豆类数据。正如我们所看到的,这两条曲线的中心和分布是不同的。

这些显然是两种不同的钟形曲线。它们是不同的,因为它们的平均值和标准偏差不匹配。由于我们遇到的任何有趣的数据集都可以有任何正数作为标准偏差,任何数字都可以作为平均值,我们实际上只是在刮擦infinite个钟形曲线的表面。这是很多曲线,太多了,无法处理。解决方案是什么?

一个非常特殊的钟形曲线

数学的一个目标是尽可能概括事物。有时几个单独的问题是单个问题的特殊情况。这种情况涉及贝尔curves就是一个很好的例证。我们可以将它们全部关联到一条曲线,而不是处理无限数量的钟形曲线。这种特殊的钟形曲线称为标准钟形曲线或标准正态分布。

标准钟形曲线的平均值为零,标准偏差为1。任何其他钟形曲线都可以通过直接计算与此标准进行比较。

标准正态分布的特征

任何钟形曲线的所有属性都适用于标准正态分布。

  • 标准正态分布不仅具有零的平均值,而且具有零的中值和模式。这是曲线的中心。
  • 标准正态分布在零处显示镜像对称性。曲线的一半在零的左侧,一半的曲线在右侧。如果曲线沿垂直线折叠为零,则两半将完美匹配。
  • 标准正态分布遵循68-95-99.7规则,这给我们一个简单的方法来估计以下内容:
    • 大约68%的数据在-1和1之间。
    • 大约95%的数据在-2和2之间。
    • 大约99.7%的数据在-3和3之间。

为什么我们关心

在这一点上,我们可能会问,“为什么要打扰标准的钟形曲线?“这似乎是一个不必要的复杂性,但随着我们继续统计,标准钟形曲线将是有益的。

我们会发现统计中的一种问题需要我们在遇到的任何钟形曲线的部分下方找到区域。钟形曲线对于区域来说不是一个很好的形状。它不像矩形或右三角形那样具有简单的面积公式。找到钟形曲线的一部分区域可能很棘手,实际上很难,我们需要使用一些微积分。如果我们不标准化我们的钟形曲线,我们每次我们想要找到一个区域时都需要做一些计算。如果我们对曲线进行标准化,所有计算面积的工作都是为我们完成的。

科普公众号

教育资源网_1