什么是正态分布?

数据的正态分布是其中大多数数据点相对相似的数据点,这意味着它们出现在数据范围的高端和低端具有较少异常值的小范围内。

当数据正态分布时,将它们绘制在图形上会产生一个钟形和对称的图像,通常称为钟形曲线。在这样的数据分布中,平均值,中值和模式都是相同的值并且与曲线的峰值一致。

然而,在社会科学中,正态分布更多的是理论理想而不是现实。它作为检查数据的镜头的概念和应用是通过一种有用的工具来识别和可视化数据集中的规范和趋势。

正态分布的属性

正态分布最显着的特征之一是其形状和完美的对称性。如果将正态分布的图片正好折叠在中间,则可以得出两个相等的一半,每个一半都是另一个的镜像。这也意味着数据中一半的观测值落在分布中间的任一侧。

正态分布的中点是具有**频率的点,意味着对该变量具有最多观察值的数量或响应类别。正态分布的中点也是三个度量下降的点:平均值,中位数和模式。在完全正态分布中,这三个度量都是相同的数字。

在所有正态或接近正态分布中,以标准偏差单位测量时,曲线下面积的恒定比例位于均值与均值之间的任何给定距离之间。例如,在所有正态曲线中,99.73%的病例落设计小知识在平均值的三个标准偏差之内,95.45%的病例落在两个标准偏差之内平均值,68.27%的病例与平均值相差一个标准差。

正态分布通常用标准分数或Z分数表示,这些数字告诉我们实际分数与标准偏差平均值之间的距离。标准正态分布的平均值为0.0,标准偏差为1.0。

社会科学中的示例和使用

尽管正态分布是理论上的,但研究人员研究的几个变量与正态曲线非常相似。例如,SAT,ACT和GRE等标准化考试成绩通常类似于正态分布。身高,运动能力以及特定人群的众多社会和政治态度通常也类似于钟形曲线。

当数据不是正态分布时,正态分布的理想值也可用作比较点。例如,大多数人认为美国家庭收入的分布将是正态分布,并且在绘制在图表上时类似于钟形曲线。这意味着大多数美国公民都能获得中等收入,换句话说,有一个健康的中产阶级。同时,较低经济阶层的人数较少,上等阶层的人数也较少。然而,美国家庭收入的实际分配根本不像钟形曲线。大多数家庭处于从低到中低的范围,这意味着与那些过着舒适的中产阶级生活的人相比,有更多的穷人难以生存。在这种情况下,正态分布的理想对于说明收入不平等很有用

教育_1