统计中的概率分布

如果你花很多时间处理统计数据,很快就会遇到“概率分布”这个短语。在这里,我们真正可以看到概率和统计数据的重叠区域有多少。虽然这听起来像技术性的东西,但概率分布这个短语实际上只是一种谈论组织概率列表的方式。概率分布是将概率分配给随机变量的每个值的函数或规则。在某些情况下可能会列出分布。在其他情况下,它以图形形式呈现。

示例

假设我们滚动两个骰子,然后记录骰子的总和。总和从2到12是可能的。每个总和都有特定的发生概率。我们可以简单地将这些列表如下:

  • 总和2的概率为1/36
  • 总和3的概率为2/36
  • 总和4的概率为3/36
  • 总和5的概率为4/36
  • 总和6的概率为5/36
  • 总和7的概率为6/36
  • 总和8的概率为5/36
  • 总和9的概率为概率为4/36
  • 总和10的概率为3/36
  • 总和11的概率为2/36
  • 总和12的概率为1/36

该列表是滚动双骰子的概率实验的概率分布。我们还可以将上述视为通过查看两个骰子的总和定义的随机变量的概率分布。

Graph

可以绘制概率分布图,有时这有助于向我们展示分布的特征,这些特征在阅读概率列表时并不明显。随机变量沿x-轴绘制,相应概率沿y-轴绘制。对于一个离散的随机变量,我们将有一个直方图。法罗群岛r一个连续的随机变量,我们将有一条平滑曲线的内部。

概率规则仍然有效,它们以几种方式表现出来。由于概率大于或等于零,概率分布图必须具有非负的y坐标。概率的另一个特征,即一个是事件概率可以**的特征,以另一种方式出现。

Area=Probability

概率分布图的构造方式使得区域表示概率。对于离散概率分布,我们实际上只是计算矩形的面积。在上图中,对应于四个,五个和六个的三个条的区域对应于我们骰子的总和为四个,五个或六个的概率。所有酒吧的面积加起来总共一个。

在标准正态分布或钟形曲线中,我们有类似的情况。两个z值之间的曲线下面积对应于我们的变量落在这两个值之间的概率。例如,钟形曲线下面积为-1 z。

重要分布

实际上有无限多的概率分布。一些更重要的分布列表如下:

    84>85>二项式分布–给出一系列具有两个结果的独立实验的成功次数
  • 卡方分布–用于确定观测量与建议模型的接近程度
  • F分布生活常识题–用于方差分析(ANOVA)
  • 正态分布–称为钟形曲线,可在整个统计数据中找到。
  • 学生的t分布–用于正态分布
  • 的小样本量

教育_1