如何使用二项分布的正态近似

二项分布涉及离散的随机变量。二项式设置中的概率可以通过使用二项式系数的公式以直接的方式计算。虽然理论上这是一个简单的计算,但实际上计算二项式概率可能变得非常繁琐甚至在计算上不可能。这些问题可以通过使用正态分布来近似二项式分布来回避。我们将看到如何通过计算步骤来做到这一点。

使用正态近似

的步骤

首先,我们必须确定使用正态近似是否合适。并非每个二项式分布都是相同的。有些表现出足够的偏度,我们不能使用正常的近似值。为了检查是否应该使用正态近似,我们需要查看成功概率pn的值我们的二项变量的观察。

为了使用正态近似,我们同时考虑n pn(1-p)。如果这两个数字都大于或等于10,那么我们用正态近似来证明这一点。这是一般的经验法则,通常n pn(1-p)的值越大,近似值越好。

二项式与正常

的比较

我们将比较一个**的二项式概率与通过正态近似获得的概率。我们考虑丢弃20个硬币,并想知道5个或更少硬币是头部的概率。如果X是头的数量,那么我们想要找到该值:

P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4)+P(X=5)。

对这六个概率中的每一个使用二项式公式表明,概率y是2.0695%。现在我们将看到我们的正常近似值与这个值有多接近。

检查条件,我们看到npnp(1-p)均等于10。这表明在这种情况下我们可以使用正态近似。我们将利用平均值np=20(0.5)=10和标准偏差(20(0.5)(0.5))0.5=2.236的正态分布。

为了确定X小于或等于5的概率,我们需要在我们使用的正态分布中找到5的z-分数。因此,z=(5-10)/2.236=-2.236。通过查阅z分数表,我们可以看到z小于或等于-2.236的概率为1.267%。这与实际概率不同,但在0.8%以内。

连续性校正因子

为了改进我们的估计,引入连续性校正因子是适当的。使用此值是因为正态分布是连续的,而二项分布是离散的重阳小知识。对于二项式随机变量,X=5的概率直方图将包括从4.5到5.5并以5为中心的条。

这意味着对于上面的例子,对于二项变量,X小于或等于5的概率应该通过X小于或等于5.5的概率来估计对于连续的正态变量。因此,z=(5.5-10)/2.236=-2.013。108 z 109的概率

教育_1