什么是负二项分布?
负二项分布是与离散随机变量一起使用的概率分布。这种类型的分布涉及为了获得预定数量的成功而必须进行的试验次数。正如我们将看到的,负二项分布与二项分布有关。此外,这种分布概括了几何分布。
设置
我们将首先查看导致负二项分布的设置和条件。其中许多条件与二项设置非常相似。
- 我们有一个伯努利实验。这意味着我们进行的每一次试验都有一个明确的成功和失败,这是**的结果。无论我们执行多少次实验,成功的概率都是恒定的。我们用17 p表示这个恒定的概率。18 19 20实验重复21 X独立试验,意味着一项试验的结果对后续试验的结果没有影响。
这三个条件与二项式分布中的条件相同。不同之处在于二项式随机变量具有固定数量的试验n。**X的值是0,1,2,…,n,所以这是一个有限分布。
负二项分布涉及直到我们成功r之前必须发生的试验次数X。r是我们在之前选择的整数我们开始进行试验。随机变量X仍然是离散的。但是,现在随机变量可以取X=r,r+1,r+2。。。这个随机变量是可数无限的,因为在我们获得r成功之前可能需要任意长的时间。
示例
帮助理解负二项分布离子,值得考虑一个例子。假设我们翻转一个公平的硬币,我们问这个问题,"我们在**个X硬币翻转中得到三个头的概率是多少?"这种情况需要负二项式分布。
硬币翻转有两种可能的结果巴西小知识,成功的概率是恒定的1/2,并且它们彼此独立的试验。我们要求在X硬币翻转后获得前三个头的概率。因此,我们必须至少翻转硬币三次。然后我们继续翻转,直到第三个头出现。
为了计算与负二项分布相关的概率,我们需要更多信息。我们需要知道概率质量函数。
概率质量函数
负二项分布的概率质量函数可以稍微考虑一下来开发。每个试验的成功概率由p给出。由于只有两种可能的结果,这意味着概率失败是恒定的(1-p)。
x和最终试验必须发生第r次成功。之前的x-1试验必须包含r-1成功。可能发生的方式数量由组合的数量给出:
C(x-1,r-1)=(x-1)!/[(r-1)!(x-r)!]。
除此之外,我们还有独立的事件,所以我们可以将概率乘以一起。将所有这些放在一起,我们得到概率质量函数
f(x)=C(x-1,r-1)pr(1-p)x-r。
发行名称
我们现在能够理解为什么这个随机变量有一个否定的我们上面遇到的组合数量可以通过设置x-r=k:来编写
(x-1)!/[(r-1)!(x-r)!]=(x+k-1)!/[(r-1)!k!]=(r+k-1)(x+k-2)。(r+1)(r)/k!=(-1)k(-r)(-r-1)。(-r-(k+1)/k!。
在这里,我们看到负二项式系数的出现,当我们将二项式表达式(a+b)提升到负幂时使用该系数。
Mean
分布的均值很重要,因为它是表示分布中心的一种方式。这种类型的随机变量的均值由其期望值给出,等于r/p。我们可以通过使用此分布的矩生成函数仔细证明这一点。
直觉也指导我们这个表达式。假设我们进行一系列试验n直到我们获得r成功。然后我们再次这样做,只是这次需要n试验。我们一直在继续,直到我们有大量的试验组n=n+n+。+196 n 197
这些k试验中的每一个都包含r成功,因此我们总共有k r成功。如果N很大,那么我们会期望看到大约Np成功。因此,我们将它们等同在一起并具有kr=Np。
我们做了一些代数,发现N/k=r/p。这个等式左侧的分数是我们每个k试验组。换句话说,这是进行实验的预期次数,这样我们总共有r成功。这正是我们希望找到的期望。我们看到这一点等于公式r/p.
方差
负二项分布的方差也可以通过使用矩生成函数来计算。当我们这样做时,我们看到这个分布的方差由以下公式给出:
r(1-p)/p2
矩生成函数
这种类型的随机变量的矩生成函数非常复杂。回想一下,矩生成函数被定义为期望值E[EtX]。通过将此定义与我们的概率质量函数一起使用,我们有:
M(t)=E[Et x]=∑(x-1)!/[(r-1)!(x-r)!]etXpr(1-p)x-r
在一些代数之后,这变成M(t)=(pet)r[1-(1-p)et]-r
与其他分布的关系
我们已经在上面看到负二项分布在许多方面与二项分布是如何相似的。除了这种联系之外,负二项分布是几何分布的更一般版本。
几何随机变量X计算**次成功发生之前所需的试验次数。很容易看出这正是负二项分布,但r等于1。
存在负二项分布的其他公式。一些教科书将X定义为直到r失败发生的试验次数。
示例问题
我们将看一个示例性问题,看看如何使用负二项分布。假设篮球运动员是80%的自由投球运动员。此外,假设制作一个免费的throw独立于制作下一个。对于这个玩家来说,第八个篮子是在第十次自由投掷时制作的概率是多少?
我们看到我们有一个负二项分布的设置。成功的恒定概率是0.8,所以失败的概率是0.2。当r=8时,我们想要确定X=10的概率。
我们将这些值插入到概率质量函数中:
f(10)=C(10-1,8-1)(0.8)8(0.2)2=36(0.8)8(0.2)2,约为24%。
然后我们可以问这个玩家制作8个之前的平均投掷次数是多少。由于预期值是8/0.8=10,所以这是射击次数。