贝叶斯定理的定义和例子

贝叶斯定理是用于概率和统计的数学方程式,用于计算条件概率。换句话说,它用于基于事件与另一个事件的关联来计算事件的概率。该定理也称为贝叶斯定律或贝叶斯定律。

历史

贝叶斯定理以英国大臣兼统计学家托马斯·贝叶斯牧师的名字命名,贝叶斯定理为其工作“解决机会论中的问题的论文”制定了一个等式。在贝叶斯死后,该书稿由理查德·普赖斯(Richard Price)在1763年出版之前进行了编辑和更正。将定理称为贝叶斯-普赖斯定律会更准确,因为普里斯的贡献很重要。该方程的现代公式是由法国数学家Pierre-Simon Laplace在1774年设计的,他当时并不知道贝叶斯的工作。拉普拉斯被认为是负责贝叶斯概率发展的数学家。

 

贝叶斯定理的公式

有几种不同的方法可以为贝叶斯定理编写公式。最常见的形式是:

P(A ∣ B)= P(B ∣ A)P(A)/ P(B)

其中A和B是两个事件,P(B)≠0

P(A ∣ B)是在事件B成立的情况下事件A发生的条件概率。

P(B∣A)是假设A为真的事件B发生的条件概率。

P(A)和P(B)是A和B彼此独立出现的概率(边际概率)。

 

例子

如果您患有花粉症,您可能希望找到一个人患类风湿性关节炎的可能性。在此示例中,“发生花粉症”是对类风湿关节炎(事件)的测试。

  • 一个是事件“患者患有类风湿性关节炎。” 数据表明,诊所中10%的患者患有这种类型的关节炎。P(A)= 0.10
  • B是测试“患者有花粉症”。数据表明,诊所中有5%的人患有花粉症。P(B)= 0.05
  • 诊所的记录还显示,类风湿关节炎患者中有7%患有花粉症。换句话说,考虑到患有类风湿性关节炎,患者发生花粉症的可能性为7%。B∣A = 0.07

将这些值插入定理:

P(A ∣ B)=(0.07 * 0.10)/(0.05)= 0.14

因此,如果患者患有花粉症,则其患类风湿性关节炎的机会为14%。花粉症的随机患者不太可能患有类风湿关节炎。

 

敏感性和特异性

贝叶斯定理很好地证明了医学检验中假阳性和假阴性的影响。

  • 灵敏度是真实的阳性率。它是正确识别的阳性比例的一种度量。例如,在妊娠试验中,妊娠试验阳性的妇女所占的百分比。敏感的测试很少会遗漏“阳性”。
  • 特异性是真实的阴性率。它测量正确识别的负片的比例。例如,在妊娠试验中,妊娠试验阴性的女性中未怀孕的百分比。特定的测试很少会出现误报。

完美的测试将是100%敏感和特定的。实际上,测试的最小错误称为贝叶斯错误率。

例如,考虑一种灵敏度为99%且特异性为99%的药物测试。如果有一半(0.5%)的人使用毒品,那么一个随机检测结果为阳性的人实际上是使用者的概率是多少?

P(A ∣ B)= P(B ∣ A)P(A)/ P(B)

也许改写为:

P(用户∣ +)= P(+用户)P(用户)/ P(+)

P(用户+)= P(+用户)P(用户)/ [P(+用户)P(用户)+ P(+非用户)P(非用户)

P(用户∣ +)=(0.99 * 0.005)/(0.99 * 0.005 + 0.01 * 0.995)

P(用户∣ +)≈33.2%

只有约33%的时间随机测试阳性的人实际上是吸毒者。结论是,即使一个人对药物测试呈阳性反应,它更可能他们根本使用药物比他们做的。换句话说,假阳性的数量大于真阳性的数量。

在现实世界中,通常要在敏感性和特异性之间做出权衡,这取决于不要遗漏阳性结果是否更重要,还是将阴性结果标记为阳性是否更好。