科普类文章_辛普森的统计悖论概述

矛盾的是表面上似乎矛盾的陈述或现象。悖论有助于揭示看似邪恶的表面之下的根本事实。在统计领域,Simpson's悖论证明了组合来自多个群体的数据会产生什么样的问题。

有了所有数据,我们需要谨慎行事。它来自哪里?它是如何获得的?它真的在说什么?这些都是我们在提供数据时应该提出的好问题。Simpson'悖论的非常令人惊讶的案例向我们表明,有时数据似乎在说什么并不是真的。

悖论概述

假设我们正在观察几个组,并为这些组中的每一个建立关系或关联。辛普森的悖论说,当我们将所有群体组合科普类文章在一起并以汇总形式查看数据时,我们之前注意到的相关性可能会逆转。这通常是由于尚未考虑的潜伏变量,但有时是由于数据的数值。

示例

为了更清楚地理解Simpson's悖论,让's看看下面的例子。在某家医院,有两名外科医生。外科医生A对100名患者进行手术,95名患者存活。外科医生B对80名患者进行手术,72名患者存活。我们正在考虑在这家医院进行手术,并通过手术生活是非常重要的。我们想选择两位外科医生中**的一位。

科普_1

我们查看数据并用它来计算外科医生A's患者在手术中存活的百分比,并将其与外科医生B患者的***进依科普行比较。

  • 100名患者中有95名患者在外科医生A中存活,因此95/100=95%存活。
  • 80名患者中有72名患者在外科医生B中存活,因此72/80=90%存活。

从这个分析中,我们应该选择哪个外科医生来治疗我们?看起来外科医生A的**更安全。但这真的是真的吗?

如果我们对数据做了一些进一步的研究,发现最初医院已经考虑了两种不同类型的手术,但随后将所有数据汇总在一起报告给每位外科医生。并非所有的手术都是平等的,有些被认为是高风险的紧急手术,而另一些则是事先安排的更为常规的手术。

在外科医生A治疗的100名患者中,50名患有高风险,其中3名死亡。其他50人被认为是例行的,其中2人死亡。这意味着,对于常规手术,由外科医生a治疗的患者具有48/50=96%的***。

现在我们更仔细地查看外科医生B的数据,发现80名患者中有40名患有高风险,其中7名死亡。其他40人是例行的,只有一人死亡。这意味着患者对于外科医生的常规手术具有39/40=97.5%的***B。

现在哪个外科医生看起来更好?如果你的手术是常规手术,那么外科医生B实际上是更好的外科医生。如果我们看一下外科医生进行的所有手术,A会更好。这是非常违反直觉的。在这种情况下,手术类型的潜伏变量会影响外科医生的综合数据。

辛普森的历史's悖论

辛普森的悖论以爱德华·辛普森(Edward Simpson)命名,爱德华·辛普森(Edward Simpson)在1951年的论文&##34;列联表中相互作用的解释"皇家统计学会杂志。皮尔逊和尤尔每个人都比辛普森早半个世纪观察到类似的悖论,所以辛普森的悖论有时也被称为辛普森尤尔效应。

悖论在sp等不同领域有许多广泛的应用ORT统计和失业数据。任何数据汇总的时候,请注意这个悖论的出现。