Chebyshev的不平等是什么?

Chebyshev不等式表示,样本中至少有1-1/K2的数据必须落在与平均值的K标准偏差之内(此处K是大于1的任何正实数)。

任何正态分布或钟形曲线形状的数据集都有几个特征。其中之一涉及数据相对于平均值的标准偏差数的扩展。在正态分布中,我们知道68%的数据是均值的一个标准差,95%健康常识小知识是均值的两个标准差,大约99%在均值的三个标准差之内。

但是,如果数据集不是以钟形曲线的形式分布的,那么不同的数量可能在一个标准偏差内。Chebyshev的不等式提供了一种方法来知道哪些数据部分落在任何数据集的平均值的K标准偏差内。

关于不等式的事实

我们还可以通过用概率分布替换短语“来自样本的数据”来陈述上述不等式。这是因为Chebyshev的不等式是概率的结果,然后可以应用于统计。

值得注意的是,这种不等式是数学证明的结果。这不像平均值和模式之间的经验关系,也不像连接范围和标准偏差的经验法则。

不等式的例证

为了说明不平等,我们将看看它的几个值K

  • 对于K=2,我们有1-1/K2=1-1/4=3/4=75%。所以Chebyshev的不等式说,任何分布的数据值中至少有75%必须在平均值的两个标准偏差之内。
  • 对于K=3,我们有1-1/K2=1-1/9=8/9=89%。所以Chebyshev的不平等说任何分布的数据值中至少有89%必须在平均值的三个标准偏差之内。对于65 K 66 4,我们有1-1/67 K 68,69 2 70 1-1/16 15/16 93.75%。因此,Chebyshev的不等式表示,任何分布的至少93.75%的数据值必须在平均值的两个标准偏差内。

示例

假设我们在当地动物住所取样了狗的重量,发现我们的样本平均为20磅,标准差为3磅。通过使用Chebyshev的不平等,我们知道我们采样的狗中至少有75%的重量与平均值有两个标准偏差。标准偏差的两倍给我们2 x 3=6。从20的平均值中减去并加上。这告诉我们,75%的狗的体重从14磅到26磅不等。

不等式的使用

如果我们更多地了解我们正在使用的分布,那么我们通常可以保证更多的数据是远离平均值的一定数量的标准偏差。例如,如果我们知道我们有一个正态分布,那么95%的数据是平均值的两个标准偏差。Chebyshev的不平等表示,在这种情况下,我们知道至少75%的数据是与平均值的两个标准偏差。正如我们在这种情况下所看到的,它可能远远超过这个75%。

不平等的价值在于它给了我们一个“更糟的情况”,在这种情况下,我们对样本数据(或概率分布)了解的**事情是均值和标准差。当我们对数据一无所知时,Chebyshev的不等式提供了一些关于数据集如何扩展的额外见解。

不等式的历史

这种不等式以俄罗斯数学家Pafnuty Chebyshev的名字命名,他在1874年首次陈述了不等式而没有证明。十年后马尔可夫在他的博士论文中证明了不平等。由于如何用英语表示俄语字母表的差异,Chebyshev也拼写为Tchebysheff。

科普_1