计算平均**偏差
统计数据中有许多衡量传播或分散的指标。虽然范围和标准偏差是最常用的,但还有其他方法可以量化色散。我们将研究如何计算数据集的平均**偏差。
Definition
我们从平均**偏差的定义开始,也称为平均**偏差。本文显示的公式是平均**偏差的正式定义。将此公式视为我们可以用来获取统计信息的过程或一系列步骤可能更有意义。
- 我们首先对一个数据集的中心进行平均或测量,我们用15米来表示。接下来,我们发现每个数据值偏离了19米。这意味着我们取每个数据值和21米之间的差值。在此之后,我们取上一步中每个差异的**值。换句话说,对于任何差异,我们都会删除任何负号。这样做的原因是与m存在正负偏差。如果我们没有找到消除负号的方法,如果我们将它们加在一起,所有的偏差都会相互抵消。
- 现在我们将所有这些**值加在一起。
- **,我们将这个总和除以n,这是数据值的总数。结果是平均**偏差。
Variations
上述过程有几种变化。请注意,我们没有确切说明m是什么。其原因是我们可以使用m的各种统计数据。通常,这是我们数据集的中心,因此可以使用任何中心趋势测量值。
数据集中心最常见的统计测量是平均值、中位数和th值e模式,因此在计算平均**偏差时,可以将其中任何一个用作m。这就是为什么通常提到关于平均值的平均**偏差或关于中值的平均**偏差。我们将看到几个例子。
示例:关于平均值的平均**偏差
假设我们从以下数据集开始:
1,2,2,3,5,7,7,7,7,9。
该数据集的平均值为5.下表将组织我们的工作,计算平均值的平均**偏差。
Data Value | 84偏离平均值85偏差**值87||
1 | 1-5=-4 | |-4 |=4 |
2 | 2-5=-3 | |-3 |=3 |
2 | 2-5=-3 | |-3 |=3 |
3 | 3-5=-2 | |-2 |=2 |
5 | 5-5=0 | | 0 |=0 |
7 | 7-5=2 | | 2 |=2 |
7 | 7-5=2 | | 2 |=2 |
7 | 7-5=2 | | 2 |=2 |
7 | 7-5=2 | | 2 |=2 |
9 | 9-5=4 | | 4 |=4 |
**偏差总数: | 24 |
我们现在将这个总和除以10,因为总共有10个数据值。关于平均值的平均**偏差是24/10=2.4。
示例:关于平均值的平均**偏差
现在我们从不同的数据集开始:
1,1,4,5,5,5,5,5,7,7,10。
就像之前的数据集一样,这个数据集的平均值是5.
1 | 1-5=-4 | |-4 |=4 |
1 | 1-5=-4 | |-4 |=4 |
4 | 4-5=-1 | |-1 |=1 |
5 | 5-5=0 | | 0 |=0 |
5 | 5-5=0 | | 0 |=0 |
5 | 5-5=0 | | 0 |=0 |
5 | 5-5=0 | | 0 |=0 |
7 | 7-5=2 | | 2 |=2 |
7 | 7-5=2 | | 2 |=2 |
10 | 10-5=5 | | 5 |=5 |
科普小品 | **偏差总数: | 18 |
因此,关于平均值的平均**偏差是18/10=1.8。我们将这个结果与**个例子进行比较。尽管每个例子的平均值是相同的,但是**个例子中的数据更加分散。从这两个示例中我们可以看出,与**个示例的平均**偏差大于与第二个示例的平均**偏差。平均**偏差越大,我们的数据分散越大。
示例:关于中位数
的平均**偏差从与**个示例相同的数据集开始:
1,2,2,3,5,7,7,7,7,9。
数据集的中位数为6.在下表中,我们显示了关于中位数的平均**偏差的计算细节。
1 | 1-6=-5 | |-5 |=5 |
2 | 2-6=-4 | |-4 |=4 |
2 | 2-6=-4 | |-4 |=4 |
3 | 3-6=-3 | |-3 |=3 |
5 | 5-6=-1 | |-1 |=1 |
7 | 7-6=1 | | 1 |=1 |
7 | 7-6=1 | | 1 |=1 |
7 | 7-6=1 | | 1 |=1 |
7 | 7-6=1 | | 1 |=1 |
9 | 9-6=3 | | 3 |=3 |
**偏差总数: | 24 |
再次,我们将总数除以10,得到关于中位数的平均偏差为24/10=2.4。
示例:关于中位数
的平均**偏差从与以前相同的数据集开始:
1,2,2,3,5,7,7,7,7,9。
这次我们发现这个数据集的模式是7.在下表中,我们显示了关于模式的平均**偏差的计算细节。
Data | 偏离模式 | **偏差值 |
1 | 1-7=-6 | |-5 |=6 |
2 | 2-7=-5 | |-5 |=5 |
2 | 2-7=-5 | |-5 |=5 |
3 | 3-7=-4 | |-4 |=4 |
5 | 5-7=-2 | |-2 |=2 |
7 | 7-7=0 | | 0 |=0 |
7 | 7-7=0 | | 0 |=0 |
7 | 7-7=0 | | 0 |=0 |
7 | 7-7=0 | | 0 |=0 |
9 | 9-7=2 | | 2 |=2 |
**偏差总数: | 22 |
我们除以**偏差的总和,看到我们有一个关于模式22/10=2.2的平均**偏差。
快速事实
关于平均**偏差有几个基本属性
- 中位数的平均**偏差总是小于或等于平均值的平均**偏差。
- 标准偏差大于或等于平均值的平均**偏差。
- 平均**偏差有时用MAD缩写。不幸的是,这可能是模糊的,因为MAD可能或者参考中位数**偏差。
- 正态分布的平均**偏差约为标准偏差大小的0.8倍。
常见用途
平均**偏差有一些应用。**个应用是这个统计数据可以用来教导标准偏差背后的一些想法。关于平均值的平均**偏差比标准偏差更容易计算。它不要求我们对偏差进行平方,并且在计算结束时我们不需要找到平方根。此外,平均**偏差比标准偏差更直观地连接到数据集的扩展。这就是为什么在引入标准偏差之前有时会先教导平均**偏差的原因。
有些人甚至认为标准偏差应该被平均**偏差所取代。尽管标准偏差对于科学和数学应用很重要,但它并不像平均**偏差那样直观。对于日常应用,平均**偏差是衡量数据扩展方式的更切实方法。