幼儿健康知识大全_什么是内围栏和外围栏?

数据集的一个重要特征是确定它是否包含任何异常值。幼儿健康知识大全在我们的数据集中,异常值直观地被认为是与大多数其他数据有很大不同的值。当然,这种对异常值的理解是模棱两可的。要被视为异常值,该值应该偏离其余数据多少?一个研究人员称之为异常值会与另一个匹配吗?为了提供一些一致性和定量测量异常值的确定,我们使用内外围栏。

为了找到一组数据的内部和外部围栏,我们首先需要一些其他描述性统计数据。我们将首先计算四分位数。这将导致四分位间距。**,通过我们的这些计算,我们将能够确定内部和外部的围栏。

Quartiles

**和第三四分位数幼儿健康知识大全是任何一组定量数据的五个数字摘要的一部分。我们首先在所有值按升序列出后找到数据的中位数或中点。小于中值的值对应于大约一半的数据。我们找到这一半数据集的中位数,这是**个四分位数。

以类似的方式,我们现在考虑数据集的上半部分。如果我们找到这一半数据的中位数,那么我们有第三四分位数。这些四分位数的名字来源于他们将数据集分成四个相等大小的部分或四分之一。换句话说,大约25%的数据值小于**个四分位数。以类似的方式,大约75%的数据值小于第三四分位数。

Interquartile Range

我们接下来需要找到四分位间距(IQR)。这比**个四分位数q和第三个四分位数q更容易计算。我们需要做的就是采取行动e这两个四分位数的差异。这给了我们公式:

教育_1

IQR=Q-Q

IQR告诉我们数据集的中间部分是如何分布的。

找到内部围栏

我们现在可以找到内部的围栏。我们从IQR开始,将这个数字乘以1.5。然后,我们从**个四分位数中减去这个数字。我们还将此数字添加到第三个四分位数。这两个数字构成了我们的内围栏。

找到外围栏55 56

对于外部围栏,我们从IQR开始,将这个数字乘以3。然后,我们从**个四分位数中减去这个数字,并将其加到第三个四分位数。这两个数字是我们的外部围栏。

检测异常值

现在,异常值的检测变得与确定数据值参考我们的内部和外部围栏的位置一样容易。如果单个数据值比我们的任何一个外部围栏都更极端,那么这是一个异常值,有时被称为强异常值。如果我们的数据值位于相应的内部和外部围栏之间,则该值为可疑异常值或轻度异常值。我们将通过下面的示例看到它是如何工作的。

示例

假设我们已经计算了数据的**和第三四分位数,并分别找到了50和60的这些值。四分位间距IQR=60–50=10。接下来,我们看到1.5 x IQR=15。这意味着内部围栏分别为50-15=35和60+15=75。这比**个四分位数少1.5倍IQR,比第三个四分位数多。

我们现在计算3 x IQR,看到这是3 x 10=30。外围栏比**和第三四分位数更极端3倍IQR。这意味着外围栏是50-30=20和60+30=90。

任何小于20或大于90的数据值都被考虑在内列斯。任何29到35或75到90之间的数据值都被怀疑是异常值。