计算相关系数

查看散点图时需要问很多问题。最常见的一种是想知道直线接近数据的程度。为了帮助回答这个问题,有一个称为相关系数的描述性统计量。我们将看到如何计算此统计信息。

The Correlation Coefficient

r表示的相关系数告诉我们散点图中的数据沿直线下降的紧密程度。r的**值越接近1,线性方程描述的数据越好。如果r=1或r=-1,则数据集完全对齐。值r接近零的数据集几乎没有直线关系。

由于计算时间长,**使用计算器或统计软件计算r。但是,知道计算器在计算时正在做什么总是值得的。下面是一个主要用手工计算相关系数的过程,计算器用于常规算术步骤。

计算r

的步骤

我们将首先列出计算相关系数的步骤。我们使用的数据是配对数据,每对数据将用(x,y)表示健康知识我知道手抄报

  1. 我们从一些初步计算开始。这些计算的数量将用于我们计算r:
    1. 计算x̄,数据的所有**坐标的平均值x
    2. 计算ȳ,数据的所有第二坐标的平均值
    3. y
    4. 计算s所有样本的标准差数据的**个坐标中的一个x
    5. 计算s数据的所有第二个坐标的样本标准偏差y
  2. Use公式(z)=(x–x̄)/s并计算每个x的标准化值。
  3. 使用公式(z)=(y–ȳ)/s并计算每个y标准化值。
  4. 乘以相应的标准值:(z)(z)
  5. 添加**一步的产品
  6. 将上一步的总和除以n–1,其中n是我们配对数据集中的点总数。所有这些的结果是相关系数r

这个过程并不难,每一步都是相当常规的,但所有这些步骤的收集都非常复杂。标准偏差的计算本身就足够繁琐。但是相关系数的计算不仅涉及两个标准偏差,还涉及许多其他操作。

示例

为了确切地看到如何获得r的值,我们看一个例子。同样,重要的是要注意,对于实际应用,我们希望使用计算器或统计软件为我们计算r

我们首先列出配对数据:(1,1),(2,3),(4,5),(5,7)。x值的平均值,1,2,4和5的平均值是x̄=3。我们也有ȳ=4。标准差

x值为s=1.83和s=2.58。下表总结了r所需的其他计算。最右边栏中的产品总和为2.969848。由于总共有四个点,4-1=3,我们将产品总和除以3。这给我们一个相关系数r=2.969848/3=0.989949。

表相关系数计算示例

186 1 187188 1 189198 2 199
xyzzzz
-1.09544503-1.1618949581.272792057
3-0.547722515-0.3872983190.212132009
450.5477225150.3872983190.212132009
571.095445031.1618949581.272792057

教育资源网_1