什么是最小二乘线?

散点图是一种用于表示配对数据的图形。解释变量沿水平轴绘制,响应变量沿垂直轴绘制。使用这种类型的图形的一个原因是寻找变量之间的关系

在一组配对数据中寻找的最基本模式是直线。通过任意两点,我们可以画一条直线。如果我们的散点图中有两个以上的点,大多数时候我们将不再能够画出穿过每个点的线。相反,我们将画一条线穿过中点并显示数据的整体线性趋势。

当我们查看图表中的要点并希望通过这些要点画出一条线时,就会出现一个问题。我们应该画哪条线?可以画出无数条线。通过单独使用我们的眼睛,很明显每个看到散点图的人都可以产生略微不同的线条。这种模糊性是一个问题。我们希望每个人都有一个明确的方法来获得相同的路线。目标是在数学上**描述应该画哪条线。最小二乘回归线是通过我们的数据点的一条这样的线。

最小二乘法

最小二乘线的名称解释了它的作用。我们从坐标由(xy)给出的点集合开始。任何直线将通过这些点,并将高于或低于这些点。我们可以通过选择x的值然后从x的观察到的y坐标来计算从这些点到线的距离。我们线的28>y坐标。

通过同一组点的关于科普手抄报不同线将给出不同的距离集。我们希望这些距离尽可能小。但有一个问题。由于我们的距离可以是正的或负的,所有这些距离的总和将相互抵消。距离之和将始终等于零。

这个问题的解决方案是通过平方点和线之间的距离来消除所有负数。这给出了一组非负数。我们找到一条**拟合线的目标与使这些平方距离的总和尽可能小相同。微积分在这里得到拯救。微积分中的微分过程使得可以最小化与给定线的平方距离的总和。这解释了我们名称中的“最小二乘法”。

最适合的行

由于最小二乘线使线与点之间的平方距离最小化,因此我们可以将此线视为最适合我们数据的线。这就是为什么最小二乘线也被称为**拟合线。在所有可能绘制的线中,最小二乘线最接近整个数据集。这可能意味着我们的线将错过击中我们数据集中的任何一个点。

最小二乘线

的特征

每条最小二乘线都有一些特征。**项兴趣涉及我们线的斜率。斜率与我们数据的相关系数有关。实际上,线的斜率等于r(s/s)。这里s表示我们数据的x坐标的标准偏差,s表示y坐标的标准偏差。相关系数的符号与最小二乘线斜率的符号直接相关。

最小二乘线的另一个特征涉及它通过的点。而最小二乘线的68 y 69截距可能并不令人感兴趣从统计的角度来看,有一点是。每条最小二乘线都通过数据的中点。该中点具有x坐标,其是x值的平均值和y坐标,其是y的平均值。值。