回归分析预测技术简介

回归分析的基本概念是用一群变量预测另一个变量的方法。通俗点来讲，就是根据几件事情的相关程度来预测另一件事情发生的概率。回归分析的目的是找到一个联系输入变量和输出变量的最优模型。

回归方法有许多种，可通过 3 种方法进行分类：自变量的个数、因变量的类型和回归线的形状。

1）依据相关关系中自变量的个数不同进行分类，回归方法可分为一元回归分析法和多元回归分析法。在一元回归分析法中，自变量只有一个，而在多元回归分析法中，自变量有两个以上。

2）按照因变量的类型，回归方法可分为线性回归分析法和非线性回归分析法。

3）按照回归线的形状分类时，如果在回归分析中，只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，则这种回归分析称为一元线性回归分析；如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是非线性关系，则称为多元非线性回归分析。

线性回归是世界上最知名的建模方法之一。在线性回归中，数据使用线性预测函数来建模，并且未知的模型参数也是通过数据来估计的。这些模型被叫作线性模型。在线性模型中，因变量是连续型的，自变量可以是连续型或离散型的，回归线是线性的。

回归分析的目的是找到一个联系输入变量和输出变量的最优模型。更确切地讲，回归分析是确定变量 Y 与一个或多个变量 X 之间的相互关系的过程。

Y 通常叫作响应输出或因变量，X 叫作输入、回归量、解释变量或自变量。线性回归最适合用直线（回归线）去建立因变量 Y 和一个或多个自变量 X 之间的关系，如图 1 所示。可以用以下公式来表示。

Y = a+b x X+e

其中，a 为截距，b 为回归线的斜率，e 是误差项。

要找到回归线，就是要确定回归系数 a 和 b。假定变量 y 的方差是一个常量，可以用最小二乘法来计算这些系数，使实际数据点和估计回归直线之间的误差最小，只有把误差做到最小时得出的参数，才是我们最需要的参数。这些残差平方和常常被称为回归直线的误差平方和，用 SSE 来表示，如下。

0条评论

hosteons中文网