# 线性回归
当数据呈线性关系，通过线性回归模型求得具体参数

### 拟合和回归
数据之间可能存在某种函数或者方程近似表示，但是具体的参数未知。可以使用拟合的方式求得这些参数。回归是求得这些参数的具体方法或者模型。
> 常见的拟合方法：`ARIMA`, `VAR`

##### 最小二乘法
一个方程组可能无解，我们可以去寻找和解近似的向量$x$。使用欧氏距离来确定与解相似，这样求出来的 $x$ 被称为最小二乘解。

找到合适的参数，使得残差最小。及找到最合适的参数，使得点尽可能的分布在直线的两侧
$M = \sum (y_i - f(x_i))^2$
> 真实值 $y_i$；拟合值：$f(x_i)$

使用线性代数理解：
$f(x_1, x_2, x_3) = a_0 + a_1x_1 + a_2x_2 + a_3x_3$
$$ \left(
\begin{matrix}
y_1 \\
y_2 \\
y_3 \\
y_4 \\
y_5 \\
\end{matrix}
\right) 
- 
\left(
\begin{matrix}
1 & x_{11} & x_{12} & x_{13} \\
1 & x_{21} & x_{22} & x_{23} \\
1 & x_{31} & x_{32} & x_{33} \\
1 & x_{41} & x_{42} & x_{43} \\
1 & x_{51} & x_{52} & x_{53}
\end{matrix}
\right)
\left(
\begin{matrix}
a_0 \\
a_1 \\
a_2 \\
a_3 \\
\end{matrix}
\right)
= y - \mathbf{Xa}
$$
> $m = y - \mathbf{Xa}$ 即为残差，需要求取元素平方和的最小值，$\mathbf{m^Tm}$ 最小
> $\\ \mathbf{a} = (\mathbf{x^Tx})^{-1}\mathbf{X^Ty}$

最小二乘法案例：
$\\ y = 2 + \frac{1}{3}x_1 + \frac{4}{5}x_2 - \frac{1}{5}x_3$


In [14]:
# LSE
import numpy as np
import matplotlib.pyplot as plt


# 生成采样点
np.random.seed(37)
x = np.random.randint(0, 20, size=(4, 3))
y = np.array([2 + 1/3 * points[0] + 4/5 * points[1] - 1/5 * points[2] for points in x])
X = np.hstack((np.ones(4).reshape(4,-1), x))

a = np.dot(np.dot(np.linalg.inv(np.dot(X, X.T)), X.T), y)
a



array([-23289.42574874,   3827.57418621,   6875.76842449,  15742.38105472])