# 线性回归

线性回归一般通过最小二乘法和梯度下降求解，这里讲解最小二乘法的方法

假设dataset中有 $m$ 个样本，每个样本有 $n$ 个特征,其中 $i$ 表示第$i$个样本,$j$ 表示样本中第 $j$ 个特征

一般线性回归函数的假设函数（hypothesis function）:
    $$
    h_{\theta}(x)= \theta_{0} + \theta_{1}x_{1} +\cdots + \theta_{n}x_{n}
    =\sum_{j=0}^n \theta_{j}x_{j} = \theta^Tx
    $$

最终要求计算出 $\theta$的值，并选择最优的$\theta$值构成算法公式

对应的损失函数为：


$$
loss(y_{j},\hat y_{j})=J(\theta)=\frac{1}{2} \sum_{i=1}^m \left( h_{\theta}(x^{(i)}) - y^{(i)} \right)^2=
\frac{1}{2}(X\theta-Y)^T(X\theta-Y)
$$

直接对目标函数求导：

$$
\nabla_{\theta} J(\theta)=\nabla_{\theta}\frac{1}{2}(X\theta-Y)^T(X\theta-Y)\\=\nabla_{\theta}\frac{1}{2}\left((X^T(\theta)^T-Y^T)(X\theta-Y\right)\\=\frac{1}{2}\left((2X^TX\theta-X^Y-(Y^TX)^T)\right)\\=X^TX\theta-X^TY
$$

令: $X^TX\theta-X^TY =0$

即: $X^TX\theta=X^TY$,

等式两边都左乘$(X^TX)^{-1}$

得：
$
\theta = (X^TX)^{-1}X^TY
$

## 最小二乘法的参数最优解：

$$
\theta = (X^TX)^{-1}X^TY
$$

注意：最小二乘法的使用要求矩阵$X^TX$是可逆的，为了防止不可逆或者过拟合的问题存在，可以增加额外的数据影响，导致最终的矩阵是可逆的：

$$
\theta = \left((X^TX) + \lambda I\right) ^{-1}X^TY
$$

最小二乘法直接求解的难点：矩阵逆的求解是一个难处

实例：

In [9]:
import numpy as np
X = np.mat([[10,1,1],[20,1,1],[30,2,1],[70,3,1],[70,2,1],[30,2,1]])
Y = np.mat([[0.8],[1.8],[2.2],[2.5],[5.5],[5.2]])
theta= (X.T*X).I * X.T *Y
print(theta)

[[ 0.04994737]
 [-0.35736842]
 [ 1.74052632]]


In [19]:
X_test = np.mat([[11,1,1],[12,2,1],[13,2,1],[14,3,1],[15,3,1],[16,2,1]])
print(X_test.dot(theta))

[[1.93257895]
 [1.62515789]
 [1.67510526]
 [1.36768421]
 [1.41763158]
 [1.82494737]]
