# 线性回归算法介绍

- 解决回归问题
- 思想简单，实现容易
- 许多强大的非线性模型的基础
- 结果具有很好的可解释性
- 蕴含机器学习很多重要思想

# 简单线性回归

$$
    y = ax + b
$$

$$
    \hat{y}^{(i)} = ax^{(i)} + b
$$

$\hat{y}^{(i)}$为预测值，$y^{(i)}$为真实值

我们希望$y^{(i)}$和$\hat{y}^{(i)}$差距尽可能小

$$
    |y^{(i)} - \hat{y}^{(i)}| 
$$

$$
    (y^{(i)} - \hat{y}^{(i)})^2
$$

考虑所有样本：
$$
    \sum_{i=1}^m{(y^{(i)} - \hat{y}^{(i)})^2}
$$

**目标：**
使
$$
    \sum_{i=1}^m{(y^{(i)} - \hat{y}^{(i)})^2}
$$
尽可能小<br>
代入
$$
    \hat{y}^{(i)} = ax^{(i)} + b
$$

得到：
$$
    \sum_{i=1}^m(y^{(i)} - ax^{(i)} - b)^2
$$

**目标转化为：**<br>
找到$a$和$b$，使得<br>
$$
    \sum_{i=1}^m(y^{(i)} - ax^{(i)} - b)^2
$$
尽可能小

这样的函数也被称为**损失函数(loss function)**

**机器学习解决问题的思路：**<br>
- 通过分析问题，确定问题的损失函数或者效用函数
- 通过最优化损失函数或者效用函数，获得机器学习的模型

近乎所有参数学习算法都是这样的套路

当前的目标是一个典型的最小二乘法问题：最小化误差的平方

$$
    a = \frac{\sum_{i=1}^m(x^{(i)} - \bar{x})(y^{(i)} - \bar{y})}{\sum_{i=1}^m(x^{(i)} - \bar{x})^2}
$$

$$
b = \bar{y} - a\bar{x}
$$

# 最小二乘法

设：
$$
    \sum_{i=1}^m(y^{(i)} - ax^{(i)} - b)^2 = J(a,b)
$$

求最值需要对自变量$a$, $b$求导

$$
    \frac{\partial J(a,b)}{\partial a} = 0, \frac{\partial J(a,b)}{\partial b} = 0
$$

$$
\frac{\partial J(a,b)}{\partial b} = \sum_{i=1}^m2(y^{(i)} - ax^{(i)} - b)(-1) = 0
$$

$$
\sum_{i=1}^m(y^{(i)} - ax^{(i)} - b) = 0
$$

$$
    \sum_{i = 1}^my^{(i)} - a\sum_{i=1}^mx^{(i)} - \sum_{i = 1}^mb = 0
$$

$$
    \sum_{i = 1}^my^{(i)} - a\sum_{i=1}^mx^{(i)} - mb = 0
$$

$$
    \sum_{i = 1}^my^{(i)} - a\sum_{i=1}^mx^{(i)} = mb
$$

$$
b = \bar{y} - a\bar{x}
$$

$$
    \frac{\partial J(a,b)}{\partial a} = \sum_{i=1}^m2(y^{(i)} -ax^{(i)} - b)(-x^{(i)}) = 0
$$

$$
    \sum_{i=1}^m(y^{(i)} -ax^{(i)} - b)x^{(i)} = 0
$$

将$b = \bar{y} - a\bar{x}$代入:
$$
        \sum_{i=1}^m(y^{(i)} -ax^{(i)} - \bar{y} + a\bar{x})x^{(i)} = 0
$$

$$
    \sum_{i=1}^m(x^{(i)}y^{(i)} -a(x^{(i)})^2 - x^{(i)}\bar{y} + a\bar{x}x^{(i)}) = 0
$$

$$
    \sum_{i=1}^m(x^{(i)}y^{(i)} - x^{(i)}\bar{y} -a(x^{(i)})^2 + a\bar{x}x^{(i)}) = 0
$$

$$
    \sum_{i=1}^m(x^{(i)}y^{(i)} - x^{(i)}\bar{y}) - \sum_{i=1}^m(a(x^{(i)})^2 - a\bar{x}x^{(i)}) = 0
$$

$$
    \sum_{i=1}^m(x^{(i)}y^{(i)} - x^{(i)}\bar{y}) - a\sum_{i=1}^m((x^{(i)})^2 - \bar{x}x^{(i)}) = 0
$$

$$
        a = \frac{\sum_{i=1}^m(x^{(i)}y^{(i)} - x^{(i)}\bar{y})}{\sum_{i=1}^m((x^{(i)})^2 - \bar{x}x^{(i)})}
$$

$$
    \sum_{i=1}^mx^{(i)}\bar{y} = \bar{y}\sum_{i=1}^mx^{(i)} = m\bar{y} \cdot \bar{x} = \bar{x}\sum_{i=1}^my^{(i)} = \sum_{i=1}^{m}\bar{x}y^{(i)} = \sum_{i=1}^m\bar{x} \cdot \bar{y}
$$

$$
    a = \frac{\sum_{i=1}^m(x^{(i)}y^{(i)} - x^{(i)}\bar{y} - \bar{x}y^{(i)} + \bar{x}\bar{y} )}{\sum_{i=1}^m((x^{(i)})^2 - \bar{x}x^{(i)} - \bar{x}x^{(i)} + \bar{x}^2)}
$$

进一步简化:
$$
    a = \frac{\sum_{i=1}^m(x^{(i)} - \bar{x})(y^{(i)} - \bar{y})}{\sum_{i=1}^m(x^{(i)} - \bar{x})^2}
$$