[![](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/itmorn/AI.handbook/blob/main/machine_learning/algorithm/linear_models/linear_models.ipynb)

# 线性模型引题
在日常生活中，有很多场景都藏着线性模型(Linear Models)的影子，或者说，都可以尝试使用线性模型来建模，比如：
- 孩子的身高 $y$ 和父母平均身高 $x$ 的关系。
- 森林受火灾影响程度 $y$ 和当时气温 $x^{(1)}$ 、风力 $x^{(2)}$ 的关系。
- 肿瘤为恶性的概率 $y$ 和肿瘤尺寸 $x$ 的关系。

<center>

![](./imgs/Galton_height.png)
</center>

# 线性模型的基本形式——线性回归
**回归(regression)** 一词最早由英国著名生物学家兼统计学家Galton提出(1886年)，他当时是在研究孩子的身高和父母平均身高的关系，最终他得出的线性回归(linear regression)模型为：
<center>

$\hat{y}(x)=33.73+0.516x$
</center>

其中，33.73为截距，0.516为斜率，都属于该模型的参数。  

将影响预测值的因素扩展到n个：  
<center>

$\hat{y}(\mathbf{x}) = w_0 + w_1 x^{(1)} + ... + w_n x^{(n)}$  
</center>

再进行向量化：  
<center>

$\hat{y}(\mathbf{x}) = w_0 + \mathbf{w} \mathbf{x}$  
</center>


# 线性模型的广义形式——广义线性模型
在上述Galton的例子中，假设某样本为 $(x_i,y_i)$，模型对该样本的预测值为 $\hat{y_i}$ 。
我们可以发现，Galton在建模时，他是用模型对 $x_i$ 的预测值去拟合 $y_i$ 的值。

那么，我们是否可以用模型的预测值去拟合 $y_i$ 的衍生物呢？比如说：  
<center>

$ln(\hat{y}(\mathbf{x})) = w_0 + \mathbf{w} \mathbf{x}$  
</center>

当然可以，这其实就是**对数线性回归**(log-linear regression)。

In [47]:
import math
import plotly.express as px

x = [1,2,3,4]
y_true = [math.exp(i) for i in x]
y_ln = [math.log(i) for i in y_true]

fig = px.line(x=x*2, y=y_true+y_ln,color=["y_true"]*len(y_true)+["y_ln"]*len(y_true), markers=True)
fig.show()

究其本质，就是**在线性回归的基础上加了一个非线性函数映射**，这样的模型，我们称为“广义线性模型”(generalized linear model)

# 内容安排
未来我们会深入讲解很多线性模型，比如，普通最小二乘回归、Lasso回归、Ridge回归，以及能做分类任务的Logistic回归等。至于非线性模型，我们也会讲很多，比如树模型、概率模型等。
