# 正则化

将基本函数引入线性回归令我们的模型更加灵活，但是它很容易导致过拟合

例如如果我们选择了太多的高斯函数，产生的结果就不太可靠了

## 岭回归（$L_2$正则化）
这个过程通过对模型系数的平方和（2-范数）进行乘法；在这个例子中，模型的惩罚是
$$
P = \alpha\sum_{n=1}^N \theta_n^2
$$
其中$\alpha$是控制乘法力度的参数。这类的惩罚模型內建在Scikit-Learn中`Ridge`评估器中：

$\alpha$参数是用来控制模型复杂度的关键开关。极限情况$\alpha \to 0$时，恢复到标准线性回归结果；极限情况$\alpha \to \infty$时，所有模型的响应都会被压缩。岭回归的一大优点是它能非常有效的计算，基本没有产生比原始线性回归模型更大的计算消耗。

In [1]:
'''
from sklearn.linear_model import Ridge
model = make_pipeline(GaussianFeatures(30), Ridge(alpha=0.1))
basis_plot(model, title='Ridge Regression')
'''

"\nfrom sklearn.linear_model import Ridge\nmodel = make_pipeline(GaussianFeatures(30), Ridge(alpha=0.1))\nbasis_plot(model, title='Ridge Regression')\n"

![](images/2022-08-29-13-04-52.png)

## Lasso算法回归（$L_1$正则化）
另一个常用的正则化类型被称为lasso，通过惩罚回归系数绝对值和（1-范数）来实现：
$$
P = \alpha\sum_{n=1}^N |\theta_n|
$$
虽然这在概念上非常类似岭回归，但是结果却大不相同：例如因为几何原因lasso回归更适合*稀疏模型*，即它倾向于将模型系数设置为0。


我们可以从下面的图中看到这个特点，这里将岭回归改成了使用L1正则化系数：

下面代码添加了`Lasso`正则化线性回归模型参数tol，以避免产生一个不收敛的警告。

In [2]:
'''
from sklearn.linear_model import Lasso
model = make_pipeline(GaussianFeatures(30), Lasso(alpha=0.001, tol=0.01))
basis_plot(model, title='Lasso Regression')
'''

"\nfrom sklearn.linear_model import Lasso\nmodel = make_pipeline(GaussianFeatures(30), Lasso(alpha=0.001, tol=0.01))\nbasis_plot(model, title='Lasso Regression')\n"

![](images/2022-08-29-13-12-26.png)