<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#1.-特征缩放" data-toc-modified-id="1.-特征缩放-1">1. 特征缩放</a></span><ul class="toc-item"><li><span><a href="#1.1-最大最小值归一化（min-max-normalization）" data-toc-modified-id="1.1-最大最小值归一化（min-max-normalization）-1.1">1.1 最大最小值归一化（min-max normalization）</a></span><ul class="toc-item"><li><span><a href="#sklearn.preprocessing.MinMaxScaler" data-toc-modified-id="sklearn.preprocessing.MinMaxScaler-1.1.1">sklearn.preprocessing.MinMaxScaler</a></span></li></ul></li><li><span><a href="#1.2-均值归一化（mean-normalization）" data-toc-modified-id="1.2-均值归一化（mean-normalization）-1.2">1.2 均值归一化（mean normalization）</a></span></li><li><span><a href="#1.3-中心化（mean-centering）" data-toc-modified-id="1.3-中心化（mean-centering）-1.3">1.3 中心化（mean centering）</a></span></li><li><span><a href="#1.4-标准化-/-z值归一化（standardization-/-z-score-normalization）" data-toc-modified-id="1.4-标准化-/-z值归一化（standardization-/-z-score-normalization）-1.4">1.4 标准化 / z值归一化（standardization / z-score normalization）</a></span><ul class="toc-item"><li><span><a href="#sklearn.preprocessing.StandardScaler" data-toc-modified-id="sklearn.preprocessing.StandardScaler-1.4.1">sklearn.preprocessing.StandardScaler</a></span></li></ul></li><li><span><a href="#1.5-最大绝对值归一化（max-abs-normalization）" data-toc-modified-id="1.5-最大绝对值归一化（max-abs-normalization）-1.5">1.5 最大绝对值归一化（max-abs normalization）</a></span><ul class="toc-item"><li><span><a href="#sklearn.preprocessing.Normalizer" data-toc-modified-id="sklearn.preprocessing.Normalizer-1.5.1">sklearn.preprocessing.Normalizer</a></span></li></ul></li><li><span><a href="#1.6-稳健归一化（robust-normalization）" data-toc-modified-id="1.6-稳健归一化（robust-normalization）-1.6">1.6 稳健归一化（robust normalization）</a></span><ul class="toc-item"><li><span><a href="#sklearn.preprocessing.robust_scale" data-toc-modified-id="sklearn.preprocessing.robust_scale-1.6.1">sklearn.preprocessing.robust_scale</a></span></li></ul></li></ul></li><li><span><a href="#2.-需要进行缩放的模型" data-toc-modified-id="2.-需要进行缩放的模型-2">2. 需要进行缩放的模型</a></span></li><li><span><a href="#3.-不需要进行缩放的模型" data-toc-modified-id="3.-不需要进行缩放的模型-3">3. 不需要进行缩放的模型</a></span></li><li><span><a href="#4.-进行特征缩放的注意事项" data-toc-modified-id="4.-进行特征缩放的注意事项-4">4. 进行特征缩放的注意事项</a></span></li></ul></div>

# 1. 特征缩放

`特征缩放`（Feature Scaling）

## 1.1 最大最小值归一化（min-max normalization）

$$
x^\prime=\frac{x-min(x)}{max(x)-min(x)} \tag{1}
$$

将数据归一化到 $[0,1]$。

### sklearn.preprocessing.MinMaxScaler

[MinMaxScaler](https://scikit-learn.org/dev/modules/generated/sklearn.preprocessing.MinMaxScaler.html#sklearn.preprocessing.MinMaxScaler)(feature_range=(0, 1), copy=True)


## 1.2 均值归一化（mean normalization）

$$
x^\prime=\frac{x-\bar{x}}{max(x)-min(x)} \tag{2}
$$

将数据归一化到 $[-1,1]$。

## 1.3 中心化（mean centering）

$$
x^{\prime}=x-\bar{x} \tag{3}
$$

将数据缩放到 0 附近。


## 1.4 标准化 / z值归一化（standardization / z-score normalization）

$$
x^{\prime}=\frac{x-\bar{x}}{\sigma} \tag{4}
$$

将数据标准化为均值为 0 ，标准差为 1。

### sklearn.preprocessing.StandardScaler

[StandardScaler](https://scikit-learn.org/dev/modules/generated/sklearn.preprocessing.StandardScaler.html#sklearn.preprocessing.StandardScaler)(copy=True, with_mean=True, with_std=True)

## 1.5 最大绝对值归一化（max-abs normalization）

$$x^\prime=\frac{x}{\|max(x)\|} \tag{5}$$

适用于稀疏数据，将数据缩放到 $[-1,1]$。

### sklearn.preprocessing.Normalizer

[Normalizer](https://scikit-learn.org/dev/modules/generated/sklearn.preprocessing.Normalizer.html#sklearn.preprocessing.Normalizer)(norm='l2', copy=True)

norm =‘max’ 时为最大绝对值归一化（好像没有绝对值）。

## 1.6 稳健归一化（robust normalization）

先减去中位数，再除以四分位距（interquartile range, IQR）。因为不涉及极值，因此在数据里有异常值的情况下表现比较稳健。

$$x^\prime = \frac{x-median(x)}{IQR(x)} \tag{6}$$

### sklearn.preprocessing.robust_scale

[robust_scale](https://scikit-learn.org/dev/modules/generated/sklearn.preprocessing.robust_scale.html#sklearn.preprocessing.robust_scale)(X, axis=0, with_centering=True, with_scaling=True, quantile_range=(25.0, 75.0), copy=True)

# 2. 需要进行缩放的模型

通过`梯度下降法`求解的模型需要进行特征缩放，这包括`线性回归`（Linear Regression）、`逻辑回归`（Logistic Regression）、`感知机`（Perceptron）、`支持向量机`（SVM）、`神经网络`（Neural Network）等模型。

此外，`近邻法`（KNN），`K均值聚类`（K-Means）等需要`根据数据间的距离`来划分数据的算法也需要进行特征缩放。

`主成分分析`（PCA），`线性判别分析`（LDA）等需要`计算特征的方差`的算法也会受到特征缩放的影响。

 
# 3. 不需要进行缩放的模型

`决策树`（Decision Tree），`随机森林`（Random Forest）等基于树的模型`不需要`进行特征缩放，因为特征缩放不会改变样本在特征上的信息增益。

# 4. 进行特征缩放的注意事项

需要先把数据拆分成训练集与验证集，在训练集上计算出需要的数值（如均值和标准值），对训练集数据做标准化/归一化处理（不要在整个数据集上做标准化/归一化处理，因为这样会将验证集的信息带入到训练集中，这是一个非常容易犯的错误），然后再用之前计算出的数据（如均值和标准值）对验证集数据做相同的标准化/归一化处理。

参考资料

[1] HuZihu.[ML] 特征缩放（Feature Scaling）[EB/OL].https://www.cnblogs.com/HuZihu/p/9761161.html, 2019-08-11.

[2] Sebastian Raschka.[ML] About Feature Scaling and Normalization
– and the effect of standardization for machine learning algorithms[EB/OL].https://sebastianraschka.com/Articles/2014_about_feature_scaling.html, 2014-7-11.