## MinMaxScaler

Essa função padroniza os dados entre dois parâmetros estipulados, da seguine forma: 

```X_str = (X - Xmin / (Xmax - Xmin)```

```X_scaled = X_std * (máx - min) + min```


In [11]:
from sklearn.preprocessing import MinMaxScaler
X = [[4, 1, 2, 2], [1, 3, 9, 3], [5, 7, 5, 1]]
normalizador = MinMaxScaler(feature_range = (0, 1))
print(X)
print(normalizador.fit_transform(X))


[[4, 1, 2, 2], [1, 3, 9, 3], [5, 7, 5, 1]]
[[0.75       0.         0.         0.5       ]
 [0.         0.33333333 1.         1.        ]
 [1.         1.         0.42857143 0.        ]]


## StandardScaler

Normaliza os dados a partid da fórmula:

`z = (x-u)/s`

Onde `u` é a média e `s` é o desvio padrão (Standard deviation).

In [12]:
from sklearn.preprocessing import StandardScaler
X = [[4, 1, 2, 2], [1, 3, 9, 3], [5, 7, 5, 1]]
normalizador = StandardScaler()
print(normalizador.fit_transform(X))

[[ 0.39223227 -1.06904497 -1.16247639  0.        ]
 [-1.37281295 -0.26726124  1.27872403  1.22474487]
 [ 0.98058068  1.33630621 -0.11624764 -1.22474487]]


## MaxAbsScaler

Normaliza os dados dividindo cada elemento pelo maior valor do conjunto:

`X' = X/M` (Onde M é o valor máximo)


In [13]:
from sklearn.preprocessing import MaxAbsScaler
X = [[4, 1, 2, 2], [1, 3, 9, 3], [5, 7, 5, 1]]
normalizador = MaxAbsScaler()
print(normalizador.fit_transform(X))

[[0.8        0.14285714 0.22222222 0.66666667]
 [0.2        0.42857143 1.         1.        ]
 [1.         1.         0.55555556 0.33333333]]


## Função Normalize

Realiza a normalização de **cada linha da matriz** (o cálculo é feito linha port linha em vez de coluna por coluna). Possui 3 parâmetros possíveis: 'l1', 'l2' ou 'máx'.

In [15]:
from sklearn.preprocessing import normalize
X = [[4, 1, 2, 2], [1, 3, 9, 3], [5, 7, 5, 1]]
normalizador = normalize(X, norm= 'l1') #Normalizando utilizando l1
print(normalizador)

[[0.44444444 0.11111111 0.22222222 0.22222222]
 [0.0625     0.1875     0.5625     0.1875    ]
 [0.27777778 0.38888889 0.27777778 0.05555556]]


In [17]:
from sklearn.preprocessing import normalize
X = [[4, 1, 2, 2], [1, 3, 9, 3], [5, 7, 5, 1]]
normalizador = normalize(X, norm= 'l2') #Normalizando utilizando l2
print(normalizador)

[[0.8 0.2 0.4 0.4]
 [0.1 0.3 0.9 0.3]
 [0.5 0.7 0.5 0.1]]


In [18]:
from sklearn.preprocessing import normalize
X = [[4, 1, 2, 2], [1, 3, 9, 3], [5, 7, 5, 1]]
normalizador = normalize(X, norm= 'max') #Normalizando utilizando l2
print(normalizador)

[[1.         0.25       0.5        0.5       ]
 [0.11111111 0.33333333 1.         0.33333333]
 [0.71428571 1.         0.71428571 0.14285714]]


Um detalhe importante é que se você quiser utilizar a função `sklearn.preprocessing.normalize` para normalizar os dados em relação as colunas ao invés das linhas você pode mudar o `axis = 1` para `axis =0`. Nada intuitivo visto que axis=1 geralmente é usado para as colunas mas nesse caso é diferente. Alguns padrões desse algortimos estão invertidos, então revisando:

`axis = 0` --  para normalizar as colunas.

`axis = 1` -- para normalizar as linhas.

Exemplo de normalização pelas colunas:


In [19]:
from sklearn.preprocessing import normalize
X = [[4, 1, 2, 2], [1, 3, 9, 3], [5, 7, 5, 1]]
normalizador = normalize(X, norm= 'max', axis=0) #Normalizando utilizando l2
print(normalizador)

[[0.8        0.14285714 0.22222222 0.66666667]
 [0.2        0.42857143 1.         1.        ]
 [1.         1.         0.55555556 0.33333333]]
