# **`MinMaxScaler()`**

## **Introdução**

Neste notebook veremos como alterar a escala de uma amostra usando a classe `MinMaxScaler()` do `sklearn.preprocessing`. Ela é importada da seguinte maneira:

In [1]:
from sklearn.preprocessing import MinMaxScaler

Sua documentação pode ser econtrada [neste link](https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.MinMaxScaler.html). Aqui focaremos mais no método `fit_transform()`. que padroniza os elementos da amostra no intervalo [0-1].

Essa padronização se dá pela seguinte fórmula:

$$
x_{padronizado} = \frac{x - x_{min} }{x_{max}-x_{min}}
$$

Sempre é válido perguntar por que alteramos a escala de nossas amostras. Ocorre que colunas com escalas diferentes não contribuem igualmente para a aprendizagem do modelo. Deste modo, o `MinMaxScaler()` se mostra adequado para colunas de DataFrames com valores muito altos ou muito baixos com relação às outras colunas.

In [5]:
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]

data

[[-1, 2], [-0.5, 6], [0, 10], [1, 18]]

Aqui o interpretador entende que temos duas colunas, onde a primeira é formada pelos elementos (-1,-0.5,0,1), e a segunda é (2,6,10,18). Podemos verificar isso tanto com o método `fit_transform()`, quanto pelo atributo `data_min_`, que retorna um array com o mínimo de cada coluna.

In [7]:
scaler = MinMaxScaler()

scaler.fit_transform(data)

array([[0.  , 0.  ],
       [0.25, 0.25],
       [0.5 , 0.5 ],
       [1.  , 1.  ]])

Vendo pelo `data_min_`:

In [8]:
scaler.data_min_

array([-1.,  2.])