# MinMaxScaler (normalizacao)
É uma função que **normaliza** os dados entre um intervalo estipulado, por exemplo, 0 e 1.

$$
X' = \frac{X - X_{\text{min}}}{X_{\text{max}} - X_{\text{min}}}
$$

É adequado quando sabemos que os dados possuem limites conhecidos e é importante manter a distribuição original dos dados, mas escalada. É muito usado em redes neurais, que se dão bem com entradas entre 0 e 1.

**Vantagens:**
- Mantém a distribuição original dos dados.
- Simples de entender e implementar.

**Desvantagens:**
- Sensível a outliers, já que os valores mínimos e máximos podem ser distorcidos.
- Pode haver perda de informação.

**Casos de uso:**
- Redes Neurais
- Métodos baseados em distância
- Algoritmos de otimização com restrição de intervalo

# StandardScaler (padronizacao)
Transforma os dados para que tenham uma média de zero e desvio padrão de 1.

$$
X' = \frac{X - \mu}{\sigma}
$$

Onde X é o valor original, "u" é a média e sigma é o desvio padrão.

**Vantagens:**
- Remove a influência de diferentes escalas nos dados
- Útil para algoritmos que dependem de **padronizacao** dos dados.

**Desvantagens:**
- É sensível a outliers, já que usa média e desvio padrão.

**Casos de uso:**
- Modelos lineares (Reg Linear, SMV, etc)
- Redução de dimensionalidade (PCA)

# MaxAbsScaler (normalizacao)
Normaliza os dados dividindo cada elemento pelo valor absoluto máximo de cada característica. Utilizamos quando possuímos dados que contém valores negativos e positivos e precisam ser normalizados, mas sem alterar a centralidade dos dados.

$$
X' = \frac{X}{\lvert X_{\text{max}}\rvert}
$$

**Vantagens:**
- Não desloca os dados, preservando os valores negativos e a centralidade
- Funciona com dados esparsos

**Desvantagens:**
- É sensível a outliers.

**Casos de uso:**
- Dados esparsos
- Modelos que aceitam valores negativos

# Função Normalize (normalizacao)
Ajusta cada amostra de forma que o vetor de características possua norma 1.
Realiza a normalização de **cada linha** da matriz. Podemos ajustar 3 parâmetros nela: L1, L2, e max.

$$
X' = \frac{X}{\lVert X \rVert_2}
$$

**Vantagens:**
- Escala todas as amostras para o mesmo tamanho, útil para técnicas baseadas em distâncias
- Não afeta a distribuição dos dados dentro da amostra

**Desvantagens:**
- Pode não ser adequado quando a magnetude das características importa
- Pode levar à perda de variabilidade entre amostras.

**Casos de uso:**
- Clustering
- Algoritmos baseados em vetores e ângulos
- Análise de similaridade