# Questao 6
## Como identificar e tratar outliers em uma coluna numerica usando desvio padrao ou quartis?
- Desvio padrao (z-score): marca como outlier quando |z| > 3 (ou 2.5).
- Quartis (IQR): calcula Q1, Q3 e IQR; outliers ficam fora de [Q1-1.5*IQR, Q3+1.5*IQR].
- Tratamento comum: remover, capar (winsorizar) ou substituir por um valor (ex.: mediana).

In [None]:
import pandas as pd


def outliers_por_zscore(serie, z_max=3.0):
    z = (serie - serie.mean()) / serie.std(ddof=0)
    return serie[abs(z) > z_max]


def outliers_por_iqr(serie, fator=1.5):
    q1 = serie.quantile(0.25)
    q3 = serie.quantile(0.75)
    iqr = q3 - q1
    lim_inf = q1 - fator * iqr
    lim_sup = q3 + fator * iqr
    return serie[(serie < lim_inf) | (serie > lim_sup)]


def tratar_outliers_capar(serie, fator=1.5):
    q1 = serie.quantile(0.25)
    q3 = serie.quantile(0.75)
    iqr = q3 - q1
    lim_inf = q1 - fator * iqr
    lim_sup = q3 + fator * iqr
    return serie.clip(lim_inf, lim_sup)


if __name__ == "__main__":
    coluna = pd.Series([10, 12, 12, 13, 12, 11, 14, 12, 100])

    z_out = outliers_por_zscore(coluna)
    iqr_out = outliers_por_iqr(coluna)
    coluna_capada = tratar_outliers_capar(coluna)

    print("Outliers z-score:\n", z_out)
    print("Outliers IQR:\n", iqr_out)
    print("Coluna capada:\n", coluna_capada)
