In [4]:
import pandas as pd
from sklearn.preprocessing import RobustScaler, MinMaxScaler, StandardScaler

pd.set_option('display.width', None)
pd.set_option('display.max_colwidth', None)

df = pd.read_csv('clientes-v2-tratados.csv')

print(df.head())

df = df.drop(labels=['data', 'estado', 'nivel_educacao', 'numero_filhos', 'estado_civil', 'area_atuacao'], axis=1)

# Normalização - MinMaxScaler
scaler = MinMaxScaler()
df['idadeMinMaxScaler'] = scaler.fit_transform(df[['idade']])
df['salarioMinMaxScaler'] = scaler.fit_transform(df[['salario']])

# MinMaxScaler com feature_range (-1, 1)
min_max_scaler = MinMaxScaler(feature_range=(-1, 1))
df['idadeMinMaxScaler_mm'] = min_max_scaler.fit_transform(df[['idade']])
df['salarioMinMaxScaler_mm'] = min_max_scaler.fit_transform(df[['salario']])

# Padronização - StandardScaler
scaler = StandardScaler()
df['idadeStandardScaler'] = scaler.fit_transform(df[['idade']])
df['salarioStandardScaler'] = scaler.fit_transform(df[['salario']])

# Normalização - RobustScaler
scaler = RobustScaler()
df['idadeRobustScaler'] = scaler.fit_transform(df[['idade']])
df['salarioRobustScaler'] = scaler.fit_transform(df[['salario']])

print(df.head(15))

print("\nMinMaxScaler (De -1 a 1):")
print("Idade - Min: {:.4f} Max: {:.4f} Mean: {:.4f} Std: {:.4f}".format(
    df['idadeMinMaxScaler_mm'].min(), df['idadeMinMaxScaler_mm'].max(),
    df['idadeMinMaxScaler_mm'].mean(), df['idadeMinMaxScaler_mm'].std()))
print("Salário - Min: {:.4f} Max: {:.4f} Mean: {:.4f} Std: {:.4f}".format(
    df['salarioMinMaxScaler_mm'].min(), df['salarioMinMaxScaler_mm'].max(),
    df['salarioMinMaxScaler_mm'].mean(), df['salarioMinMaxScaler_mm'].std()))

print("\nStandardScaler (Ajuste a média a 0 e desvio padrão a 1):")
print("Idade - Min: {:.4f} Max: {:.4f} Mean: {:.18f} Std: {:.4f}".format(
    df['idadeStandardScaler'].min(), df['idadeStandardScaler'].max(),
    df['idadeStandardScaler'].mean(), df['idadeStandardScaler'].std()))
print("Salário - Min: {:.4f} Max: {:.4f} Mean: {:.4f} Std: {:.4f}".format(
    df['salarioStandardScaler'].min(), df['salarioStandardScaler'].max(),
    df['salarioStandardScaler'].mean(), df['salarioStandardScaler'].std()))

print("\nRobustScaler (Ajuste a mediana e IQR):")
print("Idade - Min: {:.4f} Max: {:.4f} Mean: {:.4f} Std: {:.4f}".format(
    df['idadeRobustScaler'].min(), df['idadeRobustScaler'].max(),
    df['idadeRobustScaler'].mean(), df['idadeRobustScaler'].std()))
print("Salário - Min: {:.4f} Max: {:.4f} Mean: {:.4f} Std: {:.4f}".format(
    df['salarioRobustScaler'].min(), df['salarioRobustScaler'].max(),
    df['salarioRobustScaler'].mean(), df['salarioRobustScaler'].std()))

   idade        data               estado   salario      nivel_educacao  \
0     56  1968-01-19                 Pará  13550.54        Ensino Médio   
1     49  1975-01-31  Rio Grande do Norte   3124.72        Ensino Médio   
2     54  1969-08-26         Minas Gerais   7534.60        Ensino Médio   
3     61  1963-03-19                Amapá   4067.73  Ensino Fundamental   
4     30  1993-12-09              Alagoas   6809.94        Ensino Médio   

   numero_filhos estado_civil area_atuacao  
0              0       Casado   Tecnologia  
1              3       Casado    Indústria  
2              0       Casado   Tecnologia  
3              1     Solteiro     Comércio  
4              1       Casado   Tecnologia  
    idade   salario  idadeMinMaxScaler  salarioMinMaxScaler  \
0      56  13550.54           0.520548             0.429638   
1      49   3124.72           0.424658             0.062257   
2      54   7534.60           0.493151             0.217650   
3      61   4067.73        