In [4]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder

pd.set_option('display.width', None)

df = pd.read_csv('clientes-v2-tratados.csv')

print(df.head())

# Codificação one-hot para 'estado_civil'
df = pd.concat([df, pd.get_dummies(df['estado_civil'], prefix='estado_civil')], axis=1)

print("\nDataFrame após codificação one-hot para 'estado_civil':\n", df.head())

# Codificação ordinal para 'nivel_educacao'
educacao_ordem = {'Ensino Fundamental': 1, 'Ensino Médio': 2, 'Ensino Superior': 3, 'Pós-graduação': 4}
df['nivel_educacao_ordinal'] = df['nivel_educacao'].map(educacao_ordem)

print("\nDataFrame após codificação ordinal para 'nivel_educacao':\n", df.head())

# Transformar 'area_atuacao' em categorias codificadas usando o método .cat.codes
df['area_atuacao_cod'] = df['area_atuacao'].astype('category').cat.codes

print("\nDataFrame após transformar 'area_atuacao' em códigos numéricos:\n", df.head())

# LabelEncoder para aplicar em 'estado'
# LablEcncoder converte cada valor único em numeros de o a N_classes-1
label_encoder = LabelEncoder()
df['estado'] = label_encoder.fit_transform(df['estado'])

print("\nDataFrame após aplicar LabelEncoder em 'estado':\n", df.head())

   idade        data               estado   salario      nivel_educacao  \
0     56  1968-01-19                 Pará  13550.54        Ensino Médio   
1     49  1975-01-31  Rio Grande do Norte   3124.72        Ensino Médio   
2     54  1969-08-26         Minas Gerais   7534.60        Ensino Médio   
3     61  1963-03-19                Amapá   4067.73  Ensino Fundamental   
4     30  1993-12-09              Alagoas   6809.94        Ensino Médio   

   numero_filhos estado_civil area_atuacao  
0              0       Casado   Tecnologia  
1              3       Casado    Indústria  
2              0       Casado   Tecnologia  
3              1     Solteiro     Comércio  
4              1       Casado   Tecnologia  

DataFrame após codificação one-hot para 'estado_civil':
    idade        data               estado   salario      nivel_educacao  \
0     56  1968-01-19                 Pará  13550.54        Ensino Médio   
1     49  1975-01-31  Rio Grande do Norte   3124.72        Ensino Médio