In [40]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.neural_network import MLPClassifier
from sklearn.svm import SVC
from sklearn.naive_bayes import GaussianNB
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

In [41]:
url = "https://raw.githubusercontent.com/celsocrivelaro/simple-datasets/main/user_data.csv"
dados = pd.read_csv(url)

In [42]:
dados = dados.drop('User ID', axis=1)

X = dados.drop('Purchased', axis=1)
y = dados['Purchased']

In [43]:
# Dividir os dados em conjunto de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [44]:
# Definir pré-processamento usando ColumnTransformer e Pipeline
numeric_features = ['Age', 'EstimatedSalary']
categorical_features = ['Gender']

preprocessor = ColumnTransformer(
    transformers=[
        ('num', StandardScaler(), numeric_features),
        ('cat', OneHotEncoder(), categorical_features)
    ],
    remainder='passthrough'  # Inclui colunas não transformadas no resultado
)

In [45]:
# Inicializar os Classificadores com pré-processamento
classificadores = {
    'Redes Neurais': MLPClassifier(random_state=42),
    'SVM': SVC(random_state=42),
    'Naive Bayes': GaussianNB(),
    'KNN': KNeighborsClassifier()
}

In [46]:
# Treinar e Avaliar os Classificadores
resultados = {}

for nome, clf in classificadores.items():
    # Criar um pipeline que inclui o pré-processamento e o classificador
    model = Pipeline(steps=[('preprocessor', preprocessor), ('classifier', clf)])
    
    # Treinar o classificador
    model.fit(X_train, y_train)

    # Fazer previsões no conjunto de teste
    y_pred = model.predict(X_test)

    # Calcular métricas
    acuracia = accuracy_score(y_test, y_pred)
    precisao = precision_score(y_test, y_pred)
    recall = recall_score(y_test, y_pred)
    f1 = f1_score(y_test, y_pred)

    # Armazenar resultados
    resultados[nome] = {'Acurácia': acuracia, 'Precisão': precisao, 'Recall': recall, 'F1-Score': f1}



In [47]:
# Exibir Resultados
for nome, metricas in resultados.items():
    print(f"\nClassificador: {nome}")
    for metrica, valor in metricas.items():
        print(f"{metrica}: {valor:.4f}")



Classificador: Redes Neurais
Acurácia: 0.9375
Precisão: 0.8966
Recall: 0.9286
F1-Score: 0.9123

Classificador: SVM
Acurácia: 0.9250
Precisão: 0.8667
Recall: 0.9286
F1-Score: 0.8966

Classificador: Naive Bayes
Acurácia: 0.9250
Precisão: 0.9231
Recall: 0.8571
F1-Score: 0.8889

Classificador: KNN
Acurácia: 0.9250
Precisão: 0.8667
Recall: 0.9286
F1-Score: 0.8966
