# Importação dos pacotes

In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, classification_report

In [3]:
# ignorar avisos
import warnings
warnings.filterwarnings("ignore")

# Modelos

In [4]:
# Modelos
from sklearn.svm import SVC
from xgboost import XGBClassifier

# Carregamento e Separação da Base de Dados

In [5]:
# 1. Carregar a base
mushroomsCsvPath = '/content/drive/MyDrive/Classroom/Aprendizado de Máquina - ADS - 2025.1 Turma: 20251.4.ADS.CNT.1N   Diário: SUP.06276 (122721)/mushroom-classification/mushrooms.csv'

df = pd.read_csv(mushroomsCsvPath)

# Separar o rótulo da classe
y = df['class']
X = df.drop('class', axis=1)

# 🧠 XGBoost com Label Encoding


---


Aplicar Label Encoding em todas as colunas

In [6]:
# -------------------------------
# 🧠 XGBoost com Label Encoding
# -------------------------------
# Aplicar Label Encoding em todas as colunas
X_xgb = X.copy()
le_xgb = LabelEncoder()

for col in X_xgb.columns:
    X_xgb[col] = le_xgb.fit_transform(X_xgb[col])

y_xgb = LabelEncoder().fit_transform(y)

# Treino/teste
X_train_xgb, X_test_xgb, y_train_xgb, y_test_xgb = train_test_split(X_xgb, y_xgb, test_size=0.3, random_state=42)

# Modelo XGBoost
xgb_model = XGBClassifier(use_label_encoder=False, eval_metric='logloss')
xgb_model.fit(X_train_xgb, y_train_xgb)
xgb_preds = xgb_model.predict(X_test_xgb)

acc_xgb = accuracy_score(y_test_xgb, xgb_preds)
print(f"🎯 Acurácia - XGBoost (Label Encoding): {acc_xgb:.4f}")

# Classification report
print("\n📋 Relatório de Classificação - XGBoost:")
print(classification_report(y_test_xgb, xgb_preds, target_names=['Venenoso', 'Comestível']))


🎯 Acurácia - XGBoost (Label Encoding): 1.0000

📋 Relatório de Classificação - XGBoost:
              precision    recall  f1-score   support

    Venenoso       1.00      1.00      1.00      1257
  Comestível       1.00      1.00      1.00      1181

    accuracy                           1.00      2438
   macro avg       1.00      1.00      1.00      2438
weighted avg       1.00      1.00      1.00      2438



# 🤖 SVM com One-Hot Encoding
---
Aplicar One-Hot Encoding

In [8]:
# -------------------------------
# 🤖 SVM com One-Hot Encoding
# -------------------------------
# Aplicar One-Hot Encoding
X_svm = pd.get_dummies(X)

# Codificar rótulos
y_svm = LabelEncoder().fit_transform(y)

# Treino/teste
X_train_svm, X_test_svm, y_train_svm, y_test_svm = train_test_split(X_svm, y_svm, test_size=0.3, random_state=42)

# Modelo SVM (com kernel RBF por padrão)
svm_model = SVC()
svm_model.fit(X_train_svm, y_train_svm)
svm_preds = svm_model.predict(X_test_svm)

acc_svm = accuracy_score(y_test_svm, svm_preds)
print(f"🎯 Acurácia - SVM (One-Hot Encoding): {acc_svm:.4f}")

# Classification report
print("\n📋 Relatório de Classificação - SVM:")
print(classification_report(y_test_svm, svm_preds, target_names=['Venenoso', 'Comestível']))


🎯 Acurácia - SVM (One-Hot Encoding): 1.0000

📋 Relatório de Classificação - SVM:
              precision    recall  f1-score   support

    Venenoso       1.00      1.00      1.00      1257
  Comestível       1.00      1.00      1.00      1181

    accuracy                           1.00      2438
   macro avg       1.00      1.00      1.00      2438
weighted avg       1.00      1.00      1.00      2438

