In [None]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

# 1. Carregar e explorar o dataset
data = load_wine()
X = data.data
y = data.target

df = pd.DataFrame(X, columns=data.feature_names)
df['target'] = y
print(df.info())
print("Primeiras linhas do dataset:")
print(df.head())

if df.isnull().values.any():
    print("\nValores nulos encontrados, tratando...")
    df.fillna(df.mean(), inplace=True)
else:
    print("\nNenhum valor nulo encontrado.")

X = df.drop('target', axis=1)
y = df['target']

# 2. Pré-processamento dos dados
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Normalização dos dados
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 3. Treinamento e Avaliação dos Modelos
def treinar_avaliar_modelo(nome_modelo, modelo, X_train, X_test, y_train, y_test):
    modelo.fit(X_train, y_train)
    y_pred = modelo.predict(X_test)
    
    print(f"\nModelo: {nome_modelo}")
    print(f"Acurácia: {accuracy_score(y_test, y_pred):.4f}")
    print("Matriz de Confusão:")
    print(confusion_matrix(y_test, y_pred))
    print("Relatório de Classificação:")
    print(classification_report(y_test, y_pred))
    
    return accuracy_score(y_test, y_pred)

# Avaliando Árvore de Decisão
dt_model = DecisionTreeClassifier(random_state=42)
acuracia_dt = treinar_avaliar_modelo('Árvore de Decisão', dt_model, X_train, X_test, y_train, y_test)

# Avaliando Random Forest
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
acuracia_rf = treinar_avaliar_modelo('Random Forest', rf_model, X_train, X_test, y_train, y_test)

# Avaliando K-Nearest Neighbors
knn_model = KNeighborsClassifier(n_neighbors=5)
acuracia_knn = treinar_avaliar_modelo('KNN', knn_model, X_train, X_test, y_train, y_test)

# Comparando as acurácias
print("\nComparação de Acurácias:")
print(f"Árvore de Decisão: {acuracia_dt:.4f}")
print(f"Random Forest: {acuracia_rf:.4f}")
print(f"KNN: {acuracia_knn:.4f}")
