# Tarefa 3: Otimização dos Modelos para Melhorar o Desempenho

## Passo 1: Ajuste de hiperparâmetros usando Grid Search e Randomized Search

In [None]:

from sklearn.model_selection import GridSearchCV, RandomizedSearchCV
import numpy as np

# Definindo os parâmetros para ajuste
param_grids = {
    "KNN": {
        "n_neighbors": [3, 5, 7, 9, 11]
    },
    "Random Forest": {
        "n_estimators": [50, 100, 200],
        "max_depth": [None, 10, 20, 30],
        "min_samples_split": [2, 5, 10]
    },
    "SVM": {
        "C": [0.1, 1, 10, 100],
        "kernel": ["linear", "rbf", "poly"]
    },
    "Logistic Regression": {
        "C": [0.1, 1, 10, 100]
    }
}

# Criando dicionário para armazenar os melhores modelos
best_models = {}
best_params = {}

# Ajustando os modelos com Grid Search
for model_name, param_grid in param_grids.items():
    model = models[model_name]
    grid_search = GridSearchCV(model, param_grid, cv=5, scoring="accuracy", n_jobs=-1)
    grid_search.fit(X_train, y_train)
    best_models[model_name] = grid_search.best_estimator_
    best_params[model_name] = grid_search.best_params_

# Exibindo os melhores parâmetros
best_params


## Passo 2: Treinamento dos modelos otimizados

In [None]:

# Avaliação dos modelos otimizados
optimized_results = {}
for model_name, model in best_models.items():
    # Predizer no conjunto de teste
    y_pred = model.predict(X_test)
    # Avaliar desempenho
    report = classification_report(y_test, y_pred, output_dict=True)
    optimized_results[model_name] = report

# Comparando as métricas de desempenho
optimized_results_df = pd.DataFrame({model: optimized_results[model]['accuracy'] for model in optimized_results}, index=["Accuracy"])
optimized_results_df.T


## Passo 3: Matrizes de confusão para os modelos otimizados

In [None]:

# Plotando matrizes de confusão
for model_name, model in best_models.items():
    y_pred = model.predict(X_test)
    cm = confusion_matrix(y_test, y_pred)
    
    plt.figure(figsize=(5, 4))
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=[1, 2, 3], yticklabels=[1, 2, 3])
    plt.title(f"Matriz de Confusão (Otimizado): {model_name}")
    plt.xlabel("Predito")
    plt.ylabel("Real")
    plt.show()


## Passo 4: Comparação dos modelos otimizados com os modelos iniciais

In [None]:

# Comparando métricas antes e depois da otimização
comparison_df = pd.DataFrame({
    "Initial Accuracy": [results[model]["accuracy"] for model in results],
    "Optimized Accuracy": [optimized_results[model]["accuracy"] for model in optimized_results]
}, index=results.keys())

comparison_df
