## 1. Importa√ß√£o de Bibliotecas e Configura√ß√µes

In [1]:
# Importa√ß√£o das bibliotecas necess√°rias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os
import json
import pickle
import ast
from joblib import load
from sklearn.metrics import (
    classification_report, confusion_matrix, 
    accuracy_score, precision_score, recall_score, 
    f1_score, roc_auc_score, roc_curve
)
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√µes de plotagem
plt.rcParams['figure.figsize'] = [15, 10]
sns.set_style("whitegrid")

print("‚úÖ Bibliotecas importadas com sucesso!")

‚úÖ Bibliotecas importadas com sucesso!


## 2. Fun√ß√µes Auxiliares

In [2]:
# Fun√ß√£o auxiliar para c√°lculo do G-Mean
def gmean_score(y_true, y_pred):
    """Calcula o G-Mean (Geometric Mean) para problemas bin√°rios"""
    tn, fp, fn, tp = confusion_matrix(y_true, y_pred, labels=[0, 1]).ravel()
    sensitivity = tp / (tp + fn) if (tp + fn) > 0 else 0.0
    specificity = tn / (tn + fp) if (tn + fp) > 0 else 0.0
    return np.sqrt(sensitivity * specificity)

def evaluate_model(model, X_train, X_test, y_train, y_test, model_name):
    """Avalia um modelo treinado em conjuntos de treino e teste"""
    print(f"Avaliando {model_name}...")
    
    # Predictions
    y_train_pred = model.predict(X_train)
    y_test_pred = model.predict(X_test)
    
    # M√©tricas de treino
    train_metrics = {
        'accuracy': accuracy_score(y_train, y_train_pred),
        'precision': precision_score(y_train, y_train_pred),
        'recall': recall_score(y_train, y_train_pred),
        'f1': f1_score(y_train, y_train_pred),
        'gmean': gmean_score(y_train, y_train_pred)
    }
    
    # M√©tricas de teste
    test_metrics = {
        'accuracy': accuracy_score(y_test, y_test_pred),
        'precision': precision_score(y_test, y_test_pred),
        'recall': recall_score(y_test, y_test_pred),
        'f1': f1_score(y_test, y_test_pred),
        'gmean': gmean_score(y_test, y_test_pred)
    }
    
    # AUC se o modelo suporta predict_proba
    try:
        y_test_proba = model.predict_proba(X_test)[:, 1]
        test_metrics['auc_roc'] = roc_auc_score(y_test, y_test_proba)
        train_y_proba = model.predict_proba(X_train)[:, 1]
        train_metrics['auc_roc'] = roc_auc_score(y_train, train_y_proba)
    except:
        test_metrics['auc_roc'] = None
        train_metrics['auc_roc'] = None
    
    return train_metrics, test_metrics, y_test_pred

print("‚úÖ Fun√ß√µes auxiliares definidas!")

‚úÖ Fun√ß√µes auxiliares definidas!


## 3. Carregamento dos Dados de Teste

In [4]:
# Carregamento dos dados de teste
print("üì• Carregando dados de teste...")

try:
    # Carregar datasets pr√©-processados
    train_data = pd.read_csv('dataset_sepsis_prepared.csv')
    test_data = pd.read_csv('dataset_sepsis_test_prepared.csv')
    
    print(f"Dataset de treino: {train_data.shape}")
    print(f"Dataset de teste: {test_data.shape}")
    
    # Separar features e target
    X_train = train_data.drop('SepsisLabel', axis=1)
    y_train = train_data['SepsisLabel']
    X_test = test_data.drop('SepsisLabel', axis=1)
    y_test = test_data['SepsisLabel']
    
    # Normaliza√ß√£o dos dados
    scaler = StandardScaler()
    X_train_scaled = scaler.fit_transform(X_train)
    X_test_scaled = scaler.transform(X_test)
    
    print("\nüìä Distribui√ß√£o das classes:")
    print("Treino:", y_train.value_counts().to_dict())
    print("Teste:", y_test.value_counts().to_dict())
    
except FileNotFoundError as e:
    print(f"‚ùå Erro: Arquivo n√£o encontrado - {e}")
    print("Certifique-se de que os arquivos dataset_sepsis_prepared.csv e dataset_sepsis_test_prepared.csv existem.")

üì• Carregando dados de teste...
Dataset de treino: (853006, 19)
Dataset de teste: (215171, 19)
Dataset de treino: (853006, 19)
Dataset de teste: (215171, 19)

üìä Distribui√ß√£o das classes:
Treino: {0.0: 831112, 1.0: 21894}
Teste: {0.0: 209675, 1.0: 5496}

üìä Distribui√ß√£o das classes:
Treino: {0.0: 831112, 1.0: 21894}
Teste: {0.0: 209675, 1.0: 5496}


In [40]:
# Sampling para avalia√ß√£o mais r√°pida
_, X_train_sample, _, y_train_sample = train_test_split(
    X_train_scaled, y_train, 
    test_size=0.5, 
    stratify=y_train,
    random_state=10
)

_, X_test_sample, _, y_test_sample = train_test_split(
    X_test_scaled, y_test, 
    test_size=0.5, 
    stratify=y_test,
    random_state=10
)

print(f"\nüéØ Amostras para avalia√ß√£o:")
print(f"Treino: {X_train_sample.shape[0]:,} amostras")
print(f"Teste: {X_test_sample.shape[0]:,} amostras")


üéØ Amostras para avalia√ß√£o:
Treino: 426,503 amostras
Teste: 107,586 amostras


## Definir LVQ

In [29]:
# ======================================================================
# 4.2 LEARNING VECTOR QUANTIZATION (LVQ) - IMPLEMENTA√á√ÉO E BUSCA
# ======================================================================


# Implementa√ß√£o do LVQ como Estimador compat√≠vel com scikit-learn
from sklearn.base import BaseEstimator, ClassifierMixin

class LVQClassifier(BaseEstimator, ClassifierMixin):
    def __init__(self, prototypes_per_class=1, n_epochs=100, learning_rate=0.01, random_state=None):
        """
        prototypes_per_class : int
            N√∫mero de prot√≥tipos a serem usados para cada classe.
        n_epochs : int
            N√∫mero de √©pocas (itera√ß√µes completas sobre os dados de treinamento).
        learning_rate : float
            Taxa de aprendizado utilizada para atualizar os prot√≥tipos.
        random_state : int ou None
            Semente para reprodutibilidade.
        """
        self.prototypes_per_class = prototypes_per_class
        self.n_epochs = n_epochs
        self.learning_rate = learning_rate
        self.random_state = random_state

    def fit(self, X, y):
        X = np.array(X)
        y = np.array(y)
        if self.random_state is not None:
            np.random.seed(self.random_state)
            
        # Determina as classes √∫nicas
        self.classes_ = np.unique(y)
        n_features = X.shape[1]

        # Inicializa os prot√≥tipos
        prototypes = []
        prototype_labels = []
        for c in self.classes_:
            X_c = X[y == c]
            # Se a quantidade de exemplos dessa classe for menor que o n√∫mero de prot√≥tipos desejados
            replace_flag = X_c.shape[0] < self.prototypes_per_class
            indices = np.random.choice(X_c.shape[0], size=self.prototypes_per_class, replace=replace_flag)
            prototypes.append(X_c[indices])
            prototype_labels.extend([c] * self.prototypes_per_class)
            
        self.prototypes_ = np.vstack(prototypes)
        self.prototype_labels_ = np.array(prototype_labels)

        # Treinamento ‚Äì Algoritmo LVQ
        for epoch in range(self.n_epochs):
            # Embaralha os √≠ndices dos exemplos
            indices = np.random.permutation(X.shape[0])
            for i in indices:
                xi = X[i]
                yi = y[i]
                # Calcula as dist√¢ncias euclidianas do exemplo xi a todos os prot√≥tipos
                distances = np.linalg.norm(self.prototypes_ - xi, axis=1)
                # Encontra o √≠ndice do prot√≥tipo mais pr√≥ximo
                j = np.argmin(distances)
                # Atualiza o prot√≥tipo:
                if self.prototype_labels_[j] == yi:
                    # Se a classe coincide, aproxima o prot√≥tipo do exemplo
                    self.prototypes_[j] += self.learning_rate * (xi - self.prototypes_[j])
                else:
                    # Se as classes forem diferentes, afasta o prot√≥tipo do exemplo
                    self.prototypes_[j] -= self.learning_rate * (xi - self.prototypes_[j])
        return self

    def predict(self, X):
        X = np.array(X)
        y_pred = []
        # Para cada exemplo, calcula a dist√¢ncia para cada prot√≥tipo
        for xi in X:
            distances = np.linalg.norm(self.prototypes_ - xi, axis=1)
            j = np.argmin(distances)
            y_pred.append(self.prototype_labels_[j])
        return np.array(y_pred)

    def score(self, X, y):
        return accuracy_score(y, self.predict(X))

## 4. Recupera√ß√£o dos Resultados dos Modelos Treinados

In [36]:
def load_model_results(results_folder='results'):
    """Carrega todos os resultados de avalia√ß√£o salvos dos notebooks individuais"""
    all_results = {}

    if not os.path.exists(results_folder):
        print(f"‚ùå Pasta {results_folder} n√£o encontrada!")
        print("Execute os notebooks individuais dos modelos primeiro.")
        return all_results

    # Mapear arquivos para modelos
    result_files = {
        'knn_results.json': 'KNN',
        'lvq_results.json': 'LVQ', 
        'svm_results.json': 'SVM',
        'rf_results.json': 'Random Forest',
        'dt_results.json': 'Decision Tree'
    }

    for filename, model_name in result_files.items():
        filepath = os.path.join(results_folder, filename)
        
        if os.path.exists(filepath):
            try:
                with open(filepath, 'r') as f:
                    result_data = json.load(f)
                all_results[model_name] = result_data
                print(f"‚úÖ {model_name}: Carregado com sucesso")
            except Exception as e:
                print(f"‚ùå Erro ao carregar {filename}: {e}")
        else:
            print(f"‚ö†Ô∏è  Arquivo n√£o encontrado: {filename}")

    return all_results

def load_trained_models(models_folder='models'):
    """Carrega os modelos treinados salvos"""
    trained_models = {}
    
    if not os.path.exists(models_folder):
        print(f"‚ùå Pasta {models_folder} n√£o encontrada!")
        return trained_models
    
    model_files = {
        'knn_trained.joblib': 'KNN',
        'lvq_trained.joblib': 'LVQ',
        'svm_trained.joblib': 'SVM', 
        'rf_trained.joblib': 'Random Forest',
        'dt_trained.joblib': 'Decision Tree'
    }
    
    for filename, model_name in model_files.items():
        filepath = os.path.join(models_folder, filename)
        
        if os.path.exists(filepath):
            try:
                model = load(filepath)
                trained_models[model_name] = model
                print(f"‚úÖ Modelo {model_name}: Carregado com sucesso")
            except Exception as e:
                print(f"‚ùå Erro ao carregar modelo {filename}: {e}")
        else:
            print(f"‚ö†Ô∏è  Modelo n√£o encontrado: {filename}")
    
    # Carregar scaler se existir
    scaler_path = os.path.join(models_folder, 'scaler.joblib')
    if os.path.exists(scaler_path):
        try:
            trained_models['scaler'] = load(scaler_path)
            print("‚úÖ Scaler: Carregado com sucesso")
        except Exception as e:
            print(f"‚ùå Erro ao carregar scaler: {e}")
    
    return trained_models

print("üîÑ Carregando resultados dos modelos...")
final_results = load_model_results()

print("\nüîÑ Carregando modelos treinados...")
trained_models = load_trained_models()

print(f"\nüìä Total de resultados carregados: {len(final_results)}")
print(f"üìä Total de modelos carregados: {len([k for k in trained_models.keys() if k != 'scaler'])}")

# Verificar se todos os modelos foram carregados
expected_models = ['KNN', 'LVQ', 'SVM', 'Decision Tree', 'Random Forest']
missing_results = [model for model in expected_models if model not in final_results]
missing_models = [model for model in expected_models if model not in trained_models]

if missing_results:
    print(f"‚ö†Ô∏è Resultados faltando: {missing_results}")
if missing_models:
    print(f"‚ö†Ô∏è Modelos faltando: {missing_models}")
    
if not missing_results and not missing_models:
    print("\n‚úÖ Todos os modelos e resultados foram carregados com sucesso!")
else:
    print("\n‚ö†Ô∏è Execute os notebooks individuais correspondentes primeiro.")
print(trained_models)


üîÑ Carregando resultados dos modelos...
‚ö†Ô∏è  Arquivo n√£o encontrado: knn_results.json
‚ö†Ô∏è  Arquivo n√£o encontrado: lvq_results.json
‚ö†Ô∏è  Arquivo n√£o encontrado: svm_results.json
‚ö†Ô∏è  Arquivo n√£o encontrado: rf_results.json
‚ö†Ô∏è  Arquivo n√£o encontrado: dt_results.json

üîÑ Carregando modelos treinados...
‚ö†Ô∏è  Modelo n√£o encontrado: knn_trained.joblib
‚úÖ Modelo LVQ: Carregado com sucesso
‚úÖ Modelo SVM: Carregado com sucesso
‚ö†Ô∏è  Modelo n√£o encontrado: rf_trained.joblib
‚úÖ Modelo Decision Tree: Carregado com sucesso
‚úÖ Scaler: Carregado com sucesso

üìä Total de resultados carregados: 0
üìä Total de modelos carregados: 3
‚ö†Ô∏è Resultados faltando: ['KNN', 'LVQ', 'SVM', 'Decision Tree', 'Random Forest']
‚ö†Ô∏è Modelos faltando: ['KNN', 'Random Forest']

‚ö†Ô∏è Execute os notebooks individuais correspondentes primeiro.
{'LVQ': LVQClassifier(learning_rate=np.float64(0.2189698132600466), n_epochs=879,
              prototypes_per_class=78), 'SVM': SVC(C=n

In [46]:
lvq = LVQClassifier(learning_rate=np.float64(0.002749027093115263), n_epochs=131,
              prototypes_per_class=5, random_state=42)

_, X_amostra, _, y_amostra = train_test_split(
    X_train_scaled, y_train, 
    test_size=0.1,  
    stratify=y_train,
    random_state=10
)
lvq.fit(X_amostra, y_amostra)  # Treino com dataset completo
trained_models['LVQ'] = lvq

## 5. Avalia√ß√£o Final dos Modelos no Conjunto de Teste

In [48]:
print("=== AVALIA√á√ÉO FINAL DOS MODELOS NO CONJUNTO DE TESTE ===")

# Dicion√°rio para armazenar resultados da avalia√ß√£o atual
current_evaluation = {}

# Avaliar cada modelo carregado
for model_name, model in trained_models.items():
    if model_name == 'scaler':
        continue
        
    print(f"\n--- Avaliando {model_name} ---")
    if model_name == 'Decision Tree': # alterar max_features
        model.max_features = 'sqrt'
    try:
        # Avalia√ß√£o no conjunto de teste amostrado
        train_metrics, test_metrics, y_pred = evaluate_model(
            model, X_train_sample, X_test_sample, y_train_sample, y_test_sample, model_name
        )
        
        # Armazenar resultados
        current_evaluation[model_name] = {
            'train_metrics': train_metrics,
            'test_metrics': test_metrics,
            'predictions': y_pred
        }
        
        # Exibir m√©tricas principais
        print(f"Acur√°cia Treino: {train_metrics['accuracy']:.4f}")
        print(f"F1-Score Treino: {train_metrics['f1']:.4f}")
        print(f"F1-Score Teste: {test_metrics['f1']:.4f}")
        print(f"Recall Teste: {test_metrics['recall']:.4f}")
        print(f"Precis√£o Teste: {test_metrics['precision']:.4f}")
        print(f"G-Mean Teste: {test_metrics['gmean']:.4f}")
        if test_metrics['auc_roc']:
            print(f"AUC-ROC Teste: {test_metrics['auc_roc']:.4f}")
            
    except Exception as e:
        print(f"‚ùå Erro ao avaliar {model_name}: {e}")
        continue

print("\n‚úÖ Avalia√ß√£o de todos os modelos conclu√≠da!")

=== AVALIA√á√ÉO FINAL DOS MODELOS NO CONJUNTO DE TESTE ===

--- Avaliando LVQ ---
Avaliando LVQ...
Acur√°cia Treino: 0.9742
F1-Score Treino: 0.0036
F1-Score Teste: 0.0007
Recall Teste: 0.0004
Precis√£o Teste: 0.5000
G-Mean Teste: 0.0191

--- Avaliando SVM ---
Avaliando SVM...
Acur√°cia Treino: 0.9742
F1-Score Treino: 0.0036
F1-Score Teste: 0.0007
Recall Teste: 0.0004
Precis√£o Teste: 0.5000
G-Mean Teste: 0.0191

--- Avaliando SVM ---
Avaliando SVM...
Acur√°cia Treino: 0.9492
F1-Score Treino: 0.0178
F1-Score Teste: 0.0000
Recall Teste: 0.0000
Precis√£o Teste: 0.0000
G-Mean Teste: 0.0000

--- Avaliando Decision Tree ---
Avaliando Decision Tree...
Acur√°cia Treino: 0.9492
F1-Score Treino: 0.0178
F1-Score Teste: 0.0000
Recall Teste: 0.0000
Precis√£o Teste: 0.0000
G-Mean Teste: 0.0000

--- Avaliando Decision Tree ---
Avaliando Decision Tree...
Acur√°cia Treino: 0.9843
F1-Score Treino: 0.6400
F1-Score Teste: 0.1907
Recall Teste: 0.1878
Precis√£o Teste: 0.1937
G-Mean Teste: 0.4289
AUC-ROC Tes

## 6. Consolida√ß√£o de Resultados

In [None]:
# Combinar resultados carregados com avalia√ß√£o atual
print("=== CONSOLIDANDO RESULTADOS ===")

consolidated_results = {}

for model_name in expected_models:
    consolidated_results[model_name] = {
        'cv_score': final_results.get(model_name, {}).get('cv_score', 0.0),
        'best_params': final_results.get(model_name, {}).get('best_params', {}),
        'train_metrics': current_evaluation.get(model_name, {}).get('train_metrics', {}),
        'test_metrics': current_evaluation.get(model_name, {}).get('test_metrics', {}),
        'predictions': current_evaluation.get(model_name, {}).get('predictions', [])
    }

# Criar DataFrame com m√©tricas para compara√ß√£o
metrics_data = []
for model_name, results in consolidated_results.items():
    if not results['test_metrics']:  # Pular se n√£o h√° m√©tricas de teste
        continue
        
    train_metrics = results.get('train_metrics', {})
    test_metrics = results.get('test_metrics', {})
    
    metrics_data.append({
        'Modelo': model_name,
        'F1_CV': results.get('cv_score', 0.0),
        'F1_Treino': train_metrics.get('f1', 0.0),
        'F1_Teste': test_metrics.get('f1', 0.0),
        'Precis√£o_Teste': test_metrics.get('precision', 0.0),
        'Recall_Teste': test_metrics.get('recall', 0.0),
        'G-Mean_Teste': test_metrics.get('gmean', 0.0),
        'AUC_ROC_Teste': test_metrics.get('auc_roc', 0.0) if test_metrics.get('auc_roc') else 0.0
    })

metrics_df = pd.DataFrame(metrics_data)

print("=== RESUMO COMPARATIVO DOS MODELOS ===")
print(metrics_df.round(4))

# Salvar resultados consolidados
metrics_df.to_csv('main_evaluation_results.csv', index=False)
print("\nüíæ Resultados salvos em 'main_evaluation_results.csv'")

## 7. Visualiza√ß√µes Comparativas

In [None]:
# Gr√°ficos de compara√ß√£o
fig, axes = plt.subplots(2, 2, figsize=(20, 15))

# Gr√°fico 1: Compara√ß√£o de F1-Score
ax1 = axes[0, 0]
x_pos = np.arange(len(metrics_df))
ax1.bar(x_pos - 0.2, metrics_df['F1_CV'], 0.4, label='F1-Score CV', alpha=0.8, color='skyblue')
ax1.bar(x_pos + 0.2, metrics_df['F1_Teste'], 0.4, label='F1-Score Teste', alpha=0.8, color='orange')
ax1.set_xlabel('Modelos')
ax1.set_ylabel('F1-Score')
ax1.set_title('Compara√ß√£o F1-Score: CV vs Teste')
ax1.set_xticks(x_pos)
ax1.set_xticklabels(metrics_df['Modelo'], rotation=45)
ax1.legend()
ax1.grid(True, alpha=0.3)

# Gr√°fico 2: Compara√ß√£o de m√∫ltiplas m√©tricas
ax2 = axes[0, 1]
metrics_to_plot = ['F1_Teste', 'Precis√£o_Teste', 'Recall_Teste', 'G-Mean_Teste']
x = np.arange(len(metrics_df))
width = 0.2

for i, metric in enumerate(metrics_to_plot):
    ax2.bar(x + i*width, metrics_df[metric], width, label=metric.replace('_', ' '), alpha=0.8)

ax2.set_xlabel('Modelos')
ax2.set_ylabel('Score')
ax2.set_title('Compara√ß√£o de M√∫ltiplas M√©tricas')
ax2.set_xticks(x + width * 1.5)
ax2.set_xticklabels(metrics_df['Modelo'], rotation=45)
ax2.legend()
ax2.grid(True, alpha=0.3)

# Gr√°fico 3: An√°lise de Overfitting
ax3 = axes[1, 0]
ax3.plot(metrics_df['Modelo'], metrics_df['F1_Treino'], 'ro-', label='F1-Score Treino', alpha=0.7)
ax3.plot(metrics_df['Modelo'], metrics_df['F1_Teste'], 'bo-', label='F1-Score Teste', alpha=0.7)
ax3.set_xlabel('Modelos')
ax3.set_title('An√°lise de Overfitting: F1-Score Treino vs Teste')
ax3.set_ylabel('F1-Score')
ax3.legend()
ax3.grid(True, alpha=0.3)
ax3.tick_params(axis='x', rotation=45)

# Gr√°fico 4: AUC-ROC Comparison (para modelos que suportam)
ax4 = axes[1, 1]
auc_data = metrics_df[metrics_df['AUC_ROC_Teste'] > 0]
if not auc_data.empty:
    ax4.bar(auc_data['Modelo'], auc_data['AUC_ROC_Teste'], alpha=0.8, color='purple')
    ax4.set_xlabel('Modelos')
    ax4.set_ylabel('AUC-ROC')
    ax4.set_title('Compara√ß√£o AUC-ROC')
    ax4.tick_params(axis='x', rotation=45)
    ax4.grid(True, alpha=0.3)
else:
    ax4.text(0.5, 0.5, 'Nenhum modelo\ncom AUC-ROC dispon√≠vel', 
             ha='center', va='center', transform=ax4.transAxes, fontsize=12)
    ax4.set_title('AUC-ROC n√£o dispon√≠vel')

plt.tight_layout()
plt.savefig('main_evaluation_comparison.png', dpi=300, bbox_inches='tight')
plt.show()

print("üìä Gr√°ficos de compara√ß√£o gerados!")

## 8. Matrizes de Confus√£o

In [None]:
# Plotar matrizes de confus√£o para todos os modelos
n_models = len([m for m in consolidated_results.keys() if consolidated_results[m]['test_metrics']])
if n_models > 0:
    cols = min(3, n_models)
    rows = (n_models + cols - 1) // cols
    
    fig, axes = plt.subplots(rows, cols, figsize=(5*cols, 4*rows))
    if n_models == 1:
        axes = [axes]
    elif rows == 1:
        axes = axes.reshape(1, -1)
    
    plot_idx = 0
    for model_name, results in consolidated_results.items():
        if not results['test_metrics']:
            continue
            
        row = plot_idx // cols
        col = plot_idx % cols
        ax = axes[row, col] if rows > 1 else axes[col]
        
        # Calcular matriz de confus√£o
        y_pred = results['predictions']
        cm = confusion_matrix(y_test_sample, y_pred)
        
        # Plotar matriz de confus√£o
        sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', ax=ax)
        ax.set_title(f'Matriz de Confus√£o - {model_name}')
        ax.set_xlabel('Predito')
        ax.set_ylabel('Real')
        
        plot_idx += 1
    
    # Remover subplots extras
    for i in range(plot_idx, rows * cols):
        row = i // cols
        col = i % cols
        ax = axes[row, col] if rows > 1 else axes[col]
        ax.remove()
    
    plt.tight_layout()
    plt.savefig('confusion_matrices.png', dpi=300, bbox_inches='tight')
    plt.show()
    
    print("üìä Matrizes de confus√£o geradas!")
else:
    print("‚ö†Ô∏è Nenhum modelo com resultados para plotar matrizes de confus√£o.")

## 9. Curvas ROC

In [None]:
# Plotar curvas ROC para modelos que suportam predict_proba
plt.figure(figsize=(12, 8))

models_with_roc = []
for model_name, model in trained_models.items():
    if model_name == 'scaler':
        continue
        
    try:
        if hasattr(model, 'predict_proba'):
            y_proba = model.predict_proba(X_test_sample)[:, 1]
            fpr, tpr, _ = roc_curve(y_test_sample, y_proba)
            auc = roc_auc_score(y_test_sample, y_proba)
            
            plt.plot(fpr, tpr, label=f'{model_name} (AUC = {auc:.3f})', linewidth=2)
            models_with_roc.append(model_name)
    except Exception as e:
        print(f"‚ö†Ô∏è N√£o foi poss√≠vel plotar ROC para {model_name}: {e}")

if models_with_roc:
    plt.plot([0, 1], [0, 1], 'k--', label='Linha Aleat√≥ria', alpha=0.5)
    plt.xlim([0.0, 1.0])
    plt.ylim([0.0, 1.05])
    plt.xlabel('Taxa de Falsos Positivos')
    plt.ylabel('Taxa de Verdadeiros Positivos')
    plt.title('Curvas ROC - Compara√ß√£o dos Modelos')
    plt.legend(loc="lower right")
    plt.grid(True, alpha=0.3)
    plt.savefig('roc_curves.png', dpi=300, bbox_inches='tight')
    plt.show()
    
    print(f"üìä Curvas ROC geradas para {len(models_with_roc)} modelos!")
else:
    print("‚ö†Ô∏è Nenhum modelo suporta predict_proba para curvas ROC.")

## 10. An√°lise de Overfitting e Underfitting

In [None]:
print("=== AN√ÅLISE DE OVERFITTING VS UNDERFITTING ===")

overfitting_analysis = []

for model_name, results in consolidated_results.items():
    if not results['test_metrics'] or not results['train_metrics']:
        continue
        
    f1_train = results['train_metrics'].get('f1', 0.0)
    f1_test = results['test_metrics'].get('f1', 0.0)
    difference = f1_train - f1_test
    
    if difference > 0.1:
        status = "üî¥ POSS√çVEL OVERFITTING"
    elif difference < -0.05:
        status = "üîµ POSS√çVEL UNDERFITTING"  
    else:
        status = "‚úÖ BOM EQUIL√çBRIO"
    
    overfitting_analysis.append({
        'Modelo': model_name,
        'F1_Treino': f1_train,
        'F1_Teste': f1_test,
        'Diferen√ßa': difference,
        'Status': status
    })
    
    print(f"{model_name:15} | Treino: {f1_train:.4f} | Teste: {f1_test:.4f} | Diff: {difference:+.4f} | {status}")

overfitting_df = pd.DataFrame(overfitting_analysis)
overfitting_df.to_csv('overfitting_analysis.csv', index=False)
print("\nüíæ An√°lise de overfitting salva em 'overfitting_analysis.csv'")

## 11. Identifica√ß√£o do Melhor Modelo

In [None]:
print("=== IDENTIFICA√á√ÉO DO MELHOR MODELO ===")

if not metrics_df.empty:
    # Encontrar o melhor modelo baseado no F1-Score de teste
    best_model_idx = metrics_df['F1_Teste'].idxmax()
    best_model_name = metrics_df.loc[best_model_idx, 'Modelo']
    best_model_f1 = metrics_df.loc[best_model_idx, 'F1_Teste']
    
    print(f"\nüèÜ MELHOR MODELO: {best_model_name}")
    print(f"F1-Score no teste: {best_model_f1:.4f}")
    
    # Detalhes do melhor modelo
    best_model_results = consolidated_results[best_model_name]
    print(f"\nüìä DETALHES DO MELHOR MODELO ({best_model_name}):")
    print(f"F1-Score CV: {best_model_results.get('cv_score', 0.0):.4f}")
    print(f"Acur√°cia Teste: {best_model_results['test_metrics'].get('accuracy', 0.0):.4f}")
    print(f"Precis√£o Teste: {best_model_results['test_metrics'].get('precision', 0.0):.4f}")
    print(f"Recall Teste: {best_model_results['test_metrics'].get('recall', 0.0):.4f}")
    print(f"G-Mean Teste: {best_model_results['test_metrics'].get('gmean', 0.0):.4f}")
    
    if best_model_results['test_metrics'].get('auc_roc'):
        print(f"AUC-ROC Teste: {best_model_results['test_metrics']['auc_roc']:.4f}")
    
    # Melhores hiperpar√¢metros
    best_params = best_model_results.get('best_params', {})
    if best_params:
        print(f"\nüéØ MELHORES HIPERPAR√ÇMETROS:")
        for param, value in best_params.items():
            if isinstance(value, float):
                print(f"  {param}: {value:.4f}")
            else:
                print(f"  {param}: {value}")
    
    # An√°lise qualitativa do desempenho
    performance_quality = "boa" if best_model_f1 > 0.7 else "moderada" if best_model_f1 > 0.3 else "baixa"
    print(f"\nüìà AVALIA√á√ÉO: F1-Score de {best_model_f1:.4f} indica {performance_quality} capacidade de predi√ß√£o")
    
else:
    print("‚ö†Ô∏è N√£o h√° dados suficientes para identificar o melhor modelo.")

## 12. Resumo Final e Conclus√µes

In [None]:
print("=== RESUMO FINAL DAS M√âTRICAS ===")

if not metrics_df.empty:
    print(f"{'Modelo':<15} {'F1':<8} {'Acur√°cia':<10} {'Precis√£o':<10} {'Recall':<8} {'G-Mean':<8}")
    print("-" * 70)
    
    for _, row in metrics_df.iterrows():
        print(f"{row['Modelo']:<15} "
              f"{row['F1_Teste']:<8.4f} "
              f"{row.get('Acur√°cia_Teste', 0.0):<10.4f} "
              f"{row['Precis√£o_Teste']:<10.4f} "
              f"{row['Recall_Teste']:<8.4f} "
              f"{row['G-Mean_Teste']:<8.4f}")

print("\n=== CONCLUS√ïES FINAIS ===")
if not metrics_df.empty:
    best_model_name = metrics_df.loc[metrics_df['F1_Teste'].idxmax(), 'Modelo']
    best_model_f1 = metrics_df['F1_Teste'].max()
    
    print(f"‚Ä¢ O modelo {best_model_name} apresentou o melhor desempenho em dados n√£o vistos")
    print(f"‚Ä¢ F1-Score de {best_model_f1:.4f} indica {'boa' if best_model_f1 > 0.7 else 'moderada' if best_model_f1 > 0.3 else 'baixa'} capacidade de predi√ß√£o")
    print("‚Ä¢ A busca de hiperpar√¢metros com RandomizedSearchCV e valida√ß√£o cruzada estratificada")
    print("  garantiu sele√ß√£o robusta dos melhores par√¢metros")
    print("‚Ä¢ M√©tricas como G-Mean s√£o importantes para datasets desbalanceados como este")
    print(f"‚Ä¢ Total de {len(metrics_df)} modelos foram comparados nesta an√°lise")
else:
    print("‚Ä¢ N√£o foi poss√≠vel realizar compara√ß√£o completa dos modelos")
    print("‚Ä¢ Execute os notebooks individuais dos modelos primeiro")

print("\nüìÑ ARQUIVOS GERADOS:")
print("‚Ä¢ main_evaluation_results.csv - Resultados comparativos")
print("‚Ä¢ overfitting_analysis.csv - An√°lise de overfitting")
print("‚Ä¢ main_evaluation_comparison.png - Gr√°ficos comparativos")
print("‚Ä¢ confusion_matrices.png - Matrizes de confus√£o")
print("‚Ä¢ roc_curves.png - Curvas ROC (se dispon√≠vel)")

print("\n‚úÖ AN√ÅLISE PRINCIPAL CONCLU√çDA!")
print(f"üìä Total de modelos analisados: {len(consolidated_results)}")