In [2]:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split, StratifiedKFold
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import (
    classification_report, confusion_matrix,
    f1_score, accuracy_score, precision_score, recall_score,
    roc_auc_score, roc_curve
)
from imblearn.over_sampling import SMOTE, ADASYN
from imblearn.under_sampling import RandomUnderSampler
from imblearn.combine import SMOTETomek
import warnings
warnings.filterwarnings('ignore')


class AvaliacaoCompleta:
    """Classe para avalia√ß√£o completa do modelo com an√°lise de desbalanceamento"""

    def __init__(self, filepath, target_column=None, features_selecionadas=None):
        """
        Inicializa a avalia√ß√£o

        Args:
            filepath: Caminho para o arquivo de dados
            target_column: Nome da coluna target
            features_selecionadas: Lista de features selecionadas
        """
        print("=" * 100)
        print(" " * 30 + "AVALIA√á√ÉO COMPLETA DO MODELO")
        print("=" * 100 + "\n")

        # Carregar dados
        if filepath.endswith('.csv'):
            self.df = pd.read_csv(filepath)
        else:
            self.df = pd.read_excel(filepath)

        # Definir target
        if target_column is None:
            target_column = self.df.columns[-1]

        self.target_column = target_column

        # Selecionar features
        if features_selecionadas is None:
            self.X = self.df.drop(columns=[target_column])
        else:
            self.X = self.df[features_selecionadas]

        self.y = self.df[target_column]

        print(f"Dataset carregado: {self.df.shape[0]} exemplos, {self.X.shape[1]} features")
        print(f"Target: {target_column}")

        # Analisar desbalanceamento
        self._analisar_desbalanceamento()

    def _analisar_desbalanceamento(self):
        """Analisa o desbalanceamento das classes"""
        print("\n" + "=" * 100)
        print("AN√ÅLISE DE DESBALANCEAMENTO")
        print("=" * 100)

        contagem = self.y.value_counts().sort_index()
        proporcoes = self.y.value_counts(normalize=True).sort_index() * 100

        print("\nDistribui√ß√£o Original das Classes:\n")
        print("‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
        print("‚îÇ   Classe    ‚îÇ  Exemplos  ‚îÇ Propor√ß√£o % ‚îÇ")
        print("‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§")
        for classe in contagem.index:
            count = contagem[classe]
            prop = proporcoes[classe]
            print(f"‚îÇ   Classe {classe}  ‚îÇ   {count:5d}    ‚îÇ    {prop:5.2f}%   ‚îÇ")
        print("‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")

        # Calcular raz√£o
        razao = contagem.max() / contagem.min()
        self.razao_desbalanceamento = razao

        print(f"\nRaz√£o de Desbalanceamento: {razao:.2f}:1")

        if razao > 2:
            nivel = "SEVERO"
        elif razao > 1.5:
            nivel = "MODERADO"
        else:
            nivel = "BAIXO"


        print(f"N√≠vel de Desbalanceamento: {nivel}")

        if razao > 1.5:
            print("\n IMPACTO ESPERADO DO DESBALANCEAMENTO:")
            print("   ‚Ä¢ Modelo pode ter vi√©s para a classe majorit√°ria")
            print("   ‚Ä¢ M√©tricas como Acur√°cia podem ser enganosas")
            print("   ‚Ä¢ Classe minorit√°ria pode ter baixo Recall")
            print("   ‚Ä¢ T√©cnicas de balanceamento s√£o NECESS√ÅRIAS")

    def comparar_tecnicas_balanceamento(self, modelo_nome='Random Forest',
                                       features_selecionadas=None, cv_folds=5):
        """
        Compara o desempenho do modelo SEM e COM diferentes t√©cnicas de balanceamento

        Args:
            modelo_nome: Nome do modelo a usar
            features_selecionadas: Lista de features
            cv_folds: N√∫mero de folds
        """
        print("\n" + "=" * 100)
        print("COMPARA√á√ÉO: SEM vs COM BALANCEAMENTO")
        print("=" * 100)

        # Preparar dados
        if features_selecionadas is None:
            X = self.X
        else:
            X = self.X[features_selecionadas]

        # Split
        X_train, X_test, y_train, y_test = train_test_split(
            X, self.y, test_size=0.2, random_state=42, stratify=self.y
        )

        # Padronizar
        scaler = StandardScaler()
        X_train_scaled = scaler.fit_transform(X_train)
        X_test_scaled = scaler.transform(X_test)

        # Selecionar modelo
        if modelo_nome == 'Random Forest':
            modelo_base = RandomForestClassifier(n_estimators=200, random_state=42, n_jobs=-1)
        elif modelo_nome == 'Gradient Boosting':
            modelo_base = GradientBoostingClassifier(n_estimators=200, random_state=42)
        else:
            modelo_base = LogisticRegression(max_iter=1000, random_state=42)

        resultados = {}

        # 1. SEM BALANCEAMENTO (BASELINE)
        print("\nTestando SEM balanceamento (Baseline)...")
        modelo = modelo_base.__class__(**modelo_base.get_params())
        modelo.fit(X_train_scaled, y_train)
        y_pred = modelo.predict(X_test_scaled)

        resultados['SEM Balanceamento'] = self._calcular_metricas(y_test, y_pred, "Baseline")

        # 2. COM SMOTE
        print("\nTestando COM SMOTE...")
        smote = SMOTE(random_state=42)
        X_smote, y_smote = smote.fit_resample(X_train_scaled, y_train)

        modelo = modelo_base.__class__(**modelo_base.get_params())
        modelo.fit(X_smote, y_smote)
        y_pred = modelo.predict(X_test_scaled)

        resultados['SMOTE'] = self._calcular_metricas(y_test, y_pred, "SMOTE")

        # 3. COM ADASYN
        print("\nTestando COM ADASYN...")
        try:
            adasyn = ADASYN(random_state=42)
            X_adasyn, y_adasyn = adasyn.fit_resample(X_train_scaled, y_train)

            modelo = modelo_base.__class__(**modelo_base.get_params())
            modelo.fit(X_adasyn, y_adasyn)
            y_pred = modelo.predict(X_test_scaled)

            resultados['ADASYN'] = self._calcular_metricas(y_test, y_pred, "ADASYN")
        except:
            print("ADASYN falhou (poss√≠vel falta de vizinhos)")
            resultados['ADASYN'] = None

        # 4. COM SMOTE + Tomek
        print("\nTestando COM SMOTE + Tomek Links...")
        smotetomek = SMOTETomek(random_state=42)
        X_st, y_st = smotetomek.fit_resample(X_train_scaled, y_train)

        modelo = modelo_base.__class__(**modelo_base.get_params())
        modelo.fit(X_st, y_st)
        y_pred = modelo.predict(X_test_scaled)

        resultados['SMOTE+Tomek'] = self._calcular_metricas(y_test, y_pred, "SMOTE+Tomek")

        # 5. COM Under-sampling
        print("\nTestando COM Under-Sampling...")
        under = RandomUnderSampler(random_state=42)
        X_under, y_under = under.fit_resample(X_train_scaled, y_train)

        modelo = modelo_base.__class__(**modelo_base.get_params())
        modelo.fit(X_under, y_under)
        y_pred = modelo.predict(X_test_scaled)

        resultados['Under-Sampling'] = self._calcular_metricas(y_test, y_pred, "Under-Sampling")

        self.resultados_comparacao = resultados
        self.X_test = X_test_scaled
        self.y_test = y_test

        return resultados

    def _calcular_metricas(self, y_true, y_pred, nome_tecnica):
        """Calcula todas as m√©tricas necess√°rias"""

        metricas = {
            'Acur√°cia': accuracy_score(y_true, y_pred),
            'Macro F1-Score': f1_score(y_true, y_pred, average='macro'),
            'Weighted F1-Score': f1_score(y_true, y_pred, average='weighted'),
            'Macro Precision': precision_score(y_true, y_pred, average='macro', zero_division=0),
            'Macro Recall': recall_score(y_true, y_pred, average='macro'),
            'Confusion Matrix': confusion_matrix(y_true, y_pred)
        }

        # M√©tricas por classe
        report = classification_report(y_true, y_pred, output_dict=True)
        metricas['Report'] = report

        print(f"   ‚úì {nome_tecnica} - Macro F1: {metricas['Macro F1-Score']:.4f}, Acur√°cia: {metricas['Acur√°cia']:.4f}")

        return metricas

    def gerar_tabela_comparativa(self):
        """Gera tabela comparativa das t√©cnicas"""
        print("\n" + "=" * 100)
        print("TABELA COMPARATIVA DE T√âCNICAS")
        print("=" * 100 + "\n")

        # Criar DataFrame
        data = []
        for tecnica, metricas in self.resultados_comparacao.items():
            if metricas is not None:
                data.append({
                    'T√©cnica': tecnica,
                    'Acur√°cia': metricas['Acur√°cia'],
                    'Macro F1-Score': metricas['Macro F1-Score'],
                    'Weighted F1-Score': metricas['Weighted F1-Score'],
                    'Macro Precision': metricas['Macro Precision'],
                    'Macro Recall': metricas['Macro Recall']
                })

        df_comp = pd.DataFrame(data)
        df_comp = df_comp.round(4)

        print(df_comp.to_string(index=False))

        # Identificar melhor t√©cnica
        melhor_idx = df_comp['Macro F1-Score'].idxmax()
        melhor_tecnica = df_comp.iloc[melhor_idx]['T√©cnica']
        melhor_f1 = df_comp.iloc[melhor_idx]['Macro F1-Score']

        baseline_f1 = df_comp[df_comp['T√©cnica'] == 'SEM Balanceamento']['Macro F1-Score'].values[0]
        melhoria = ((melhor_f1 - baseline_f1) / baseline_f1) * 100

        print("\n" + "‚îÄ" * 100)
        print(f"MELHOR T√âCNICA: {melhor_tecnica}")
        print(f"   Macro F1-Score: {melhor_f1:.4f}")
        print(f"   Melhoria sobre Baseline: +{melhoria:.2f}%")
        print("‚îÄ" * 100)

        self.df_comparacao = df_comp
        self.melhor_tecnica = melhor_tecnica

        return df_comp

    def visualizar_comparacao(self, output_file='comparacao_tecnicas.png'):
        """Cria visualiza√ß√µes comparativas"""
        print(f"\n Gerando visualiza√ß√µes...")

        fig, axes = plt.subplots(2, 3, figsize=(20, 12))
        fig.suptitle('Compara√ß√£o de T√©cnicas de Balanceamento',
                     fontsize=18, fontweight='bold', y=0.995)

        # 1. Acur√°cia
        ax = axes[0, 0]
        self.df_comparacao.plot(x='T√©cnica', y='Acur√°cia', kind='bar',
                                ax=ax, color='steelblue', legend=False)
        ax.set_title('Acur√°cia', fontsize=14, fontweight='bold')
        ax.set_ylabel('Score', fontsize=12)
        ax.set_xlabel('')
        ax.set_ylim([0.85, 1.0])
        ax.grid(axis='y', alpha=0.3)
        ax.tick_params(axis='x', rotation=45)

        # Destacar melhor
        melhor_idx = self.df_comparacao['Acur√°cia'].idxmax()
        ax.patches[melhor_idx].set_color('gold')
        ax.patches[melhor_idx].set_edgecolor('black')
        ax.patches[melhor_idx].set_linewidth(3)

        # 2. Macro F1-Score
        ax = axes[0, 1]
        self.df_comparacao.plot(x='T√©cnica', y='Macro F1-Score', kind='bar',
                                ax=ax, color='coral', legend=False)
        ax.set_title('Macro F1-Score (M√©trica Principal)', fontsize=14, fontweight='bold')
        ax.set_ylabel('Score', fontsize=12)
        ax.set_xlabel('')
        ax.set_ylim([0.85, 1.0])
        ax.grid(axis='y', alpha=0.3)
        ax.tick_params(axis='x', rotation=45)

        # Destacar melhor
        melhor_idx = self.df_comparacao['Macro F1-Score'].idxmax()
        ax.patches[melhor_idx].set_color('gold')
        ax.patches[melhor_idx].set_edgecolor('black')
        ax.patches[melhor_idx].set_linewidth(3)

        # 3. Weighted F1-Score
        ax = axes[0, 2]
        self.df_comparacao.plot(x='T√©cnica', y='Weighted F1-Score', kind='bar',
                                ax=ax, color='mediumseagreen', legend=False)
        ax.set_title('Weighted F1-Score', fontsize=14, fontweight='bold')
        ax.set_ylabel('Score', fontsize=12)
        ax.set_xlabel('')
        ax.set_ylim([0.85, 1.0])
        ax.grid(axis='y', alpha=0.3)
        ax.tick_params(axis='x', rotation=45)

        # 4. Macro Precision
        ax = axes[1, 0]
        self.df_comparacao.plot(x='T√©cnica', y='Macro Precision', kind='bar',
                                ax=ax, color='plum', legend=False)
        ax.set_title('Macro Precision', fontsize=14, fontweight='bold')
        ax.set_ylabel('Score', fontsize=12)
        ax.set_xlabel('')
        ax.set_ylim([0.85, 1.0])
        ax.grid(axis='y', alpha=0.3)
        ax.tick_params(axis='x', rotation=45)

        # 5. Macro Recall
        ax = axes[1, 1]
        self.df_comparacao.plot(x='T√©cnica', y='Macro Recall', kind='bar',
                                ax=ax, color='lightsalmon', legend=False)
        ax.set_title('Macro Recall', fontsize=14, fontweight='bold')
        ax.set_ylabel('Score', fontsize=12)
        ax.set_xlabel('')
        ax.set_ylim([0.85, 1.0])
        ax.grid(axis='y', alpha=0.3)
        ax.tick_params(axis='x', rotation=45)

        # 6. Compara√ß√£o lado a lado
        ax = axes[1, 2]
        metricas_principais = self.df_comparacao[['T√©cnica', 'Acur√°cia', 'Macro F1-Score',
                                                   'Macro Precision', 'Macro Recall']].set_index('T√©cnica')
        metricas_principais.plot(kind='bar', ax=ax, width=0.8)
        ax.set_title('Todas as M√©tricas', fontsize=14, fontweight='bold')
        ax.set_ylabel('Score', fontsize=12)
        ax.set_xlabel('')
        ax.set_ylim([0.85, 1.0])
        ax.legend(loc='lower right', fontsize=9)
        ax.grid(axis='y', alpha=0.3)
        ax.tick_params(axis='x', rotation=45)

        plt.tight_layout()
        plt.savefig(output_file, dpi=300, bbox_inches='tight')
        print(f"   ‚úì Gr√°ficos salvos em: {output_file}")
        plt.close()

    def visualizar_matrizes_confusao(self, output_file='matrizes_confusao.png'):
        """Cria visualiza√ß√£o das matrizes de confus√£o"""
        print(f"\nGerando matrizes de confus√£o...")

        # Filtrar t√©cnicas v√°lidas
        tecnicas_validas = {k: v for k, v in self.resultados_comparacao.items() if v is not None}
        n_tecnicas = len(tecnicas_validas)

        # Criar subplots
        fig, axes = plt.subplots(2, 3, figsize=(18, 12))
        fig.suptitle('Matrizes de Confus√£o - Compara√ß√£o de T√©cnicas',
                     fontsize=16, fontweight='bold')
        axes = axes.flatten()

        for idx, (tecnica, metricas) in enumerate(tecnicas_validas.items()):
            cm = metricas['Confusion Matrix']

            # Calcular percentuais
            cm_percentual = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis] * 100

            # Plotar
            sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', ax=axes[idx],
                       cbar=False, square=True, linewidths=2, linecolor='white',
                       annot_kws={'size': 14, 'weight': 'bold'})

            # Adicionar percentuais
            for i in range(cm.shape[0]):
                for j in range(cm.shape[1]):
                    axes[idx].text(j + 0.5, i + 0.7, f'({cm_percentual[i, j]:.1f}%)',
                                 ha='center', va='center', fontsize=10, color='gray')

            axes[idx].set_title(f'{tecnica}\nF1-Macro: {metricas["Macro F1-Score"]:.4f}',
                              fontsize=12, fontweight='bold')
            axes[idx].set_ylabel('Classe Real', fontsize=11)
            axes[idx].set_xlabel('Classe Predita', fontsize=11)

            # Destacar melhor t√©cnica
            if tecnica == self.melhor_tecnica:
                for spine in axes[idx].spines.values():
                    spine.set_edgecolor('gold')
                    spine.set_linewidth(4)

        # Remover subplots n√£o utilizados
        for idx in range(n_tecnicas, len(axes)):
            fig.delaxes(axes[idx])

        plt.tight_layout()
        plt.savefig(output_file, dpi=300, bbox_inches='tight')
        print(f"   ‚úì Matrizes de confus√£o salvas em: {output_file}")
        plt.close()

    def analisar_metricas_por_classe(self):
        """Analisa m√©tricas detalhadas por classe"""
        print("\n" + "=" * 100)
        print("AN√ÅLISE DETALHADA POR CLASSE")
        print("=" * 100)

        # Comparar baseline vs melhor t√©cnica
        baseline = self.resultados_comparacao['SEM Balanceamento']
        melhor = self.resultados_comparacao[self.melhor_tecnica]

        print(f"\nCompara√ß√£o: BASELINE vs {self.melhor_tecnica}\n")

        # Criar tabela
        classes = sorted(baseline['Report'].keys())
        classes = [c for c in classes if c not in ['accuracy', 'macro avg', 'weighted avg']]

        print("‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
        print(f"‚îÇ Classe  ‚îÇ      SEM Balanceamento       ‚îÇ       {self.melhor_tecnica:^20s}       ‚îÇ")
        print("‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§")
        print("‚îÇ         ‚îÇ  Prec   Recall   F1-Score    ‚îÇ  Prec   Recall   F1-Score    ‚îÇ")
        print("‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§")

        for classe in classes:
            base_metrics = baseline['Report'][str(classe)]
            melhor_metrics = melhor['Report'][str(classe)]

            print(f"‚îÇ Classe {classe} ‚îÇ  {base_metrics['precision']:.3f}   {base_metrics['recall']:.3f}    {base_metrics['f1-score']:.3f}     ‚îÇ" +
                  f"  {melhor_metrics['precision']:.3f}   {melhor_metrics['recall']:.3f}    {melhor_metrics['f1-score']:.3f}     ‚îÇ")

        print("‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")

        # An√°lise de melhorias
        print("\nMELHORIAS POR CLASSE:\n")
        for classe in classes:
            base_f1 = baseline['Report'][str(classe)]['f1-score']
            melhor_f1 = melhor['Report'][str(classe)]['f1-score']
            melhoria = ((melhor_f1 - base_f1) / base_f1) * 100

            seta = "^" if melhoria > 0 else "" if melhoria < 0 else ">"
            print(f"   Classe {classe}: {seta} {melhoria:+.2f}% (de {base_f1:.4f} para {melhor_f1:.4f})")

    def gerar_relatorio_final(self, output_file='RELATORIO_AVALIACAO.txt'):
        """Gera relat√≥rio final completo"""
        print(f"\nGerando relat√≥rio final...")

        with open(output_file, 'w', encoding='utf-8') as f:
            f.write("=" * 100 + "\n")
            f.write(" " * 25 + "RELAT√ìRIO DE AVALIA√á√ÉO DO MODELO\n")
            f.write(" " * 20 + "An√°lise do Impacto do Desbalanceamento\n")
            f.write("=" * 100 + "\n\n")

            # 1. INFORMA√á√ïES DO DATASET
            f.write("1. INFORMA√á√ïES DO DATASET\n")
            f.write("-" * 100 + "\n\n")
            f.write(f"Total de Exemplos: {len(self.df)}\n")
            f.write(f"N√∫mero de Features: {self.X.shape[1]}\n")
            f.write(f"Target: {self.target_column}\n\n")

            # Distribui√ß√£o
            contagem = self.y.value_counts().sort_index()
            proporcoes = self.y.value_counts(normalize=True).sort_index() * 100

            f.write("Distribui√ß√£o de Classes:\n")
            for classe in contagem.index:
                f.write(f"  Classe {classe}: {contagem[classe]:5d} exemplos ({proporcoes[classe]:5.2f}%)\n")

            f.write(f"\nRaz√£o de Desbalanceamento: {self.razao_desbalanceamento:.2f}:1\n")

            # 2. IMPACTO DO DESBALANCEAMENTO
            f.write("\n\n2. IMPACTO DO DESBALANCEAMENTO\n")
            f.write("-" * 100 + "\n\n")

            baseline = self.resultados_comparacao['SEM Balanceamento']

            f.write("MODELO SEM BALANCEAMENTO (Baseline):\n\n")
            f.write(f"  ‚Ä¢ Acur√°cia:        {baseline['Acur√°cia']:.4f}\n")
            f.write(f"  ‚Ä¢ Macro F1-Score:  {baseline['Macro F1-Score']:.4f}\n")
            f.write(f"  ‚Ä¢ Macro Precision: {baseline['Macro Precision']:.4f}\n")
            f.write(f"  ‚Ä¢ Macro Recall:    {baseline['Macro Recall']:.4f}\n\n")

            f.write("PROBLEMAS IDENTIFICADOS:\n\n")

            # Analisar problemas
            report = baseline['Report']
            classes = [c for c in report.keys() if c not in ['accuracy', 'macro avg', 'weighted avg']]

            # Identificar classe minorit√°ria
            contagem = self.y.value_counts()
            classe_minoritaria = str(contagem.idxmin())
            classe_majoritaria = str(contagem.idxmax())

            recall_min = report[classe_minoritaria]['recall']
            recall_maj = report[classe_majoritaria]['recall']

            if recall_min < recall_maj - 0.05:
                f.write(f"   Classe minorit√°ria ({classe_minoritaria}) com Recall significativamente menor\n")
                f.write(f"      Recall Classe {classe_minoritaria}: {recall_min:.4f}\n")
                f.write(f"      Recall Classe {classe_majoritaria}: {recall_maj:.4f}\n")
                f.write(f"      Diferen√ßa: {(recall_maj - recall_min):.4f}\n\n")

            f.write("  Modelo pode estar enviesado para a classe majorit√°ria\n")
            f.write("  Acur√°cia alta pode ser enganosa devido ao desbalanceamento\n")
            f.write("  Macro F1-Score √© mais confi√°vel que Acur√°cia neste caso\n")

            # 3. T√âCNICAS APLICADAS
            f.write("\n\n3. T√âCNICAS DE BALANCEAMENTO APLICADAS\n")
            f.write("-" * 100 + "\n\n")

            f.write("Foram testadas 5 abordagens:\n\n")

            f.write("1. SEM Balanceamento (Baseline)\n")
            f.write("   ‚Ä¢ Modelo treinado com dados originais desbalanceados\n")
            f.write("   ‚Ä¢ Serve como refer√™ncia para medir melhorias\n\n")

            f.write("2. SMOTE (Synthetic Minority Over-sampling Technique)\n")
            f.write("   ‚Ä¢ Cria exemplos sint√©ticos da classe minorit√°ria\n")
            f.write("   ‚Ä¢ Gera novos pontos interpolando exemplos existentes\n")
            f.write("   ‚Ä¢ Aumenta o tamanho do conjunto de treino\n\n")

            f.write("3. ADASYN (Adaptive Synthetic Sampling)\n")
            f.write("   ‚Ä¢ Similar ao SMOTE, mas adaptativo\n")
            f.write("   ‚Ä¢ Foca em gerar exemplos em regi√µes dif√≠ceis de classificar\n")
            f.write("   ‚Ä¢ Mais sens√≠vel a outliers\n\n")

            f.write("4. SMOTE + Tomek Links\n")
            f.write("   ‚Ä¢ Combina SMOTE com limpeza de fronteira\n")
            f.write("   ‚Ä¢ Remove exemplos amb√≠guos ap√≥s sobre-amostragem\n")
            f.write("   ‚Ä¢ Melhora a defini√ß√£o da fronteira de decis√£o\n\n")

            f.write("5. Under-Sampling Aleat√≥rio\n")
            f.write("   ‚Ä¢ Remove aleatoriamente exemplos da classe majorit√°ria\n")
            f.write("   ‚Ä¢ Reduz o tamanho do conjunto de treino\n")
            f.write("   ‚Ä¢ Pode perder informa√ß√£o importante\n\n")

            # 4. RESULTADOS COMPARATIVOS
            f.write("\n4. RESULTADOS COMPARATIVOS\n")
            f.write("-" * 100 + "\n\n")

            f.write(self.df_comparacao.to_string(index=False))
            f.write("\n\n")

            # 5. MELHOR T√âCNICA
            f.write("\n5. MELHOR T√âCNICA IDENTIFICADA\n")
            f.write("-" * 100 + "\n\n")

            melhor = self.resultados_comparacao[self.melhor_tecnica]
            baseline_f1 = baseline['Macro F1-Score']
            melhor_f1 = melhor['Macro F1-Score']
            melhoria = ((melhor_f1 - baseline_f1) / baseline_f1) * 100

            f.write(f"T√âCNICA VENCEDORA: {self.melhor_tecnica}\n\n")
            f.write(f"M√âTRICAS FINAIS:\n\n")
            f.write(f"  ‚Ä¢ Acur√°cia:        {melhor['Acur√°cia']:.4f}\n")
            f.write(f"  ‚Ä¢ Macro F1-Score:  {melhor['Macro F1-Score']:.4f}\n")
            f.write(f"  ‚Ä¢ Macro Precision: {melhor['Macro Precision']:.4f}\n")
            f.write(f"  ‚Ä¢ Macro Recall:    {melhor['Macro Recall']:.4f}\n\n")

            f.write(f"MELHORIA SOBRE BASELINE:\n\n")
            f.write(f"  ‚Ä¢ Macro F1-Score:  +{melhoria:.2f}%\n")
            f.write(f"  ‚Ä¢ De {baseline_f1:.4f} para {melhor_f1:.4f}\n\n")

            # 6. MATRIZ DE CONFUS√ÉO
            f.write("\n6. MATRIZ DE CONFUS√ÉO - MELHOR T√âCNICA\n")
            f.write("-" * 100 + "\n\n")

            cm = melhor['Confusion Matrix']
            f.write("Matriz de Confus√£o:\n\n")
            f.write(str(cm))
            f.write("\n\n")

            # An√°lise da matriz
            f.write("INTERPRETA√á√ÉO:\n\n")

            # Para classifica√ß√£o bin√°ria
            if cm.shape[0] == 2:
                tn, fp, fn, tp = cm.ravel()

                f.write(f"  Verdadeiros Negativos (TN): {tn}\n")
                f.write(f"  Falsos Positivos (FP):      {fp}\n")
                f.write(f"  Falsos Negativos (FN):      {fn}\n")
                f.write(f"  Verdadeiros Positivos (TP): {tp}\n\n")

                # Calcular taxas
                tpr = tp / (tp + fn) if (tp + fn) > 0 else 0
                tnr = tn / (tn + fp) if (tn + fp) > 0 else 0

                f.write(f"  Taxa de Verdadeiros Positivos (Recall Classe 1): {tpr:.4f}\n")
                f.write(f"  Taxa de Verdadeiros Negativos (Recall Classe 0): {tnr:.4f}\n\n")

                if abs(tpr - tnr) < 0.05:
                    f.write("  Modelo balanceado entre as classes\n")
                else:
                    f.write(" Modelo ainda apresenta algum vi√©s\n")

            # 7. AN√ÅLISE POR CLASSE
            f.write("\n\n7. DESEMPENHO POR CLASSE\n")
            f.write("-" * 100 + "\n\n")

            f.write("COMPARA√á√ÉO: Baseline vs Melhor T√©cnica\n\n")

            classes = [c for c in melhor['Report'].keys() if c not in ['accuracy', 'macro avg', 'weighted avg']]

            for classe in classes:
                base_metrics = baseline['Report'][str(classe)]
                melhor_metrics = melhor['Report'][str(classe)]

                f.write(f"Classe {classe}:\n")
                f.write(f"  Baseline:      Precision={base_metrics['precision']:.4f}, " +
                       f"Recall={base_metrics['recall']:.4f}, F1={base_metrics['f1-score']:.4f}\n")
                f.write(f"  {self.melhor_tecnica}: Precision={melhor_metrics['precision']:.4f}, " +
                       f"Recall={melhor_metrics['recall']:.4f}, F1={melhor_metrics['f1-score']:.4f}\n")

                melhoria_f1 = ((melhor_metrics['f1-score'] - base_metrics['f1-score']) /
                              base_metrics['f1-score']) * 100
                f.write(f"  Melhoria F1:   {melhoria_f1:+.2f}%\n\n")

            # 8. CONCLUS√ïES
            f.write("\n8. CONCLUS√ïES E RECOMENDA√á√ïES\n")
            f.write("-" * 100 + "\n\n")

            f.write("PRINCIPAIS DESCOBERTAS:\n\n")

            f.write(f"1. O dataset apresenta desbalanceamento {self.razao_desbalanceamento:.2f}:1\n\n")

            f.write(f"2. O uso de {self.melhor_tecnica} melhorou significativamente o desempenho:\n")
            f.write(f"   ‚Ä¢ Macro F1-Score aumentou em {melhoria:.2f}%\n")
            f.write(f"   ‚Ä¢ Modelo ficou mais balanceado entre as classes\n\n")

            f.write("3. M√©tricas adequadas para dados desbalanceados:\n")
            f.write("   ‚Ä¢ Macro F1-Score √© a m√©trica principal (equilibra precis√£o e recall)\n")
            f.write("   ‚Ä¢ Matriz de Confus√£o revela padr√µes de erro por classe\n")
            f.write("   ‚Ä¢ Acur√°cia sozinha pode ser enganosa\n\n")

            f.write("RECOMENDA√á√ïES:\n\n")
            f.write(f"‚Ä¢ Utilizar {self.melhor_tecnica} para treinar o modelo final\n")
            f.write("‚Ä¢ Monitorar Macro F1-Score como m√©trica principal\n")
            f.write("‚Ä¢ Analisar a Matriz de Confus√£o regularmente\n")
            f.write("‚Ä¢ Considerar ajuste de hiperpar√¢metros para melhorias adicionais\n")

            f.write("\n" + "=" * 100 + "\n")
            f.write("RELAT√ìRIO GERADO COM SUCESSO\n")
            f.write("=" * 100 + "\n")

        print(f"   ‚úì Relat√≥rio salvo em: {output_file}")



if __name__ == "__main__":

    FILEPATH = 'datasample.csv'
    TARGET_COLUMN = 'Class'

    FEATURES_SELECIONADAS = [
        'V14', 'V12', 'V4', 'V11', 'V10',
        'V16', 'V17', 'V3', 'V9', 'V7'
    ]

    MODELO = 'Random Forest'

    try:
        # 1. Inicializar avalia√ß√£o
        avaliacao = AvaliacaoCompleta(
            filepath=FILEPATH,
            target_column=TARGET_COLUMN,
            features_selecionadas=FEATURES_SELECIONADAS
        )

        # 2. Comparar t√©cnicas de balanceamento
        resultados = avaliacao.comparar_tecnicas_balanceamento(
            modelo_nome=MODELO,
            features_selecionadas=FEATURES_SELECIONADAS
        )

        # 3. Gerar tabela comparativa
        df_comparacao = avaliacao.gerar_tabela_comparativa()

        # 4. Visualiza√ß√µes
        avaliacao.visualizar_comparacao('comparacao_tecnicas.png')
        avaliacao.visualizar_matrizes_confusao('matrizes_confusao.png')

        # 5. An√°lise por classe
        avaliacao.analisar_metricas_por_classe()

        # 6. Relat√≥rio final
        avaliacao.gerar_relatorio_final('RELATORIO_AVALIACAO.txt')

        print("\n" + "=" * 100)
        print("AVALIA√á√ÉO COMPLETA CONCLU√çDA COM SUCESSO!")
        print("=" * 100)
        print("\nArquivos gerados:")
        print("   ‚Ä¢ RELATORIO_AVALIACAO.txt - Relat√≥rio completo")
        print("   ‚Ä¢ comparacao_tecnicas.png - Gr√°ficos comparativos")
        print("   ‚Ä¢ matrizes_confusao.png   - Matrizes de confus√£o")

    except Exception as e:
        print(f"\nERRO: {str(e)}")
        import traceback
        traceback.print_exc()

                              AVALIA√á√ÉO COMPLETA DO MODELO

Dataset carregado: 1759 exemplos, 10 features
Target: Class

AN√ÅLISE DE DESBALANCEAMENTO

Distribui√ß√£o Original das Classes:

‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ   Classe    ‚îÇ  Exemplos  ‚îÇ Propor√ß√£o % ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ   Classe 0  ‚îÇ    1267    ‚îÇ    72.03%   ‚îÇ
‚îÇ   Classe 1  ‚îÇ     492    ‚îÇ    27.97%   ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

Raz√£o de Desbalanceamento: 2.58:1
N√≠vel de Desbalanceamento: SEVERO

 IMPACTO ESPERADO DO DESBALANCEAMENTO:
   ‚Ä¢ Modelo pode ter vi√©s para a classe majorit√°ria
   ‚Ä¢ M√©tricas como Acur√°cia podem ser enganosas
   ‚Ä¢ Classe minorit√°ria pode ter baixo Recall
   ‚Ä