# Teste de Treinamento Otimizado - Sem Duplicatas

Teste isolado para verificar se os prints de treinamento estão otimizados.

In [1]:
# Configuração COMPLETA de logging silenciado
import logging
import sys

# Desabilitar TODOS os logs
logging.getLogger().setLevel(logging.CRITICAL)
logging.getLogger().handlers.clear()

for name in ['src', 'sklearn', 'xgboost', 'lightgbm', 'pandas', 'numpy']:
    logger = logging.getLogger(name)
    logger.setLevel(logging.CRITICAL)
    logger.handlers.clear()
    logger.propagate = False

# Função print_model_summary otimizada
def print_model_summary(model_name, eval_results, training_time):
    """Imprime resumo profissional sem duplicatas"""
    roc_auc = eval_results.get('roc_auc', 0.0)
    pr_auc = eval_results.get('pr_auc', 0.0)
    recall = eval_results.get('recall', 0.0)
    precision = eval_results.get('precision', 0.0)
    f1 = eval_results.get('f1', 0.0)
    threshold = eval_results.get('optimal_threshold', 0.5)
    
    print(f"✅ {model_name.upper()} - {training_time:.1f}s")
    print(f"   ROC-AUC: {roc_auc:.4f} | PR-AUC: {pr_auc:.4f} | Threshold: {threshold:.3f}")
    print(f"   Recall: {recall:.4f} | Precision: {precision:.4f} | F1: {f1:.4f}")

print("Configuração otimizada carregada!")

Configuração otimizada carregada!


In [None]:
# Setup e imports
import sys
from pathlib import Path

project_root = Path('..').resolve()
if str(project_root) not in sys.path:
    sys.path.insert(0, str(project_root))

from src.modeling.train_individual_models import train_xgboost_model
from src.features.aml_plotting import *

print("Imports realizados com sucesso!")

Imports realizados com sucesso!



In [3]:
   "source": [
    "# Carregar dados\n",
    "import joblib\n",
    "import pandas as pd\n",
    "import numpy as np\n",
    "\n",
    "artifacts_dir = Path('c:/Users/gafeb/OneDrive/Desktop/lavagem_dev/artifacts')\n",
    "features_pkl = artifacts_dir / 'features_processed.pkl'\n",
    "\n",
    "df = joblib.load(features_pkl)\n",
    "y = df['is_fraud']\n",
    "X = df.drop('is_fraud', axis=1)\n",
    "numeric_cols = X.select_dtypes(include=[np.number]).columns\n",
    "X = X[numeric_cols]\n",
    "\n",
    "print(f\"Dados carregados: {X.shape[0]:,} amostras, {X.shape[1]} features\")"
   ]

FileNotFoundError: [Errno 2] No such file or directory: '..\\artifacts\\features_processed.pkl'

In [None]:
# Configuração simples para teste
config = {
    'models': {
        'xgboost': {
            'model_type': 'xgb',
            'params': {
                'n_estimators': 10,
                'max_depth': 3,
                'learning_rate': 0.1,
                'random_state': 42,
                'verbosity': 0,
                'n_jobs': 1
            }
        }
    }
}

print("Configuração de teste criada!")

In [None]:
# TESTE DE TREINAMENTO - XGBoost
import time

print("=== INICIANDO TREINAMENTO XGBOOST ===")
start_time = time.time()

results = train_xgboost_model(
    X=X[:1000],  # Usar apenas 1000 amostras para teste rápido
    y=y[:1000],
    config=config,
    artifacts_dir=artifacts_dir,
    force_retrain=True,  # Forçar retreinamento
    enable_gpu=False
)

training_time = time.time() - start_time

if 'model_name' in results and results['model_name'] == 'xgboost':
    eval_results = results['evaluation_results']
    print_model_summary('XGBoost', eval_results, training_time)
else:
    print("Falha no treinamento")

print("=== TREINAMENTO CONCLUÍDO ===")