# 11 - Modelo de Classifica√ß√£o (Prever SE vai vender)

Este notebook treina o primeiro est√°gio do modelo de dois est√°gios: **classifica√ß√£o**.

## Objetivo:
- Prever se um item ter√° vendas (`vendeu = 1`) ou n√£o (`vendeu = 0`)
- Usar LightGBM Classifier otimizado
- Avaliar com m√©tricas de classifica√ß√£o (AUC, F1-Score, Matriz de Confus√£o)
- Preparar para ser usado no pipeline de dois est√°gios

In [1]:
import pandas as pd
import numpy as np
import lightgbm as lgb
from sklearn.metrics import (
    classification_report, confusion_matrix, 
    roc_auc_score, f1_score, precision_score, recall_score
)
import pickle
import os
import warnings
warnings.filterwarnings('ignore')

print('üéØ Iniciando Treinamento do Modelo de Classifica√ß√£o')
print('üèÜ Objetivo: Prever SE um item vai vender (vendeu = 1 ou 0)')

# Criar pasta submissao3 se n√£o existir
os.makedirs('../data/submissao3', exist_ok=True)
print('üìÅ Pasta data/submissao3 criada/verificada')

üéØ Iniciando Treinamento do Modelo de Classifica√ß√£o
üèÜ Objetivo: Prever SE um item vai vender (vendeu = 1 ou 0)
üìÅ Pasta data/submissao3 criada/verificada


## 1. Carregamento dos Dados com Features

In [2]:
# Carregar dados com features avan√ßadas CORRIGIDAS
print('üìÇ Carregando dados com features CORRIGIDAS (sem target leakage)...')

# IMPORTANTE: Usar os dados CORRIGIDOS que foram salvos no Notebook 10
try:
    train_features = pd.read_parquet('../data/submissao3/train_features_CORRIGIDO.parquet')
    validation_features = pd.read_parquet('../data/submissao3/validation_features_CORRIGIDO.parquet')
    print('‚úÖ Dados CORRIGIDOS carregados com sucesso!')
except FileNotFoundError:
    print('‚ö†Ô∏è Dados CORRIGIDOS n√£o encontrados. Usando dados originais...')
    print('   Recomenda√ß√£o: Execute o Notebook 10 primeiro para gerar os dados corrigidos.')
    train_features = pd.read_parquet('../data/submissao3/train_features.parquet')
    validation_features = pd.read_parquet('../data/submissao3/validation_features.parquet')

print(f'üèãÔ∏è Dados de treino: {train_features.shape}')
print(f'üîç Dados de valida√ß√£o: {validation_features.shape}')

# Verificar target de classifica√ß√£o
print(f'\nüìä Distribui√ß√£o do target "vendeu" no treino:')
print(train_features['vendeu'].value_counts())
print(f'   ‚Ä¢ Propor√ß√£o positiva: {train_features["vendeu"].mean()*100:.2f}%')

print(f'\nüìä Distribui√ß√£o do target "vendeu" na valida√ß√£o:')
print(validation_features['vendeu'].value_counts())
print(f'   ‚Ä¢ Propor√ß√£o positiva: {validation_features["vendeu"].mean()*100:.2f}%')

print('‚úÖ Dados carregados e target verificado')

üìÇ Carregando dados com features CORRIGIDAS (sem target leakage)...
‚úÖ Dados CORRIGIDOS carregados com sucesso!
üèãÔ∏è Dados de treino: (50126880, 54)
üîç Dados de valida√ß√£o: (5221550, 54)

üìä Distribui√ß√£o do target "vendeu" no treino:
vendeu
0    44583272
1     5543608
Name: count, dtype: int64
   ‚Ä¢ Propor√ß√£o positiva: 11.06%

üìä Distribui√ß√£o do target "vendeu" na valida√ß√£o:
vendeu
0    4649821
1     571729
Name: count, dtype: int64
   ‚Ä¢ Propor√ß√£o positiva: 10.95%
‚úÖ Dados carregados e target verificado


## 2. Prepara√ß√£o dos Dados para Classifica√ß√£o

In [3]:
# Definir features para o modelo de classifica√ß√£o SEM TARGET LEAKAGE
print('üîß Preparando dados para classifica√ß√£o SEM TARGET LEAKAGE...')

# CR√çTICO: Excluir features que causam vazamento de informa√ß√£o
features_excluir = [
    # IDs e data
    'semana', 'pdv_id', 'produto_id',  
    # Targets
    'quantidade', 'faturamento', 'vendeu',       
    # IDs auxiliares
    'distributor_id',                  
    # Categ√≥ricas brutas (usamos as hash)
    'categoria', 'zipcode', 'tipo_loja',  
    
    # üö® CR√çTICO: Features que causam TARGET LEAKAGE (usam informa√ß√£o da semana atual)
    'preco_unitario_atual',                     # Usa quantidade atual  
    'preco_medio_semanal_sku_atual',           # Usa pre√ßo atual
    'media_vendas_categoria_pdv_atual',        # Usa quantidade atual
    'share_vendas_sku_categoria_atual',        # Usa quantidade atual
    
    # REMOVIDAS do modelo original que causavam leakage
    'preco_unitario',                          # Calculado com quantidade atual
    'preco_medio_semanal_sku',                # Usa pre√ßo atual  
    'preco_medio_semanal_categoria_pdv',      # Usa pre√ßo atual
    'media_vendas_categoria_no_pdv',          # Usa quantidade atual
    'media_vendas_sku_no_zipcode',            # Usa quantidade atual  
    'share_vendas_sku_na_categoria'           # Usa quantidade atual
]

# Selecionar features SEGURAS (sem leakage)
features_disponiveis = list(train_features.columns)
features_modelo_seguros = [col for col in features_disponiveis if col not in features_excluir]

print(f'üìä Features dispon√≠veis: {len(features_disponiveis)}')
print(f'üìä Features SEGURAS para classifica√ß√£o: {len(features_modelo_seguros)}')
print(f'üìä Features exclu√≠das (com leakage): {len(features_excluir)}')

# Mostrar features SEGURAS que ser√£o usadas
print('\n‚úÖ FEATURES SEGURAS (sem target leakage):')
for feat in features_modelo_seguros:
    print(f'   ‚Ä¢ {feat}')

# Mostrar features REMOVIDAS (com leakage)  
print('\nüö® FEATURES REMOVIDAS (causavam leakage):')
features_com_leakage = [f for f in features_excluir if 'preco_unitario' in f or 'media_vendas' in f or 'share_vendas' in f or 'preco_medio' in f]
for feat in features_com_leakage:
    if feat in features_disponiveis:
        print(f'   ‚ùå {feat}')

# Preparar datasets COM FEATURES SEGURAS
X_train = train_features[features_modelo_seguros].copy()
y_train = train_features['vendeu'].copy()

X_val = validation_features[features_modelo_seguros].copy() 
y_val = validation_features['vendeu'].copy()

print(f'\nüìä Datasets preparados (SEM LEAKAGE):')
print(f'   üèãÔ∏è X_train: {X_train.shape}, y_train: {y_train.shape}')
print(f'   üîç X_val: {X_val.shape}, y_val: {y_val.shape}')

# Verificar se h√° NAs
nas_train = X_train.isnull().sum().sum()
nas_val = X_val.isnull().sum().sum()
print(f'   üßπ NAs no treino: {nas_train}, NAs na valida√ß√£o: {nas_val}')

if nas_train > 0 or nas_val > 0:
    print('   ‚ö†Ô∏è Preenchendo NAs com 0...')
    X_train = X_train.fillna(0)
    X_val = X_val.fillna(0)

# Verificar se ainda temos features suficientes
if len(features_modelo_seguros) < 10:
    print('‚ö†Ô∏è AVISO: Poucas features dispon√≠veis! Pode indicar problema na engenharia de features.')
else:
    print(f'‚úÖ {len(features_modelo_seguros)} features seguras - suficientes para treinamento!')

print('‚úÖ Dados preparados para classifica√ß√£o SEM TARGET LEAKAGE')

üîß Preparando dados para classifica√ß√£o SEM TARGET LEAKAGE...
üìä Features dispon√≠veis: 54
üìä Features SEGURAS para classifica√ß√£o: 41
üìä Features exclu√≠das (com leakage): 20

‚úÖ FEATURES SEGURAS (sem target leakage):
   ‚Ä¢ preco_lag_1
   ‚Ä¢ preco_lag_2
   ‚Ä¢ variacao_preco_sku_semanal
   ‚Ä¢ quantidade_lag_1
   ‚Ä¢ quantidade_lag_2
   ‚Ä¢ quantidade_lag_3
   ‚Ä¢ quantidade_lag_4
   ‚Ä¢ quantidade_media_4w
   ‚Ä¢ quantidade_std_4w
   ‚Ä¢ quantidade_max_4w
   ‚Ä¢ quantidade_ewma_4w
   ‚Ä¢ quantidade_ewma_8w
   ‚Ä¢ preco_ewma_4w
   ‚Ä¢ semana_do_ano
   ‚Ä¢ eh_primeira_semana_mes
   ‚Ä¢ eh_dezembro
   ‚Ä¢ eh_janeiro
   ‚Ä¢ eh_pos_festas
   ‚Ä¢ semana_ano_sin
   ‚Ä¢ semana_ano_cos
   ‚Ä¢ preco_relativo_categoria
   ‚Ä¢ preco_relativo_pdv
   ‚Ä¢ preco_volatilidade
   ‚Ä¢ media_vendas_categoria_pdv_lag_1
   ‚Ä¢ share_vendas_sku_categoria_lag_1
   ‚Ä¢ momentum_ratio
   ‚Ä¢ momentum_ratio_ewma
   ‚Ä¢ aceleracao
   ‚Ä¢ dia_do_mes
   ‚Ä¢ semana_do_mes
   ‚Ä¢ eh_inicio_mes
   ‚Ä¢ e

## 3. Treinamento do Modelo LightGBM Classifier

In [4]:
# Configurar e treinar LightGBM Classifier
print('üöÄ Treinando LightGBM Classifier...')

# Par√¢metros otimizados para classifica√ß√£o
lgbm_params = {
    'objective': 'binary',
    'metric': 'binary_logloss',
    'boosting_type': 'gbdt',
    'num_leaves': 100,
    'learning_rate': 0.05,
    'feature_fraction': 0.8,
    'bagging_fraction': 0.8,
    'bagging_freq': 5,
    'min_child_samples': 100,
    'lambda_l1': 0.1,
    'lambda_l2': 0.1,
    'verbose': -1,
    'random_state': 42,
    'n_jobs': -1
}

# Criar modelo
lgbm_classifier = lgb.LGBMClassifier(**lgbm_params)

# Treinar modelo com callbacks para early stopping
print('   üìö Iniciando treinamento...')
lgbm_classifier.fit(
    X_train, y_train,
    eval_set=[(X_val, y_val)],
    eval_metric=['binary_logloss', 'auc'],
    callbacks=[lgb.early_stopping(50), lgb.log_evaluation(100)]
)

print(f'‚úÖ Modelo treinado! Melhor itera√ß√£o: {lgbm_classifier.best_iteration_}')
print(f'üìä Score de valida√ß√£o: {lgbm_classifier.best_score_}')

üöÄ Treinando LightGBM Classifier...
   üìö Iniciando treinamento...
Training until validation scores don't improve for 50 rounds
[100]	valid_0's auc: 0.84728	valid_0's binary_logloss: 0.267367
Did not meet early stopping. Best iteration is:
[100]	valid_0's auc: 0.84728	valid_0's binary_logloss: 0.267367
‚úÖ Modelo treinado! Melhor itera√ß√£o: 100
üìä Score de valida√ß√£o: defaultdict(<class 'collections.OrderedDict'>, {'valid_0': OrderedDict([('auc', np.float64(0.8472803725977874)), ('binary_logloss', np.float64(0.2673666610763523))])})


## 4. Avalia√ß√£o do Modelo

In [5]:
# Fazer previs√µes
print('üîç Avaliando modelo de classifica√ß√£o...')

# Previs√µes de probabilidade
y_pred_proba_train = lgbm_classifier.predict_proba(X_train)[:, 1]
y_pred_proba_val = lgbm_classifier.predict_proba(X_val)[:, 1]

# Previs√µes bin√°rias (threshold = 0.5)
y_pred_train = lgbm_classifier.predict(X_train)
y_pred_val = lgbm_classifier.predict(X_val)

# M√©tricas de treino
print('\nüìä M√âTRICAS DE TREINO:')
print(f'   üéØ AUC: {roc_auc_score(y_train, y_pred_proba_train):.4f}')
print(f'   üéØ F1-Score: {f1_score(y_train, y_pred_train):.4f}')
print(f'   üéØ Precision: {precision_score(y_train, y_pred_train):.4f}')
print(f'   üéØ Recall: {recall_score(y_train, y_pred_train):.4f}')

# M√©tricas de valida√ß√£o
print('\nüìä M√âTRICAS DE VALIDA√á√ÉO:')
auc_val = roc_auc_score(y_val, y_pred_proba_val)
f1_val = f1_score(y_val, y_pred_val)
precision_val = precision_score(y_val, y_pred_val)
recall_val = recall_score(y_val, y_pred_val)

print(f'   üéØ AUC: {auc_val:.4f}')
print(f'   üéØ F1-Score: {f1_val:.4f}')
print(f'   üéØ Precision: {precision_val:.4f}')
print(f'   üéØ Recall: {recall_val:.4f}')

# Matriz de confus√£o
print('\nüìä MATRIZ DE CONFUS√ÉO (Valida√ß√£o):')
cm = confusion_matrix(y_val, y_pred_val)
print(f'                 Predito')
print(f'               0       1')
print(f'Real    0   {cm[0,0]:7,} {cm[0,1]:7,}')
print(f'        1   {cm[1,0]:7,} {cm[1,1]:7,}')

# An√°lise de diferentes thresholds
print('\nüìä AN√ÅLISE DE THRESHOLDS:')
thresholds = [0.3, 0.4, 0.5, 0.6, 0.7]
for threshold in thresholds:
    y_pred_thresh = (y_pred_proba_val >= threshold).astype(int)
    f1_thresh = f1_score(y_val, y_pred_thresh)
    precision_thresh = precision_score(y_val, y_pred_thresh)
    recall_thresh = recall_score(y_val, y_pred_thresh)
    print(f'   Threshold {threshold:.1f}: F1={f1_thresh:.4f}, Prec={precision_thresh:.4f}, Rec={recall_thresh:.4f}')

print('‚úÖ Avalia√ß√£o do modelo conclu√≠da')

üîç Avaliando modelo de classifica√ß√£o...

üìä M√âTRICAS DE TREINO:
   üéØ AUC: 0.8784
   üéØ F1-Score: 0.3917
   üéØ Precision: 0.7043
   üéØ Recall: 0.2713

üìä M√âTRICAS DE VALIDA√á√ÉO:
   üéØ AUC: 0.8473
   üéØ F1-Score: 0.1460
   üéØ Precision: 0.7078
   üéØ Recall: 0.0814

üìä MATRIZ DE CONFUS√ÉO (Valida√ß√£o):
                 Predito
               0       1
Real    0   4,630,608  19,213
        1   525,188  46,541

üìä AN√ÅLISE DE THRESHOLDS:
   Threshold 0.3: F1=0.3520, Prec=0.5647, Rec=0.2557
   Threshold 0.4: F1=0.2366, Prec=0.6448, Rec=0.1449
   Threshold 0.5: F1=0.1460, Prec=0.7078, Rec=0.0814
   Threshold 0.6: F1=0.0708, Prec=0.7642, Rec=0.0371
   Threshold 0.7: F1=0.0089, Prec=0.8442, Rec=0.0045
‚úÖ Avalia√ß√£o do modelo conclu√≠da


## 5. An√°lise de Import√¢ncia das Features

In [6]:
# Analisar import√¢ncia das features
print('üìä Analisando import√¢ncia das features...')

# Obter import√¢ncias
feature_importance = lgbm_classifier.feature_importances_
feature_names = X_train.columns

# Criar DataFrame de import√¢ncias
importance_df = pd.DataFrame({
    'feature': feature_names,
    'importance': feature_importance
}).sort_values('importance', ascending=False)

# Top 20 features mais importantes
print('\nüèÜ TOP 20 FEATURES MAIS IMPORTANTES:')
for i, (_, row) in enumerate(importance_df.head(20).iterrows()):
    print(f'   {i+1:2d}. {row["feature"]:30s} - {row["importance"]:6.0f}')

# An√°lise por categoria de feature
print('\nüìä IMPORT√ÇNCIA POR CATEGORIA:')
categorias_feature = {
    'Lag': [f for f in feature_names if 'lag_' in f],
    'Rolling': [f for f in feature_names if any(x in f for x in ['media_4w', 'std_4w', 'max_4w'])],
    'Pre√ßo': [f for f in feature_names if 'preco' in f],
    'Calend√°rio': [f for f in feature_names if any(x in f for x in ['mes', 'dia', 'inicio', 'fim'])],
    'Tend√™ncia': [f for f in feature_names if any(x in f for x in ['momentum', 'aceleracao'])],
    'Hierarquia': [f for f in feature_names if any(x in f for x in ['media_vendas', 'share'])],
    'Hash': [f for f in feature_names if 'hash' in f]
}

for categoria, features in categorias_feature.items():
    if features:
        importancia_categoria = importance_df[importance_df['feature'].isin(features)]['importance'].sum()
        print(f'   {categoria:12s}: {importancia_categoria:8.0f} ({len(features)} features)')

print('‚úÖ An√°lise de import√¢ncia conclu√≠da')

üìä Analisando import√¢ncia das features...

üèÜ TOP 20 FEATURES MAIS IMPORTANTES:
    1. quantidade_ewma_8w             -   1271
    2. preco_ewma_4w                  -    972
    3. quantidade_ewma_4w             -    922
    4. semana_do_ano                  -    890
    5. preco_lag_1                    -    867
    6. categoria_hash                 -    622
    7. preco_relativo_categoria       -    622
    8. produto_hash                   -    357
    9. media_vendas_categoria_pdv_lag_1 -    354
   10. preco_lag_2                    -    326
   11. preco_relativo_pdv             -    307
   12. momentum_ratio_ewma            -    294
   13. quantidade_media_4w            -    281
   14. categoria_zipcode_hash         -    240
   15. preco_volatilidade             -    212
   16. quantidade_std_4w              -    185
   17. semana_ano_sin                 -    183
   18. mes_sin                        -    117
   19. quantidade_max_4w              -    114
   20. aceleracao   

## 6. Salvamento do Modelo

In [7]:
# Salvar modelo treinado SEM TARGET LEAKAGE
print('üíæ Salvando modelo de classifica√ß√£o SEM LEAKAGE...')

# Salvar modelo
with open('../data/submissao3/lgbm_classifier_CORRIGIDO.pkl', 'wb') as f:
    pickle.dump(lgbm_classifier, f)

# CR√çTICO: Salvar lista de features SEGURAS (sem leakage)
with open('../data/submissao3/classification_features_CORRIGIDO.pkl', 'wb') as f:
    pickle.dump(features_modelo_seguros, f)

# Salvar import√¢ncias
importance_df.to_csv('../data/submissao3/classification_feature_importance_CORRIGIDO.csv', index=False)

# Salvar metadados do modelo CORRIGIDO
metadados_classifier = {
    'data_criacao': pd.Timestamp.now(),
    'modelo': 'LightGBM Classifier SEM TARGET LEAKAGE',
    'objetivo': 'Classifica√ß√£o: prever se vai vender (vendeu = 1 ou 0)',
    'parametros': lgbm_params,
    'melhor_iteracao': lgbm_classifier.best_iteration_,
    'melhor_score': lgbm_classifier.best_score_,
    'total_features': len(features_modelo_seguros),
    'features_usadas': features_modelo_seguros,
    'features_removidas_por_leakage': features_com_leakage,
    'correcao_target_leakage': {
        'problema_original': 'Rolling features inclu√≠am valor da semana atual (target leakage)',
        'solucao_aplicada': 'Rolling/EWMA baseados em quantidade_lag_1, n√£o quantidade atual',
        'dados_corrigidos': 'Usado train_features_CORRIGIDO.parquet',
        'features_removidas': len(features_com_leakage),
        'features_seguras_restantes': len(features_modelo_seguros)
    },
    'metricas_validacao': {
        'auc': auc_val,
        'f1_score': f1_val,
        'precision': precision_val,
        'recall': recall_val
    },
    'shape_treino': X_train.shape,
    'shape_validacao': X_val.shape,
    'distribuicao_target_treino': y_train.value_counts().to_dict(),
    'distribuicao_target_validacao': y_val.value_counts().to_dict(),
    'observacoes': [
        'VERS√ÉO CORRIGIDA: Rolling features baseadas em dados defasados',
        'Notebook 10 foi corrigido para calcular features sobre quantidade_lag_1',
        'Features que usavam informa√ß√£o atual foram removidas',
        'Dados carregados de train_features_CORRIGIDO.parquet'
    ]
}

with open('../data/submissao3/lgbm_classifier_CORRIGIDO_metadata.pkl', 'wb') as f:
    pickle.dump(metadados_classifier, f)

print('‚úÖ Arquivos CORRIGIDOS salvos:')
print('   ‚Ä¢ data/submissao3/lgbm_classifier_CORRIGIDO.pkl')
print('   ‚Ä¢ data/submissao3/classification_features_CORRIGIDO.pkl')
print('   ‚Ä¢ data/submissao3/classification_feature_importance_CORRIGIDO.csv')
print('   ‚Ä¢ data/submissao3/lgbm_classifier_CORRIGIDO_metadata.pkl')

print('\\nüéâ MODELO DE CLASSIFICA√á√ÉO CORRIGIDO TREINADO!')
print('=' * 70)
print('üéØ Resumo da Corre√ß√£o:')
print(f'   ‚ùå Problema original: Rolling features inclu√≠am semana atual')
print(f'   ‚úÖ Corre√ß√£o aplicada: Rolling baseado em quantidade_lag_1')
print(f'   üìä Features seguras usadas: {len(features_modelo_seguros)}')
print(f'   üìä AUC: {auc_val:.4f}')
print(f'   üìä F1-Score: {f1_val:.4f}')

# Diagn√≥stico final
if auc_val > 0.999:
    print('\\n‚ö†Ô∏è AINDA HAY TARGET LEAKAGE DETECTADO!')
    print('   üîç AUC muito alto (>0.999) indica vazamento de informa√ß√£o')
    print('   üí° Recomenda√ß√µes:')
    print('   1. Verificar se os dados CORRIGIDOS foram usados')
    print('   2. Re-executar Notebook 10 com as corre√ß√µes aplicadas')
    print('   3. Verificar se rolling features est√£o baseadas em lags')
elif auc_val > 0.95:
    print('\\n‚úÖ TARGET LEAKAGE CORRIGIDO COM SUCESSO!')
    print('   üéØ AUC em faixa realista (0.95-0.99)')
    print('   üìä M√©tricas indicam modelo funcional')
else:
    print('\\nü§î AUC MUITO BAIXO - POSS√çVEL PROBLEMA')
    print('   ‚ö†Ô∏è AUC < 0.95 pode indicar features insuficientes')
    print('   üîç Verifique se features importantes n√£o foram removidas')

print('\\nüí° Pr√≥ximo passo:')
print('   üîÑ Treinar modelo de regress√£o (Notebook 12)')
print('   üìä Pode usar features atuais no regressor (quando vendeu=1)')

print('\\nüöÄ Primeiro est√°gio do modelo de dois est√°gios!')

üíæ Salvando modelo de classifica√ß√£o SEM LEAKAGE...
‚úÖ Arquivos CORRIGIDOS salvos:
   ‚Ä¢ data/submissao3/lgbm_classifier_CORRIGIDO.pkl
   ‚Ä¢ data/submissao3/classification_features_CORRIGIDO.pkl
   ‚Ä¢ data/submissao3/classification_feature_importance_CORRIGIDO.csv
   ‚Ä¢ data/submissao3/lgbm_classifier_CORRIGIDO_metadata.pkl
\nüéâ MODELO DE CLASSIFICA√á√ÉO CORRIGIDO TREINADO!
üéØ Resumo da Corre√ß√£o:
   ‚ùå Problema original: Rolling features inclu√≠am semana atual
   ‚úÖ Corre√ß√£o aplicada: Rolling baseado em quantidade_lag_1
   üìä Features seguras usadas: 41
   üìä AUC: 0.8473
   üìä F1-Score: 0.1460
\nü§î AUC MUITO BAIXO - POSS√çVEL PROBLEMA
   ‚ö†Ô∏è AUC < 0.95 pode indicar features insuficientes
   üîç Verifique se features importantes n√£o foram removidas
\nüí° Pr√≥ximo passo:
   üîÑ Treinar modelo de regress√£o (Notebook 12)
   üìä Pode usar features atuais no regressor (quando vendeu=1)
\nüöÄ Primeiro est√°gio do modelo de dois est√°gios!
