In [None]:
# predict.py
import joblib
import pandas as pd
import numpy as np
from pathlib import Path

def load_model(model_path="models/stacking_ensemble_model.joblib"):
    """
    Carrega o modelo treinado
    """
    return joblib.load(model_path)

def prepare_input_data(data, target_cols):
    """
    Prepara os dados de entrada seguindo o mesmo preprocessamento do treino
    """
    # Remover colunas target se existirem
    X = data.drop(columns=target_cols, errors='ignore')
    
    # Garantir que todas as colunas são numéricas
    for col in X.select_dtypes(include=['object']).columns:
        X[col] = pd.to_numeric(X[col], errors='coerce')
    
    return X

def predict_osteoporosis_risk(model, data):
    """
    Faz previsões usando o modelo carregado
    """
    probabilities = model.predict_proba(data)
    predictions = model.predict(data)
    return predictions, probabilities

# Exemplo de uso
if __name__ == "__main__":
    # Carregar o modelo
    model = load_model()
    
    # Carregar dados de exemplo (substitua pelo seu próprio conjunto de dados)
    test_data = pd.read_csv("sample_data.csv")
    
    # Lista de colunas target (mesma usada no treino)
    target_columns = ["target", "BMI_percentil", "T_score_fn", "RIDAGEYR_percentil",
                     "BMXWT_percentil", "BMXHT_percentil", "BMXARMC_percentil",
                     "T_score_tf", "DXXT8_DXXPOSTH", "DXXT4_DXXANTEH", "DXXT7_DXXPT16Y",
                     "DXXFEM_DXAFMRD0", "T_score_sp", "DXXSPN_DXXOSBMD",
                     "DXXFEM_DXAFMRD0", "DXXFEM_DXXNKBMD", "DXXFEM_DXXOFBMD"]
    
    # Preparar dados
    X = prepare_input_data(test_data, target_columns)
    
    # Fazer previsões
    predictions, probabilities = predict_osteoporosis_risk(model, X)
    
    # Criar DataFrame com resultados
    results = pd.DataFrame({
        'Prediction': predictions,
        'Probability': probabilities[:, 1],
    })
    
    print("\nResultados das Previsões:")
    print(results.head())