In [18]:
import pandas as pd

# Cargar los datos
df = pd.read_csv('../../data/processed/JNJ_clean.csv')

# Crear conjuntos de entrenamiento y prueba en base a la columna 'Date'
train_df = df[df['Date'] <= '2025-02-28']
test_df = df[df['Date'] >= '2025-03-01']

# Definir las variables de características (X) y objetivo (y)
X_train = train_df.drop(columns=['target', 'Close', 'Open', 'High', 'Low', 'Date'])
y_train = train_df['target']

X_test = test_df.drop(columns=['target', 'Close', 'Open', 'High', 'Low', 'Date'])
y_test = test_df['target']

# Verificar las dimensiones
print("Dimensiones X_train:", X_train.shape)
print("Dimensiones X_test:", X_test.shape)


Dimensiones X_train: (1015, 28)
Dimensiones X_test: (30, 28)


In [19]:
import joblib
import pandas as pd
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, classification_report

# Lista de nombres de modelos (deben coincidir con el nombre del archivo .pkl guardado)
model_names = ["DecisionTree", "RandomForest", "AdaBoost", "GradientBoosting", "LightGBM", "XGBoost", "CatBoost"]

# Lista para almacenar los resultados de cada modelo
results = []

for model_name in model_names:
    print(f"\nEvaluando el modelo: {model_name}")
    
    # Cargar el modelo desde la carpeta de modelos
    model_path = f'../../models/{model_name}_JNJ.pkl'
    model = joblib.load(model_path)
    
    # Realizar la predicción en el conjunto de prueba
    y_pred = model.predict(X_test)
    
    # Calcular las métricas globales
    accuracy = accuracy_score(y_test, y_pred)
    precision = precision_score(y_test, y_pred, average='macro')
    recall = recall_score(y_test, y_pred, average='macro')
    f1 = f1_score(y_test, y_pred, average='macro')
    
    # Mostrar reporte y matriz de confusión para cada modelo
    print("Reporte de Clasificación:")
    print(classification_report(y_test, y_pred))
    print("Matriz de Confusión:")
    print(confusion_matrix(y_test, y_pred))
    print("-" * 50)
    
    # Guardar los resultados
    results.append({
        "Modelo": model_name,
        "Accuracy": accuracy,
        "Precision Macro": precision,
        "Recall Macro": recall,
        "F1 Macro": f1
    })

# Convertir la lista de resultados a un DataFrame para facilitar la comparación
results_df = pd.DataFrame(results)
results_df = results_df.sort_values(by="Precision Macro", ascending=False)

print("Comparación global de modelos:")
results_df



Evaluando el modelo: DecisionTree
Reporte de Clasificación:
              precision    recall  f1-score   support

           0       0.45      0.64      0.53        14
           1       0.50      0.31      0.38        16

    accuracy                           0.47        30
   macro avg       0.47      0.48      0.46        30
weighted avg       0.48      0.47      0.45        30

Matriz de Confusión:
[[ 9  5]
 [11  5]]
--------------------------------------------------

Evaluando el modelo: RandomForest
Reporte de Clasificación:
              precision    recall  f1-score   support

           0       0.50      0.50      0.50        14
           1       0.56      0.56      0.56        16

    accuracy                           0.53        30
   macro avg       0.53      0.53      0.53        30
weighted avg       0.53      0.53      0.53        30

Matriz de Confusión:
[[7 7]
 [7 9]]
--------------------------------------------------

Evaluando el modelo: AdaBoost
Reporte de Clas

Unnamed: 0,Modelo,Accuracy,Precision Macro,Recall Macro,F1 Macro
6,CatBoost,0.6,0.625,0.580357,0.55
5,XGBoost,0.6,0.602679,0.602679,0.6
4,LightGBM,0.6,0.598214,0.598214,0.598214
1,RandomForest,0.533333,0.53125,0.53125,0.53125
3,GradientBoosting,0.5,0.504525,0.504464,0.499444
0,DecisionTree,0.466667,0.475,0.477679,0.457014
2,AdaBoost,0.433333,0.436652,0.4375,0.432703
