# Predicción con los datos de test

### Leemos el DataSet de entrenamiento normalizado

In [1]:
import pandas as pd
import numpy as np
from tabulate import tabulate
import json
import sys

sys.path.append('..')  # Añade el directorio padre (logistic_regression) al path
from src.ft_functions import *

## Cargar datos de test normalizados

In [2]:
# Ahora solo necesitamos el Dataset de test
df_test = pd.read_csv('../datasets/normal_test.csv')
X_test = prepare_test_data(df_test)
print("\nForma de X_test:", X_test.shape)


Forma de X_test: (400, 8)


## Definir pares de archivos modelo-output

In [3]:
model_pairs = [
    ('model_weights.json', 'houses.csv'),
    ('model_weights2.json', 'houses2.csv'),
    ('model_weights3.json', 'houses3.csv')
]

## Realizar predicciones para cada modelo

In [4]:
# Almacenar resultados para cada modelo
all_predictions = []
all_probabilities = []

for weights_file, output_file in model_pairs:
    print(f"\nProcesando {weights_file}:")
    
    # Cargar pesos
    with open(f'../output/{weights_file}', 'r') as file:
        W_optimal = np.array(json.load(file))
    print(f"Forma de la matriz de pesos: {W_optimal.shape}")
    
    # Hacer predicciones
    predictions, probabilities = make_house_predictions(X_test, W_optimal)
    all_predictions.append(predictions)
    all_probabilities.append(probabilities)
    
    # Guardar predicciones
    output_path = f'../output/{output_file}'
    save_predictions(predictions, output_path)


Procesando model_weights.json:
Forma de la matriz de pesos: (8, 4)

Procesando model_weights2.json:
Forma de la matriz de pesos: (8, 4)

Procesando model_weights3.json:
Forma de la matriz de pesos: (8, 4)


## Crear tabla comparativa

In [5]:
print("\nComparación de predicciones para los primeros 5 estudiantes:")
print("-" * 80)

for student in range(5):
    print(f"\nEstudiante {student + 1}:")
    
    # Crear datos para la tabla
    table_data = []
    headers = ['Modelo', 'Casa Predicha', 'Gryffindor', 'Hufflepuff', 'Ravenclaw', 'Slytherin']
    
    for i, (weights_file, _) in enumerate(model_pairs):
        model_name = f"Modelo {i+1}"
        row = [
            model_name,
            all_predictions[i][student],
            f"{all_probabilities[i][student][0]:.3f}",
            f"{all_probabilities[i][student][1]:.3f}",
            f"{all_probabilities[i][student][2]:.3f}",
            f"{all_probabilities[i][student][3]:.3f}"
        ]
        table_data.append(row)
    
    print(tabulate(table_data, headers=headers, tablefmt='fancy_grid'))


Comparación de predicciones para los primeros 5 estudiantes:
--------------------------------------------------------------------------------

Estudiante 1:
╒══════════╤═════════════════╤══════════════╤══════════════╤═════════════╤═════════════╕
│ Modelo   │ Casa Predicha   │   Gryffindor │   Hufflepuff │   Ravenclaw │   Slytherin │
╞══════════╪═════════════════╪══════════════╪══════════════╪═════════════╪═════════════╡
│ Modelo 1 │ Hufflepuff      │        0.007 │        0.986 │       0.007 │       0.001 │
├──────────┼─────────────────┼──────────────┼──────────────┼─────────────┼─────────────┤
│ Modelo 2 │ Hufflepuff      │        0.01  │        0.983 │       0.007 │       0     │
├──────────┼─────────────────┼──────────────┼──────────────┼─────────────┼─────────────┤
│ Modelo 3 │ Hufflepuff      │        0.006 │        0.986 │       0.007 │       0.001 │
╘══════════╧═════════════════╧══════════════╧══════════════╧═════════════╧═════════════╛

Estudiante 2:
╒══════════╤══════════════

## Comparar predicciones

In [6]:
file_paths = [f'../output/{output_file}' for _, output_file in model_pairs]
compare_predictions(file_paths)


✅ Los tres archivos CSV son idénticos.


## Verificar el formato del archivo creado

In [7]:
print("\nPrimeras líneas del archivo houses.csv\n")
with open('../output/houses.csv', 'r') as file:
    for i, line in enumerate(file):
        if i < 7:
            print(line.strip())  # strip() elimina los saltos de línea extra


Primeras líneas del archivo houses.csv

Index,Hogwarts House
0,Hufflepuff
1,Ravenclaw
2,Gryffindor
3,Hufflepuff
4,Hufflepuff
5,Slytherin
