In [7]:
import numpy as np
import joblib
from tensorflow.keras.models import load_model

def predecir_puntaje(input_data):
    """
    Función para predecir el puntaje (PUNT_GLOBAL) a partir de los datos de entrada,
    utilizando el modelo entrenado con codificación one-hot.
    """
    # Cargar el escalador y el modelo
    scaler = joblib.load('/Users/gabrielacorrea/Music/Proyecto 3/scaler.pkl')  # Asegúrate de que 'scaler.pkl' esté en la misma ruta
    modelf = load_model('/Users/gabrielacorrea/Music/Proyecto 3/modelf.keras')  # Asegúrate de que 'modelo.keras' esté en la misma ruta
    
    # Columnas esperadas por el modelo
    expected_columns = ['COLE_AREA_UBICACION_URBANO', 'COLE_BILINGUE_S',
       'COLE_CALENDARIO_B', 'COLE_CALENDARIO_OTRO', 'COLE_CARACTER_NO APLICA',
       'COLE_CARACTER_TÉCNICO', 'COLE_CARACTER_TÉCNICO/ACADÉMICO',
       'COLE_GENERO_MASCULINO', 'COLE_GENERO_MIXTO', 'COLE_JORNADA_MAÑANA',
       'COLE_JORNADA_NOCHE', 'COLE_JORNADA_SABATINA', 'COLE_JORNADA_TARDE',
       'COLE_MCPIO_UBICACION_ARGELIA', 'COLE_MCPIO_UBICACION_BALBOA',
       'COLE_MCPIO_UBICACION_BOLIVAR', 'COLE_MCPIO_UBICACION_BUENOS AIRES',
       'COLE_MCPIO_UBICACION_CAJIBIO', 'COLE_MCPIO_UBICACION_CALDONO',
       'COLE_MCPIO_UBICACION_CALOTO', 'COLE_MCPIO_UBICACION_CORINTO',
       'COLE_MCPIO_UBICACION_EL TAMBO', 'COLE_MCPIO_UBICACION_FLORENCIA',
       'COLE_MCPIO_UBICACION_GUACHENÉ', 'COLE_MCPIO_UBICACION_GUAPI',
       'COLE_MCPIO_UBICACION_INZA', 'COLE_MCPIO_UBICACION_JAMBALO',
       'COLE_MCPIO_UBICACION_LA SIERRA', 'COLE_MCPIO_UBICACION_LA VEGA',
       'COLE_MCPIO_UBICACION_LOPEZ (MICAY)', 'COLE_MCPIO_UBICACION_MERCADERES',
       'COLE_MCPIO_UBICACION_MIRANDA', 'COLE_MCPIO_UBICACION_MORALES',
       'COLE_MCPIO_UBICACION_PADILLA',
       'COLE_MCPIO_UBICACION_PAEZ (BELALCAZAR)',
       'COLE_MCPIO_UBICACION_PATIA(EL BORDO)', 'COLE_MCPIO_UBICACION_PIENDAMO',
       'COLE_MCPIO_UBICACION_POPAYAN', 'COLE_MCPIO_UBICACION_PUERTO TEJADA',
       'COLE_MCPIO_UBICACION_PURACE (COCONUCO)', 'COLE_MCPIO_UBICACION_ROSAS',
       'COLE_MCPIO_UBICACION_SAN SEBASTIAN', 'COLE_MCPIO_UBICACION_SANTA ROSA',
       'COLE_MCPIO_UBICACION_SANTANDER DE QUILICHAO',
       'COLE_MCPIO_UBICACION_SILVIA',
       'COLE_MCPIO_UBICACION_SOTARA (PAISPAMBA)',
       'COLE_MCPIO_UBICACION_SUAREZ', 'COLE_MCPIO_UBICACION_SUCRE',
       'COLE_MCPIO_UBICACION_TIMBIO', 'COLE_MCPIO_UBICACION_TIMBIQUI',
       'COLE_MCPIO_UBICACION_TORIBIO', 'COLE_MCPIO_UBICACION_TOTORO',
       'COLE_MCPIO_UBICACION_VILLA RICA', 'COLE_NATURALEZA_OFICIAL',
       'ESTU_DEPTO_RESIDE_CAUCA', 'ESTU_DEPTO_RESIDE_CHOCO',
       'ESTU_DEPTO_RESIDE_HUILA', 'ESTU_DEPTO_RESIDE_NARIÑO',
       'ESTU_DEPTO_RESIDE_SAN ANDRES', 'ESTU_DEPTO_RESIDE_VALLE',
       'ESTU_GENERO_M', 'FAMI_EDUCACIONMADRE_Educación profesional incompleta',
       'FAMI_EDUCACIONMADRE_Ninguno', 'FAMI_EDUCACIONMADRE_No sabe',
       'FAMI_EDUCACIONMADRE_Postgrado',
       'FAMI_EDUCACIONMADRE_Primaria completa',
       'FAMI_EDUCACIONMADRE_Primaria incompleta',
       'FAMI_EDUCACIONMADRE_Secundaria (Bachillerato) completa',
       'FAMI_EDUCACIONMADRE_Secundaria (Bachillerato) incompleta',
       'FAMI_EDUCACIONMADRE_Técnica o tecnológica completa',
       'FAMI_EDUCACIONMADRE_Técnica o tecnológica incompleta',
       'FAMI_EDUCACIONPADRE_Educación profesional incompleta',
       'FAMI_EDUCACIONPADRE_Ninguno', 'FAMI_EDUCACIONPADRE_No sabe',
       'FAMI_EDUCACIONPADRE_Postgrado',
       'FAMI_EDUCACIONPADRE_Primaria completa',
       'FAMI_EDUCACIONPADRE_Primaria incompleta',
       'FAMI_EDUCACIONPADRE_Secundaria (Bachillerato) completa',
       'FAMI_EDUCACIONPADRE_Secundaria (Bachillerato) incompleta',
       'FAMI_EDUCACIONPADRE_Técnica o tecnológica completa',
       'FAMI_EDUCACIONPADRE_Técnica o tecnológica incompleta',
       'FAMI_ESTRATOVIVIENDA_Estrato 2', 'FAMI_ESTRATOVIVIENDA_Estrato 3',
       'FAMI_ESTRATOVIVIENDA_Estrato 4', 'FAMI_ESTRATOVIVIENDA_Estrato 5',
       'FAMI_ESTRATOVIVIENDA_Estrato 6', 'FAMI_TIENECOMPUTADOR_Si',
       'FAMI_TIENEINTERNET_Si']

    # Inicializar el vector con ceros
    input_vector = {col: 0 for col in expected_columns}

    # Mapear los datos de entrada a las columnas dummies
    for key, value in input_data.items():
        column_name = f"{key}_{value}"  # Nombre de la columna dummy
        if column_name in input_vector:
            input_vector[column_name] = 1

    # Convertir a numpy array
    input_array = np.array([list(input_vector.values())])

    # Escalar los datos de entrada
    input_scaled = scaler.transform(input_array)

    # Realizar la predicción
    puntaje_predicho = modelf.predict(input_scaled)

    return puntaje_predicho[0][0]


In [8]:
# Ejemplo de uso de la función con los valores proporcionados
input_data = {
    'COLE_AREA_UBICACION': 'URBANO',  # Reemplazar con los valores correspondientes
    'COLE_BILINGUE': 'S',
    'COLE_CALENDARIO': 'B',
    'COLE_CARACTER': 'ACADÉMICO',
    'COLE_GENERO': 'MIXTO',
    'COLE_JORNADA': 'MAÑANA',
    'COLE_MCPIO_UBICACION': 'SILVIA',
    'COLE_NATURALEZA': 'NO OFICIAL',
    'ESTU_DEPTO_RESIDE': 'CAUCA',
    'ESTU_GENERO': 'M',
    'FAMI_EDUCACIONMADRE': 'Postgrado',
    'FAMI_EDUCACIONPADRE': 'Postgrado',
    'FAMI_ESTRATOVIVIENDA': 'Estrato 5',
    'FAMI_TIENECOMPUTADOR': 'Si',
    'FAMI_TIENEINTERNET': 'Si'
}

puntaje = predecir_puntaje(input_data)
print(f"Puntaje esperado: {puntaje}")

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 173ms/step
Puntaje esperado: 249.52613830566406
