# **Selección de Algoritmos** 
Comenzaremos con modelos base simples y progresaremos hacia algoritmos de ensamble más complejos para establecer un benchmark de rendimiento.
# **Entrenamiento Sistemático** 
Crearemos un framework reutilizable para entrenar cada modelo, garantizando que todos sean evaluados bajo las mismas condiciones.
# **Ajuste de Hiperparámetros** 
Optimizaremos el mejor modelo candidato para exprimir su máximo potencial predictivo.

# 1.- **Importar librerias**

In [4]:
# Importar librerías estándar
import sys
import os

# 2. Configurar la ruta para que Python encuentre el código en 'src'. Esto añade la carpeta raíz del proyecto al sys.path
ruta_raiz_proyecto = os.path.abspath(os.path.join(os.getcwd(), '../../'))
sys.path.append(ruta_raiz_proyecto)

# 3. Importar las funciones directamente.
from src.cargar_analisis import cargar_dataframe, crear_listas_variables
from src.pipelines import preparar_datos_para_modelado
from src.modelos import obtener_configuraciones_modelos, optimizar_y_comparar_modelos

print("Funciones importadas exitosamente desde src/")

Funciones importadas exitosamente desde src/


# **2.- Importar datos**

In [5]:
# Ruta de la base de datos
path_data = '../../data/obesity_estimation_model.csv'

# Ejecutar función para cargar datos
df = cargar_dataframe(path_data)

# Ejecutar la función para generar listas con las variables numericas, categoricas y objetivo
variables_numericas, variables_categoricas, variable_objetivo = crear_listas_variables(to_lower = 1, exclude_mixed = 1)

Archivo CSV cargado exitosamente desde: ../../data/obesity_estimation_model.csv


# **3. Preprocesamiento con Pipelines**

In [6]:
X_train, X_test, y_train, y_test, preprocesador = preparar_datos_para_modelado(df, variable_objetivo, 0.2, 1)

Iniciando la preparación de datos para el modelado...
Datos divididos: 1556 para entrenamiento, 390 para prueba.

Preprocesador creado y ajustado a los datos de entrenamiento exitosamente.


# **4.- Construcción y Ajuste y Evaluación de Modelos**

In [7]:
# Ejecutar la función para obtener los modelos a evaluar
configuracion_modelos = obtener_configuraciones_modelos()

print(f"Se cargaron {len(configuracion_modelos)} configuraciones de modelos.")
print("\nEjemplo: Parámetros de Regresión Logistica:")
print(configuracion_modelos[0]['parametros'])

Se cargaron 7 configuraciones de modelos.

Ejemplo: Parámetros de Regresión Logistica:
{'clasificador__penalty': ['l1', 'l2'], 'clasificador__solver': ['liblinear', 'saga', 'lbfgs'], 'clasificador__C': [0.01, 0.1, 1.0, 10.0]}


In [5]:
# Ejecutar el proceso de optimización y comparación
df_resultados_opt, pipelines_optimizados = optimizar_y_comparar_modelos(
    configuracion_modelos,
    preprocesador,
    X_train, y_train, X_test, y_test
)

--- Optimizando: Regresión Logística ---


ModuleNotFoundError: No module named '_posixsubprocess'