# Tarea 1: Proyecto TensorFlow - Aproximación de y = x²

**Objetivo:** Implementar, entrenar y evaluar una red neuronal simple para aproximar la función cuadrática `y = x²` utilizando TensorFlow y Keras. Este notebook sirve como una guía interactiva y detallada de todo el proceso.

## Paso 0: Importar Librerías

Primero, importamos todas las librerías necesarias. Esto incluye `numpy` para operaciones numéricas, `tensorflow` para el modelo de red neuronal, `matplotlib` para visualizaciones y `pickle` para guardar/cargar el modelo.

In [None]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
import matplotlib.pyplot as plt
import pickle
import os
from typing import Tuple, Optional, List

# Configuración para reproducibilidad
np.random.seed(42)
tf.random.set_seed(42)

print(f"TensorFlow Version: {tf.__version__}")
print(f"NumPy Version: {np.__version__}")

## La Clase `ModeloCuadratico`

Para mantener el código organizado y reutilizable, encapsulamos toda la lógica en una clase de Python. Esta clase manejará la generación de datos, la construcción del modelo, el entrenamiento, la predicción y la persistencia.

In [None]:
class ModeloCuadratico:
    """Clase para aproximar la función y = x² usando una red neuronal simple."""
    
    def __init__(self):
        self.modelo: Optional[tf.keras.Model] = None
        self.x_train: Optional[np.ndarray] = None
        self.y_train: Optional[np.ndarray] = None
        self.history: Optional[tf.keras.callbacks.History] = None
        
    def generar_datos(self, n_samples: int = 1000, rango: Tuple[float, float] = (-1, 1), ruido: float = 0.02, seed: Optional[int] = 42) -> Tuple[np.ndarray, np.ndarray]:
        if seed is not None:
            np.random.seed(seed)
        x = np.random.uniform(low=rango[0], high=rango[1], size=(n_samples, 1))
        y = x ** 2 + np.random.normal(loc=0.0, scale=ruido, size=(n_samples, 1))
        self.x_train = x.astype(np.float32)
        self.y_train = y.astype(np.float32)
        return self.x_train, self.y_train
    
    def construir_modelo(self) -> None:
        self.modelo = keras.Sequential([
            layers.Dense(units=64, activation='relu', input_shape=(1,), name='capa_oculta_1'),
            layers.Dense(units=64, activation='relu', name='capa_oculta_2'),
            layers.Dense(units=1, activation='linear', name='capa_salida')
        ], name='ModeloCuadratico')
        self.modelo.compile(optimizer=keras.optimizers.Adam(learning_rate=0.001), loss='mse', metrics=['mae'])
        
    def entrenar(self, epochs: int = 100, batch_size: int = 32, validation_split: float = 0.2, callbacks: Optional[List] = None) -> tf.keras.callbacks.History:
        if self.modelo is None or self.x_train is None:
            raise RuntimeError("Modelo o datos no inicializados.")
        if callbacks is None:
            callbacks = [
                EarlyStopping(monitor='val_loss', patience=15, restore_best_weights=True, verbose=1),
                ModelCheckpoint(filepath='mejor_modelo_temp.h5', monitor='val_loss', save_best_only=True, verbose=0)
            ]
        self.history = self.modelo.fit(self.x_train, self.y_train, epochs=epochs, batch_size=batch_size, validation_split=validation_split, callbacks=callbacks, verbose=1)
        return self.history
    
    def predecir(self, x: np.ndarray) -> np.ndarray:
        if self.modelo is None:
            raise RuntimeError("Modelo no entrenado.")
        if x.ndim == 1:
            x = x.reshape(-1, 1)
        return self.modelo.predict(x, verbose=0)
    
    def guardar_modelo(self, path_tf: str = "modelo_entrenado.h5", path_pkl: str = "modelo_entrenado.pkl") -> None:
        if self.modelo is None:
            raise RuntimeError("No hay modelo para guardar.")
        self.modelo.save(path_tf)
        print(f"Modelo guardado en {path_tf}")
        with open(path_pkl, 'wb') as f:
            pickle.dump(self.modelo, f)
        print(f"Modelo guardado en {path_pkl}")
        
    def cargar_modelo(self, path_tf: Optional[str] = None, path_pkl: Optional[str] = None) -> None:
        if path_tf:
            self.modelo = keras.models.load_model(path_tf)
            print(f"Modelo cargado desde {path_tf}")
        elif path_pkl:
            with open(path_pkl, 'rb') as f:
                self.modelo = pickle.load(f)
            print(f"Modelo cargado desde {path_pkl}")
        else:
            raise ValueError("Debe proporcionar una ruta de archivo.")

## Paso 1: Generación y Visualización de Datos

El primer paso es crear un conjunto de datos sintético. Generaremos valores de `x` distribuidos uniformemente y calcularemos `y = x²`, añadiendo un poco de ruido gaussiano para simular datos del mundo real y hacer el problema más realista.

In [None]:
# Crear una instancia de nuestro modelo
modelo_cuad = ModeloCuadratico()

# Generar los datos
x_data, y_data = modelo_cuad.generar_datos(n_samples=1000, rango=(-1, 1), ruido=0.02, seed=42)

print(f"Forma de x: {x_data.shape}")
print(f"Forma de y: {y_data.shape}")

# Visualizar los datos generados
plt.figure(figsize=(8, 5))
plt.scatter(x_data, y_data, alpha=0.5, s=10, label='Datos generados (y = x² + ruido)')
plt.title('Conjunto de Datos Sintético')
plt.xlabel('x')
plt.ylabel('y')
plt.grid(True, alpha=0.3)
plt.legend()
plt.show()

## Paso 2: Construcción del Modelo

Ahora, definimos la arquitectura de nuestra red neuronal. Usaremos un modelo secuencial de Keras con dos capas ocultas de 64 neuronas cada una (con activación ReLU) y una capa de salida con una sola neurona (con activación lineal) para la regresión.

In [None]:
# Construir el modelo
modelo_cuad.construir_modelo()

# Mostrar un resumen de la arquitectura
modelo_cuad.modelo.summary()

## Paso 3: Entrenamiento del Modelo

Con los datos y el modelo listos, procedemos a entrenarlo. El método `fit` de Keras ajustará los pesos del modelo para minimizar la función de pérdida (MSE). Usaremos el 20% de los datos para validación y `EarlyStopping` para detener el entrenamiento si no hay mejora, evitando el sobreajuste.

In [None]:
print("Iniciando entrenamiento...")
history = modelo_cuad.entrenar(
    epochs=100, 
    batch_size=32, 
    validation_split=0.2
)
print("
Entrenamiento completado.")

## Paso 4: Evaluación y Visualización de Resultados

Una vez entrenado el modelo, es crucial evaluar su rendimiento. Visualizaremos:
1.  **Curvas de Aprendizaje:** Cómo evolucionaron la pérdida (loss) y el error absoluto medio (MAE) durante el entrenamiento, tanto para los datos de entrenamiento como los de validación.
2.  **Predicciones vs. Valores Reales:** Una gráfica que compara las predicciones del modelo con los valores reales para ver qué tan bien se ajusta.

In [None]:
# Graficar curvas de aprendizaje (pérdida y MAE)
plt.figure(figsize=(14, 5))

# Gráfica de Pérdida
plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='Pérdida (entrenamiento)')
plt.plot(history.history['val_loss'], label='Pérdida (validación)')
plt.title('Curva de Aprendizaje - Pérdida (MSE)')
plt.xlabel('Época')
plt.ylabel('Pérdida')
plt.legend()
plt.grid(True, alpha=0.3)

# Gráfica de MAE
plt.subplot(1, 2, 2)
plt.plot(history.history['mae'], label='MAE (entrenamiento)')
plt.plot(history.history['val_mae'], label='MAE (validación)')
plt.title('Curva de Aprendizaje - MAE')
plt.xlabel('Época')
plt.ylabel('Error Absoluto Medio')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig("loss_vs_epochs.png", dpi=300)
plt.show()

In [None]:
# Realizar predicciones sobre los mismos datos para visualización
y_pred = modelo_cuad.predecir(x_data)

# Graficar predicciones vs. valores reales
plt.figure(figsize=(10, 6))
plt.scatter(x_data, y_data, alpha=0.3, s=10, label='Datos Reales')
plt.scatter(x_data, y_pred, alpha=0.5, s=10, color='red', label='Predicciones del Modelo')

# Graficar la función teórica para comparación
x_teorico = np.linspace(-1, 1, 100)
y_teorico = x_teorico**2
plt.plot(x_teorico, y_teorico, 'g--', linewidth=2, label='y = x² (Teórico)')

plt.title('Predicciones del Modelo vs. Valores Reales')
plt.xlabel('x')
plt.ylabel('y')
plt.legend()
plt.grid(True, alpha=0.3)
plt.savefig("prediccion_vs_real.png", dpi=300)
plt.show()

## Paso 5: Guardado y Carga del Modelo

Finalmente, guardamos el modelo entrenado para poder reutilizarlo en el futuro sin necesidad de reentrenar. Lo guardaremos en dos formatos:
1.  **`.h5` (HDF5):** El formato nativo de Keras, que guarda la arquitectura, los pesos y la configuración del optimizador.
2.  **`.pkl` (Pickle):** Un formato de serialización de Python que guarda el objeto del modelo completo.

In [None]:
# Guardar el modelo en ambos formatos
modelo_cuad.guardar_modelo(
    path_tf="modelo_entrenado.h5", 
    path_pkl="modelo_entrenado.pkl"
)

### Verificación de Carga

Para asegurarnos de que los modelos se guardaron correctamente, los cargaremos en nuevas instancias y verificaremos que las predicciones sean idénticas.

In [None]:
# Datos de prueba
x_test = np.array([[-0.8], [-0.2], [0.0], [0.5], [0.9]])

# Predicción con el modelo original
pred_original = modelo_cuad.predecir(x_test)

# Cargar desde .h5 y predecir
modelo_h5 = ModeloCuadratico()
modelo_h5.cargar_modelo(path_tf="modelo_entrenado.h5")
pred_h5 = modelo_h5.predecir(x_test)

# Cargar desde .pkl y predecir
modelo_pkl = ModeloCuadratico()
modelo_pkl.cargar_modelo(path_pkl="modelo_entrenado.pkl")
pred_pkl = modelo_pkl.predecir(x_test)

# Comparar resultados
print("Predicciones del modelo original:")
print(pred_original.flatten())

print("
Predicciones del modelo cargado desde .h5:")
print(pred_h5.flatten())

print("
Predicciones del modelo cargado desde .pkl:")
print(pred_pkl.flatten())

# Verificación de igualdad
assert np.allclose(pred_original, pred_h5), "Las predicciones de .h5 no coinciden"
assert np.allclose(pred_original, pred_pkl), "Las predicciones de .pkl no coinciden"

print("
✓ Verificación exitosa: Los modelos cargados producen resultados idénticos.")

## Conclusión

Hemos completado con éxito el ciclo de vida de un proyecto de machine learning: hemos generado datos, construido y entrenado un modelo, evaluado su rendimiento y lo hemos guardado para su uso futuro. La red neuronal fue capaz de aprender la relación cuadrática `y = x²` con un alto grado de precisión.