<a href="https://colab.research.google.com/github/davidlealo/sic_ai_2025_jun/blob/main/05deeplearning/clase_38.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Proyecto Integrador de AI Engineering con Fashion-MNIST

## Descripción General

Este proyecto tiene como objetivo simular un flujo de trabajo real en ingeniería de inteligencia artificial utilizando el dataset **Fashion-MNIST**. El ejercicio abarca desde la carga y preprocesamiento de datos hasta la creación de modelos de deep learning, control de calidad con autoencoders, despliegue en API y monitoreo de métricas en producción.

Se espera que el estudiante implemente un sistema E2E (End-to-End) que permita clasificar imágenes, validar su calidad y monitorear su desempeño, incluyendo la simulación de un caso de desbalance de clases y su corrección mediante aumento de datos.

---

## Objetivos de Aprendizaje

1. Implementar una **red neuronal convolucional (CNN)** para clasificación multiclase.
2. Diseñar y entrenar un **autoencoder** para validación de calidad de imágenes.
3. Integrar ambos modelos en una **lógica de decisión** que combine confianza del clasificador y control de calidad.
4. Desplegar el modelo como una **API** (FastAPI o Gradio) y probar su uso.
5. Simular y analizar métricas de **monitoreo en producción** (latencia, confianza, drift de datos).
6. Explorar el uso de **GANs** para aumento de datos en clases minoritarias.

---

## Requisitos

- Google Colab o entorno equivalente con GPU.
- Python 3.8+
- Librerías:
  - tensorflow, tensorflow-datasets
  - fastapi, uvicorn, pyngrok (opcional)
  - gradio
  - scikit-learn, scipy, matplotlib

---

## Instrucciones Paso a Paso

### 1. Configuración del Entorno

1. Instalar las dependencias necesarias utilizando pip.
2. Configurar la semilla para reproducibilidad.

**Explicación:**  
Esto garantiza que los resultados de entrenamiento sean replicables, controlando la aleatoriedad de inicialización de pesos y muestreo.

---

### 2. Carga y Preparación de Datos

1. Descargar el dataset **Fashion-MNIST** desde `tensorflow_datasets`.
2. Normalizar los valores de píxel en el rango [0,1].
3. Separar en conjuntos de entrenamiento, validación y prueba.
4. Implementar una función para simular desbalance en una clase específica.

**Explicación:**  
Fashion-MNIST contiene 70,000 imágenes de ropa y calzado en 10 clases. Simular desbalance es útil para reproducir problemas reales de datos donde algunas clases están subrepresentadas.

---

### 3. Modelado

**CNN (Clasificación):**
- Arquitectura con dos capas convolucionales, pooling, dropout y dos capas densas.
- Función de pérdida: `sparse_categorical_crossentropy`.
- Optimizador: Adam.

**Autoencoder (Control de Calidad):**
- Entrenado únicamente con imágenes de una clase designada como "normal".
- El error de reconstrucción se usa como métrica de calidad.

**Explicación:**  
La CNN clasifica las imágenes y el autoencoder detecta imágenes atípicas o de baja calidad comparando su reconstrucción con la entrada.

---

### 4. Entrenamiento

1. Entrenar la CNN con el conjunto de entrenamiento desbalanceado.
2. Entrenar el autoencoder con imágenes de la clase normal.
3. Guardar ambos modelos.

**Explicación:**  
Entrenar por separado permite evaluar cada componente y reutilizarlos en diferentes contextos o lógicas de negocio.

---

### 5. Evaluación

1. Evaluar la CNN en el conjunto de prueba: precisión global, matriz de confusión, precisión por clase.
2. Evaluar el autoencoder midiendo el AUC para distinguir la clase normal del resto.
3. Visualizar histogramas de error de reconstrucción.

**Explicación:**  
Esto permite entender la capacidad de generalización del clasificador y la sensibilidad del sistema de QA.

---

### 6. Lógica de Producción

1. Implementar una función de decisión que combine:
   - Predicción de la clase y su probabilidad.
   - Verificación de calidad mediante el error de reconstrucción del AE.
2. Definir umbrales mínimos de confianza y máximos de error de reconstrucción.

**Explicación:**  
En un sistema real, no basta con predecir, sino que es necesario aceptar o rechazar datos según su calidad y confiabilidad.

---

### 7. Despliegue del Modelo

**Opción 1: FastAPI con Ngrok**
- Levantar un servidor local con FastAPI que exponga `/predict` y `/health`.
- Conectarlo a Internet con Ngrok para pruebas externas.

**Opción 2: Gradio**
- Crear una interfaz gráfica simple en el navegador que permita subir imágenes y ver las predicciones y verificaciones de calidad.

**Explicación:**  
FastAPI simula un despliegue en producción, mientras que Gradio facilita la interacción rápida en entornos de desarrollo.

---

### 8. Monitoreo en Producción (Simulado)

1. Calcular métricas clave: latencia media y p95, confianza media, confianza p10, divergencia KL entre distribuciones de entrenamiento y producción.
2. Simular drift utilizando el conjunto de prueba.

**Explicación:**  
Monitorear el rendimiento del modelo en producción es esencial para detectar degradaciones o cambios en los datos.

---

### 9. Aumento con GAN (Opcional)

1. Entrenar una DCGAN simple para la clase minoritaria.
2. Generar imágenes sintéticas y mezclarlas con el conjunto de entrenamiento.
3. Reentrenar la CNN y comparar métricas.

**Explicación:**  
El aumento sintético de datos puede mejorar el rendimiento en clases con pocas muestras.

---

## Entregables

1. Notebook de Google Colab con:
   - Código funcional y comentarios claros.
   - Ejecución de todas las etapas descritas.
2. Informe técnico (Markdown o PDF) que incluya:
   - Descripción de la arquitectura y decisiones de diseño.
   - Métricas obtenidas.
   - Análisis crítico de resultados y mejoras propuestas.
3. (Opcional) Dockerfile y Makefile para despliegue local.

---

## Criterios de Evaluación

- **Reproducibilidad (20%)**: Configuración clara, semillas fijas y dependencias documentadas.
- **Modelado (25%)**: Arquitecturas justificadas y rendimiento alcanzado.
- **Integración (20%)**: Correcta implementación de la lógica de producción.
- **Despliegue (15%)**: API o interfaz funcional y documentada.
- **Monitoreo (10%)**: Métricas calculadas e interpretadas.
- **Calidad del Código (10%)**: Legibilidad, modularidad y comentarios.

---

## Consideraciones Finales

- Se valorará la claridad en la documentación y el orden en el notebook.
- El trabajo debe ser desarrollado de forma individual a menos que se indique lo contrario.
- Cualquier uso de código externo debe ser referenciado adecuadamente.

