# Examen Pr√°ctico: Clasificaci√≥n de d√≠gitos con Redes Neuronales Densas (Keras)

**Instrucciones generales**:

- Trabaja en este cuaderno y **completa √∫nicamente las celdas de c√≥digo** indicadas (no borres las celdas de enunciado).
- Este examen pide que implementes un clasificador **multiclase** usando **redes densas** (no usar convoluciones).
- Aunque los CNNs suelen rendir mejor en im√°genes, **NO** usar√°s convoluciones aqu√≠ (esto es parte del enunciado).
- Usa `TensorFlow / Keras` para construir, entrenar y evaluar el modelo.
- Anota tus respuestas y observaciones donde se indique.

![](https://www.tensorflow.org/static/datasets/overview_files/output_DpE2FD56cSQR_1.png)
---

**Formato del examen**: cada secci√≥n contiene
1. Un enunciado (qu√© debes hacer), con **pistas** y la forma esperada de los datos.
2. Una celda de c√≥digo vac√≠a donde debes implementar la soluci√≥n.

Al final debes entregar el cuaderno con las celdas completadas y una breve conclusi√≥n (m√°x. 300 palabras) sobre por qu√© un CNN funcionar√≠a mejor.


## Secci√≥n 1 ‚Äî Carga de librer√≠as y comprobaci√≥n de versi√≥n

**Objetivo**: Importar las librer√≠as necesarias y comprobar la versi√≥n de Python/TensorFlow.

**Debes hacer**:
- Importar `numpy`, `matplotlib.pyplot`, `tensorflow` (alias `tf`) y `sklearn.metrics` (para reporte y matriz de confusi√≥n).
- Mostrar `python --version` o `sys.version` y `tf.__version__`.

**Pista**: usa `from tensorflow import keras` y `from tensorflow.keras.utils import to_categorical`.


In [None]:
import tensorflow as tf
import tensorflow_datasets as tfds
import os
import matplotlib.pyplot as plt
from tensorflow.keras.callbacks import EarlyStopping
import math

In [None]:
# de Version de Tensorflow y si usa GPU
print("TensorFlow:", tf.__version__)
print("GPUs:", tf.config.list_physical_devices('GPU'))


## Secci√≥n 2 ‚Äî Carga del dataset

**Objetivo**: Cargar el dataset `mnist` de `tf.keras.datasets`.

**Debes hacer**:
- Cargar `x_train, y_train, x_test, y_test` usando `tf.keras.datasets.mnist.load_data()`.
- Mostrar las formas de los arrays y un resumen de los valores (m√≠nimo, m√°ximo) de `x_train` y `y_train`.

**Forma esperada**:
- `x_train` ‚Üí (60000, 28, 28)
- `y_train` ‚Üí (60000,)

**Pista**: imprime `x_train.shape, y_train.shape, x_train.min(), x_train.max()`.


In [None]:
#Cargue de datos tfds.load()
datos, metadatos = tfds.load('mnist', as_supervised=True, with_info=True)

In [None]:
#Mostrar la vriable datos


In [None]:
#Mostrar la vriable metadatos


<font color="green"> **Analisis**: Que tiene esa variable? </font>

#**Visualizaci√≥n de una imagen en MNIST**

Obt√©n el conjunto de **entrenamiento **del dataset mnist.

Selecciona la primera imagen y su etiqueta usando .take(1).

Convierte la imagen a numpy y guarda la etiqueta en una variable.

**Imprime en pantalla:**

La etiqueta de la imagen.

La forma de la imagen.

La primera fila de la matriz de p√≠xeles.

Muestra la imagen en blanco y negro usando matplotlib.pyplot.imshow() con cmap=plt.cm.binary.

*Forma esperada:*

La etiqueta debe ser un n√∫mero entre 0‚Äì9.

La forma de la imagen debe ser (28, 28)..

In [None]:
# Obtener el conjunto de entrenamiento


# Tomar el primer elemento (imagen, etiqueta)







**El objeto datos_entrenamiento es un tf.data.Dataset**

Para conocer las dimensiones de las im√°genes y etiquetas, debemos agrupar el dataset en lotes y luego inspeccionarlos.

Agrupa el dataset de entrenamiento en lotes de tama√±o 32 usando .batch(32).

Toma un solo batch con .take(1).

**Imprime en pantalla:**

La forma del batch de im√°genes.

La forma del batch de etiquetas.

**Forma esperada:**

Im√°genes ‚Üí (32, 28, 28)

Etiquetas ‚Üí (32,)
![](https://raw.githubusercontent.com/adiacla/bigdata/refs/heads/master/batch32.jpg)


In [None]:
# Para ver un batch(32) solo de ejemplo:





## Secci√≥n 3 ‚Äî Preprocesamiento

**Objetivo**: Preprocesar los datos para una red densa.

Vamos a crear las variables con datos_entrenamiento y datos_pruebas.

In [None]:
# Definir datasets de entrenamiento y prueba





**Cantidad de ejemplos en los conjuntos de datos**

El objeto metadatos que devuelve tfds.load() contiene informaci√≥n sobre los subconjuntos del dataset.

Calcula:

- Obt√©n el n√∫mero total de ejemplos en el conjunto de entrenamiento (train).

- Obt√©n el n√∫mero total de ejemplos en el conjunto de prueba (test).

Guarda esos valores en las variables:

In [None]:
#N√∫mero de ejemplos






**Normalizaci√≥n del dataset**

Las im√°genes en MNIST tienen valores de p√≠xeles entre 0 y 255. Antes de entrenar una red neuronal es recomendable escalar estos valores al rango [0,1].

Define una funci√≥n llamada normalizar(imagenes, etiquetas) que:

- Convierta las im√°genes a tipo tf.float32.

- Divida cada valor de p√≠xel entre 255.

- Devuelva (imagenes, etiquetas).

- Aplica esta funci√≥n al dataset de entrenamiento y al de pruebas usando .map().

- Comprueba que los datos fueron transformados correctamente tomando un ejemplo del dataset y mostrando sus valores m√≠nimo y m√°ximo.

**Pista:**

- Usa tf.cast() para convertir el tipo de datos.

Recuerda que .map() aplica la transformaci√≥n a cada elemento del dataset.

Forma esperada: los valores de los p√≠xeles deben estar entre 0.0 y 1.0.

In [None]:
#Funcion de normalizacion para los datos (Pasar valor de los pixeles de 0-255 a 0-1)
# Normalizaci√≥n







#**Preparaci√≥n de los datasets en TensorFlow**

Para entrenar un modelo de Deep Learning de forma eficiente, es necesario preparar los datos con un pipeline que incluya normalizaci√≥n, barajado y creaci√≥n de lotes.

Define una funci√≥n normalizar que convierta los valores de las im√°genes a flotantes entre 0 y 1.

Recuerda que los datos de las im√°genes suelen venir entre 0 y 255.

La funci√≥n debe recibir (x, y) y retornar (x_normalizado, y).

Declara la constante TAMANO_LOTE con valor 32.

**Prepara el conjunto de *datos_entrenamiento* aplicando en orden:**

.map(normalizar)

.cache()

.shuffle(num_datos_entrenamiento) usando como buffer el total de ejemplos.

.batch(TAMANO_LOTE)

.repeat() para poder iterar en varias √©pocas.

**Prepara el conjunto de *datos_pruebas* aplicando en orden:**

.map(normalizar)

.cache()

.batch(TAMANO_LOTE)

No uses shuffle() ni repeat() en pruebas.

In [None]:
# Preparar datasets







**Optimizaci√≥n del dataset con cach√©**

Una forma de acelerar el entrenamiento en TensorFlow es usar .cache() sobre el dataset. Esto guarda los datos en memoria despu√©s de la primera lectura, evitando tener que cargarlos del disco en cada √©poca.

- Aplica .cache() al dataset de entrenamiento (datos_entrenamiento).

- Aplica tambi√©n .cache() al dataset de pruebas (datos_pruebas).

Explica brevemente en un comentario por qu√© usar cach√© puede mejorar la velocidad de entrenamiento.

**Pista: **.cache() se aplica directamente sobre el objeto tf.data.Dataset.

In [None]:
#Agregar a cache (usar memoria en lugar de disco, entrenamiento mas rapido)






**Definici√≥n de clases en MNIST**

El dataset MNIST contiene 10 clases que corresponden a los d√≠gitos escritos a mano: del 0 al 9.

Define una lista llamada clases que contenga las etiquetas de cada d√≠gito como cadenas de texto.

Esta lista se usar√° m√°s adelante para mostrar el nombre de la clase debajo de cada imagen al graficar.

In [None]:
#Ejecute esta celda
clases = ["0","1","2","3","4","5","6","7","8","9"]

**Visualizaci√≥n de ejemplos de MNIST**

El dataset MNIST contiene im√°genes de d√≠gitos escritos a mano. Para comprobar que la carga y preprocesamiento de datos es correcto, es √∫til visualizar algunos ejemplos.

- Toma 25 im√°genes del conjunto de entrenamiento usando .take(25).

- Dibuja las im√°genes en una cuadr√≠cula de 5x5 usando matplotlib.

**Aseg√∫rate de:**

- Convertir cada imagen a una matriz de 28x28.

- Quitar los ejes (xticks, yticks) y la cuadr√≠cula (grid).

- Mostrar cada imagen en escala de grises (cmap=plt.cm.binary).

- Colocar como t√≠tulo (o etiqueta) el n√∫mero correspondiente a la clase.

Forma esperada: un mosaico de 25 im√°genes, cada una mostrando un d√≠gito escrito a mano y su etiqueta correspondiente.


In [None]:
#Codigo para mostrar imagenes del set, no es necesario ejecutarlo, solo imprime unos numeros :)
# Para ver un batch (32)









## Secci√≥n 4 ‚Äî Construcci√≥n del modelo (Keras)

**Objetivo**: Definir una red neuronal densa multiclase en Keras. Sin convoluciones ni dropout, ya que a√∫n no lo hemos estudiado.

**Requisitos m√≠nimos**:
- Usa `tf.keras.Sequential` (o Functional API) con *al menos* **2 capas ocultas**.
- Las capas ocultas deben usar `activation='relu'`.
- La capa de salida debe ser `Dense(10, activation='softmax')`.
- A√±adir al menos **una** t√©cnica de regularizaci√≥n (BatchNormalization).
- Pongale nombres a las capas
-Usa add para adicoonar capas

**Sugerencia de arquitectura (no obligatoria)**:
- Input (784) ‚Üí Dense(512, relu) ‚Üí Dropout(0.2) ‚Üí Dense(256, relu) ‚Üí Dense(10, softmax)


**Pista**: muestra el `model.summary()` al terminar.


In [None]:
#Cree el Modelo









*Debes adem√°s** compilar el modelo con:
- `optimizer=tf.keras.optimizers.Adam(learning_rate=0.001)`
- `loss=tf.keras.losses.SparseCategoricalCrossentropy()  Se usa cuando las etiquetas son enteros (0, 1, 2, ..., 9).
- `metrics=['accuracy']`


In [None]:
# Compilar el modelo








**Resumen de la arquitectura del modelo**

Una vez que definas tu red neuronal, utiliza el m√©todo summary() para mostrar un resumen de la arquitectura del modelo.

Aplica el m√©todo .summary() al objeto modelo.

- Observa la salida en pantalla:

- Nombre de cada capa.

- Dimensi√≥n de salida de cada capa.

- Cantidad de par√°metros entrenables.

In [None]:
modelo.summary()

**N√∫mero de ejemplos en MNIST**

El objeto metadatos que devuelve tfds.load() contiene informaci√≥n sobre los subconjuntos del dataset.

- Obt√©n el n√∫mero de ejemplos en el conjunto de entrenamiento (train).

- Obt√©n el n√∫mero de ejemplos en el conjunto de pruebas (test).

- Imprime ambos valores en pantalla.

**Forma esperada:**

Entrenamiento ‚Üí 60000

Pruebas ‚Üí 10000

**Pista:** usa la propiedad .splits["nombre"].num_examples.

In [None]:
# N√∫mero de ejemplos en train y test




# Imprimir resultados




## Secci√≥n 5 ‚Äî Entrenamiento

**Objetivo**: Entrenar el modelo con validaci√≥n y callbacks.

**Debes hacer**:
- Entrenar el modelo con `batch_size=32` y `epochs=100`.
- Usa `validation_split=0.01`.
- Implementa los callbacks:
  - `EarlyStopping` con `monitor='val_loss'`, `patience=5`, `restore_best_weights=True`.
- Guarda el historial de entrenamiento en una variable `history` o 'historial'.

**Pista**: `model.fit(x_train, y_train, validation_split=0.1, callbacks=[...])`.


## **Definici√≥n del tama√±o de lote (batch size)**

En el entrenamiento de redes neuronales, los datos se procesan en lotes (o batches) en lugar de pasar todas las muestras al mismo tiempo.

**Define una variable llamada TAMANO_LOTE.**

As√≠gnale el valor 32, que ser√° el n√∫mero de ejemplos que el modelo procesar√° en cada iteraci√≥n.

Explica brevemente en un comentario por qu√© es importante usar lotes en lugar de procesar todos los datos a la vez.

**Pista: **el tama√±o de lote es un hiperpar√°metro que afecta la velocidad de entrenamiento y el uso de memoria.

In [None]:
#Defina el numero de lotes



**Early Stopping en Keras**

Durante el entrenamiento, un modelo puede dejar de mejorar y comenzar a sobreajustarse. Para evitarlo, se utiliza Early Stopping.

Importa la clase EarlyStopping desde tensorflow.keras.callbacks.

Crea un objeto llamado early_stopping que:

Monitoree la m√©trica 'val_loss'.

Tenga una paciencia (patience) de 5, lo que significa que el entrenamiento se detendr√° si la p√©rdida de validaci√≥n no mejora en 5 √©pocas consecutivas.

Explica en un comentario c√≥mo ayuda Early Stopping a prevenir el sobreajuste.

In [None]:
# defina la variable early_stopping






**Entrenamiento del modelo con validaci√≥n**

Ahora que ya has definido y compilado tu red neuronal, es momento de entrenarla.

- Usa el m√©todo .fit() del objeto modelo.

*Configura los siguientes par√°metros:*

- datos_entrenamiento como dataset de entrada.

- epochs=100 como n√∫mero m√°ximo de √©pocas.

- steps_per_epoch=math.ceil(num_datos_entrenamiento / TAMANO_LOTE) para definir el n√∫mero de pasos por √©poca.

- callbacks=[early_stopping] para detener el entrenamiento si no hay mejora en la p√©rdida de validaci√≥n.

- verbose=1 para mostrar la barra de progreso durante el entrenamiento.

- Guarda el resultado en una variable llamada historial.

In [None]:
# Cree la variable historial y entrene el modelo









## Secci√≥n 6 ‚Äî Evaluaci√≥n y an√°lisis

**Objetivo**: Evaluar el modelo en el conjunto de prueba y analizar errores.

**Debes hacer**:
1. Cargar (si existe) `best_model.h5` y evaluar en `x_test, y_test`, reportando `test_loss` y `test_accuracy`.
2. Obtener predicciones (probabilidades y clases) sobre `x_test`.
3. Calcular y mostrar la **matriz de confusi√≥n** y el **classification_report** usando `sklearn.metrics`.
4. Mostrar 6 ejemplos donde el modelo se equivoc√≥: la imagen, la etiqueta verdadera y la predicha.

**Pista**: para la matriz de confusi√≥n usa `confusion_matrix(y_true, y_pred_classes)` (pasar etiquetas no one-hot).


**Valuaci√≥n del modelo en datos de prueba**

Una vez entrenado tu modelo, eval√∫alo utilizando el conjunto de datos de prueba.

Usa el m√©todo .evaluate() del modelo sobre datos_pruebas.

Define el par√°metro steps como math.ceil(num_datos_pruebas / TAMANO_LOTE) para recorrer todo el conjunto.

Guarda los resultados en las variables perdidas y precision.

Imprime en pantalla la precisi√≥n con 4 decimales usando:

**Evaluaci√≥n del modelo en el conjunto de prueba**

Una vez finalizado el entrenamiento, es necesario evaluar el desempe√±o real del modelo sobre datos que no ha visto antes.

- Usa el m√©todo .evaluate() sobre datos_pruebas.

- Configura el par√°metro steps como math.ceil(num_datos_pruebas / TAMANO_LOTE) para recorrer todas las muestras del conjunto.

- Guarda los valores de salida en las variables perdidas y precision.

- Muestra en consola la precisi√≥n obtenida con cuatro decimales utilizando:

In [None]:
# Evaluar el modelo con los datos de pruebas



**Guardar el modelo entrenado**

Una vez entrenado y evaluado, guarda tu modelo para poder cargarlo m√°s adelante sin necesidad de volver a entrenarlo.

Utiliza el m√©todo .save() de Keras para guardar el modelo en el formato nativo de Keras con la extensi√≥n .keras.

In [None]:
# Guardar el modelo en el formato  de Keras



## Secci√≥n 7 ‚Äî Curvas de entrenamiento

**Objetivo**: Graficar la p√©rdida y la precisi√≥n durante el entrenamiento.

**Debes hacer**:
- Usar `history.history` para graficar:
  - `loss` vs `val_loss`
  - `accuracy` vs `val_accuracy`

**Pista**: usa `matplotlib` y a√±ade t√≠tulos, leyenda y ejes correctamente.


In [None]:

# Obtener los valores del historial
loss = history.history['loss']
val_loss = history.history['val_loss']
acc = history.history['accuracy']
val_acc = history.history['val_accuracy']

epochs_range = range(1, len(acc) + 1)

# Gr√°fica de accuracy





# Gr√°fica de p√©rdida







## Secci√≥n 9 ‚Äî Evaluaci√≥n del modelo con im√°genes externas

Usa las siguientes im√°genes de d√≠gitos manuscritos:

N√∫mero 3

N√∫mero 6

Descarga cada imagen desde la URL.

Convi√©rtela a escala de grises y redimensiona a 28√ó28 p√≠xeles.

Normaliza los valores de los p√≠xeles (0‚Äì255 ‚Üí 0‚Äì1).

Ajusta la forma a (1, 28, 28, 1).

Muestra la imagen procesada y la predicci√≥n que hace el modelo.

In [None]:
#Solo ejecute
import numpy as np
import requests
from PIL import Image
from io import BytesIO

# Funci√≥n para cargar y preparar una imagen externa
def preparar_imagen(url):
    # Descargar imagen desde la URL
    response = requests.get(url)
    img = Image.open(BytesIO(response.content)).convert("L")  # escala de grises

    # Redimensionar a 28x28
    img = img.resize((28, 28))

    # Convertir a array y normalizar
    img_array = np.array(img) / 255.0

    # Cambiar forma a (1, 28, 28, 1)
    img_array = np.expand_dims(img_array, axis=(0, -1))

    return img_array, img

# URLs de las im√°genes
urls = [
    "https://raw.githubusercontent.com/adiacla/bigdata/refs/heads/master/numero3.jpg",
    "https://raw.githubusercontent.com/adiacla/bigdata/refs/heads/master/numero2.jpg"
]

for url in urls:
    procesada, original = preparar_imagen(url)

    # Mostrar imagen original
    plt.imshow(original, cmap="gray")
    plt.title("Imagen original")
    plt.axis("off")
    plt.show()

    # Predicci√≥n
    prediccion = modelo.predict(procesada)
    clase_predicha = np.argmax(prediccion)

    print("URL:", url)
    print("El modelo predice que es el n√∫mero:", clase_predicha)
    print("-" * 50)


---

## Entrega y r√∫brica de evaluaci√≥n

**R√∫brica (100 puntos)**:
- Secci√≥n 1: Importaciones y versiones ‚Äî 5 pts
- Secci√≥n 2: Carga de datos y verificaci√≥n ‚Äî 10 pts
- Secci√≥n 3: Preprocesamiento correcto ‚Äî 15 pts
- Secci√≥n 4: Arquitectura bien definida y compilaci√≥n ‚Äî 20 pts
- Secci√≥n 5: Entrenamiento correcto con callbacks ‚Äî 20 pts
- Secci√≥n 6: Evaluaci√≥n y an√°lisis (matriz de confusi√≥n + ejemplos) ‚Äî 20 pts
- Secci√≥n 7: Gr√°ficas de entrenamiento ‚Äî 5 pts
- Secci√≥n 8: Respuesta te√≥rica ‚Äî 5 pts

**Formato de entrega**: sube este notebook con todas las celdas de c√≥digo completadas y `best_model.h5` (si se gener√≥) en el mismo directorio.

Buena suerte üòä
