Cargar y Preprocesar los Datos

Comencemos cargando y preprocesando los datos. Vamos a normalizar los valores de los píxeles para que estén en el rango [0, 1] y a convertir las etiquetas en una representación one-hot.

In [1]:
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# Cargar el conjunto de datos MNIST
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# Preprocesar los datos
X_train = X_train.reshape(-1, 28*28).astype('float32') / 255
X_test = X_test.reshape(-1, 28*28).astype('float32') / 255

# Convertir las etiquetas a one-hot encoding
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

Explicación del Preprocesamiento

1. Cargar los Datos: Usamos `mnist.load_data()` para cargar las imágenes y etiquetas en dos conjuntos: entrenamiento (`X_train`, `y_train`) y prueba (`X_test`, `y_test`).
2. Redimensionar y Normalizar: Redimensionamos cada imagen de 28×28 píxeles a un vector de 784 elementos y normalizamos los valores de los píxeles para que estén en el rango [0, 1].
3. One-Hot Encoding: Convertimos las etiquetas en un formato one-hot, que es necesario para la clasificación multiclase.

Construcción del Modelo

A continuación, construiremos una red neuronal simple con Keras utilizando la clase `Sequential`. La red tendrá dos capas ocultas densas con activación ReLU y una capa de salida con activación Softmax.

In [2]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Crear el modelo
model = Sequential([
    Dense(128, activation='relu', input_shape=(28*28,)),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# Compilar el modelo
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Explicación del Modelo

1. Capas Ocultas: La red tiene dos capas ocultas densas con 128 y 64 neuronas respectivamente. Cada neurona en estas capas aplica la función de activación ReLU a su entrada.
2. Capa de Salida: La capa de salida tiene 10 neuronas, cada una representando una clase de dígito. La función de activación Softmax convierte las salidas en probabilidades.
3. Compilación: Compilamos el modelo utilizando el optimizador Adam y la función de pérdida de entropía cruzada categórica.

 

Entrenamiento del Modelo

Ahora que hemos construido nuestro modelo, es hora de entrenarlo utilizando los datos de entrenamiento. Usaremos el método `fit` de Keras para entrenar el modelo durante 10 épocas.

In [3]:
# Entrenar el modelo
model.fit(X_train, y_train, epochs=10, batch_size=32, validation_split=0.2)

Epoch 1/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 2ms/step - accuracy: 0.8565 - loss: 0.4804 - val_accuracy: 0.9569 - val_loss: 0.1522
Epoch 2/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9652 - loss: 0.1149 - val_accuracy: 0.9662 - val_loss: 0.1066
Epoch 3/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 2ms/step - accuracy: 0.9771 - loss: 0.0758 - val_accuracy: 0.9695 - val_loss: 0.1019
Epoch 4/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9834 - loss: 0.0529 - val_accuracy: 0.9693 - val_loss: 0.1011
Epoch 5/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9870 - loss: 0.0392 - val_accuracy: 0.9728 - val_loss: 0.0955
Epoch 6/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9897 - loss: 0.0312 - val_accuracy: 0.9719 - val_loss: 0.1021
Epoch 7/10
[1m1

<keras.src.callbacks.history.History at 0x2b8a3d72c00>

Explicación del Proceso de Entrenamiento

1. Épocas: El número de épocas determina cuántas veces el modelo verá cada muestra del conjunto de datos de entrenamiento. En este caso, entrenaremos el modelo durante 10 épocas.
2. Batch Size: El tamaño del lote (`batch_size`) determina cuántas muestras se utilizan para calcular el gradiente en cada paso de la actualización de los pesos.
3. Validation Split: Usamos un 20% de los datos de entrenamiento para validación, lo que nos permite monitorear el rendimiento del modelo en un conjunto de datos que no se utiliza para el entrenamiento.

 

Evaluación del Modelo

Después de entrenar el modelo, es importante evaluar su rendimiento en un conjunto de datos que no ha visto antes: el conjunto de prueba. Usaremos el método `evaluate` de Keras para hacer esto.

In [4]:
# Evaluar el modelo en el conjunto de prueba
test_loss, test_acc = model.evaluate(X_test, y_test)
print(f'Test accuracy: {test_acc:.4f}')

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step - accuracy: 0.9727 - loss: 0.1155
Test accuracy: 0.9770


Explicación de la Evaluación

1. Evaluación en el Conjunto de Prueba: Evaluamos el modelo utilizando el conjunto de prueba para obtener una medida de su rendimiento en datos no vistos.
2. Precisión: La precisión (`test_acc`) es la fracción de predicciones correctas realizadas por el modelo en el conjunto de prueba.

 

Este ejercicio te proporciona una comprensión práctica de cómo construir, entrenar y evaluar una red neuronal simple utilizando Keras. Aunque el modelo que hemos construido es básico, los principios son aplicables a modelos más complejos y potentes.