In [1]:
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten
from tensorflow.keras.utils import to_categorical

# Cargar el conjunto de datos MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Normalizar los datos
x_train = x_train / 255.0
x_test = x_test / 255.0

# Convertir etiquetas a categorías one-hot
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

# Construir el modelo
model = Sequential([
    Flatten(input_shape=(28, 28)),  # Convertir imágenes 2D en vectores 1D
    Dense(128, activation='relu'),  # Primera capa densa con 128 neuronas
    Dropout(0.2),  # Dropout con una tasa de 20%
    Dense(10, activation='softmax')  # Capa de salida con 10 neuronas para las 10 clases
])

# Compilar el modelo
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Entrenar el modelo
model.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test))

# Evaluar el modelo
test_loss, test_acc = model.evaluate(x_test, y_test)

print(f'Test accuracy: {test_acc}')



Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


Epoch 1/5


Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Test accuracy: 0.9735000133514404


MNIST es un conjunto de datos clásico en el campo del aprendizaje automático y la visión por computadora, utilizado frecuentemente para benchmarks y en la educación. Consiste en 70,000 imágenes en escala de grises de dígitos escritos a mano del 0 al 9, con un tamaño de 28x28 píxeles. El conjunto de datos se divide típicamente en 60,000 imágenes para entrenamiento y 10,000 para pruebas. MNIST es ampliamente utilizado por su simplicidad y tamaño manejable, y sirve como un buen punto de partida para experimentar con técnicas de aprendizaje automático y redes neuronales.

En el código proporcionado anteriormente, se realiza el siguiente proceso:

1. **Carga del conjunto de datos MNIST**: se utilizan funciones de Keras para cargar el conjunto de datos MNIST, que ya está dividido en conjuntos de entrenamiento (60,000 imágenes) y pruebas (10,000 imágenes).

2. **Normalización de los datos**: las imágenes se normalizan dividiendo los valores de los píxeles por 255. Esto se hace para convertir los valores de los píxeles de un rango de 0 a 255 a un rango de 0 a 1, lo cual es un paso común en el preprocesamiento de imágenes para modelos de aprendizaje profundo, ayudando a acelerar la convergencia durante el entrenamiento.

3. **Conversión de etiquetas a formato one-hot**: las etiquetas, que son números enteros del 0 al 9, se convierten a un formato one-hot. En este formato, cada etiqueta se representa como un vector de 10 elementos, donde el índice correspondiente al dígito está marcado con un 1 y el resto con 0. Esto es necesario para la clasificación multiclase en Keras.

4. **Construcción del modelo**: se construye un modelo secuencial de Keras que incluye:
   - Una capa `Flatten` para transformar las imágenes 2D (28x28 píxeles) en vectores 1D (784 elementos).
   - Una capa `Dense` con 128 neuronas y función de activación ReLU.
   - Una capa de `Dropout` con una tasa de 20%, lo que significa que el 20% de las neuronas se "apagarán" aleatoriamente durante cada iteración de entrenamiento, ayudando a prevenir el sobreajuste.
   - Una capa `Dense` final con 10 neuronas (una por cada clase de dígito) y función de activación softmax, que se utiliza para la clasificación multiclase y proporciona una distribución de probabilidad sobre las 10 clases de dígitos.

5. **Compilación del modelo**: el modelo se compila con el optimizador `adam` y la función de pérdida `categorical_crossentropy`, que es adecuada para la clasificación multiclase. La precisión (`accuracy`) se utiliza como métrica para evaluar el rendimiento del modelo.

6. **Entrenamiento del modelo**: el modelo se entrena utilizando los datos de entrenamiento con etiquetas one-hot durante 5 épocas, y se valida su rendimiento utilizando el conjunto de datos de prueba.

7. **Evaluación del modelo**: finalmente, se evalúa el modelo en el conjunto de datos de prueba para determinar su precisión, es decir, qué tan bien el modelo puede clasificar imágenes de dígitos no vistos durante el entrenamiento.

Este proceso demuestra cómo implementar una red neuronal básica con dropout para clasificar dígitos escritos a mano, utilizando Keras y el conjunto de datos MNIST.