Este código importa el dataset MNIST desde keras.datasets y lo carga, dividiendo los datos en conjuntos de entrenamiento (train_images, train_labels) y prueba (test_images, test_labels). MNIST es un conjunto de datos que contiene imágenes de dígitos escritos a mano del 0 al 9

In [2]:
from tensorflow.keras.datasets import mnist

(train_images, train_labels), (test_images,test_labels) = mnist.load_data()

Este código crea una red neuronal secuencial con dos capas densamente conectadas:

- La primera capa tiene 512 neuronas con función de activación ReLU y espera una entrada de tamaño 28*28
- La segunda capa tiene 10 neuronas (una por cada dígito 0-9) con función de activación softmax para la clasificación

In [3]:
from keras import models
from keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation = 'relu', input_shape = (28*28,)))
network.add(layers.Dense(10, activation = 'softmax'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Este código se usa típicamente para problemas de clasificación multiclase, donde:

1. 'rmsprop' es el optimizador que ajusta los pesos de la red durante el entrenamiento
2. 'categorical_crossentropy' como función de pérdida es específica para problemas donde:
    - Tienes múltiples categorías (más de dos clases)
    - Tus etiquetas están codificadas en one-hot encoding (por ejemplo: [0,1,0,0] para representar la clase 2 de 4 posibles)
3. 'accuracy' como métrica mide el porcentaje de predicciones correctas

In [4]:
network.compile(optimizer = 'rmsprop', loss = 'categorical_crossentropy', metrics = ['accuracy'])

Este código está realizando el preprocesamiento de datos para imágenes, específicamente:

- Reshape de las imágenes
- Normalización de los datos

In [5]:
train_images = train_images.reshape((60000, 28*28))
train_images = train_images.astype('float32')/255

test_images = test_images.reshape((10000, 28*28))
test_images = test_images.astype('float32')/255

In [6]:
from tensorflow.keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

Se entrena el modelo

In [7]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Epoch 1/5
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 7ms/step - accuracy: 0.8728 - loss: 0.4405
Epoch 2/5
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 6ms/step - accuracy: 0.9656 - loss: 0.1166
Epoch 3/5
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 6ms/step - accuracy: 0.9785 - loss: 0.0742
Epoch 4/5
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 6ms/step - accuracy: 0.9843 - loss: 0.0530
Epoch 5/5
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 6ms/step - accuracy: 0.9894 - loss: 0.0364


<keras.src.callbacks.history.History at 0x23c54402d40>

Se evalua el modelo

In [8]:
test_loss,test_acc = network.evaluate(test_images, test_labels)
print("test_acc: ", test_acc)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.9777 - loss: 0.0726
test_acc:  0.9811000227928162
