In [1]:
import tensorflow as tf  # Importar TensorFlow, una biblioteca de aprendizaje automático de código abierto desarrollada por Google.
from tensorflow.keras.models import Sequential  # Importar el modelo secuencial de Keras, una forma de construir modelos de manera secuencial capa por capa.
from tensorflow.keras.layers import Dense, Dropout, LSTM  # Importar capas específicas que serán utilizadas para construir el modelo.

mnist = tf.keras.datasets.mnist  # Cargar el conjunto de datos MNIST. MNIST es un conjunto de datos que contiene imágenes de 28x28 píxeles de dígitos escritos a mano y sus etiquetas.
(x_train, y_train), (x_test, y_test) = mnist.load_data()  # Desempaqueta las imágenes en x_train/x_test y las etiquetas en y_train/y_test.

x_train = x_train/255.0  # Normalizar los datos de entrenamiento dividiendo cada valor de píxel por 255.0, lo que convierte los valores de píxel en el rango [0, 1].
x_test = x_test/255.0  # Normalizar los datos de prueba de la misma manera que los datos de entrenamiento.

print(x_train.shape)  # Imprimir la forma del conjunto de datos de entrenamiento. Esto mostrará el número de muestras y las dimensiones de las imágenes de entrenamiento.
print(x_train[0].shape)  # Imprimir la forma de la primera imagen del conjunto de datos de entrenamiento. Esto mostrará las dimensiones de la primera imagen.


(60000, 28, 28)
(28, 28)


In [3]:
model = Sequential()  # Inicializar un modelo secuencial, que permite apilar capas de manera secuencial.

# Agregar una capa LSTM con 128 unidades de memoria, que recibe datos de entrada con la forma de las dimensiones de x_train, y usa la función de activación 'relu'. 
# La capa devuelve secuencias completas (return_sequences=True) en lugar de solo el último paso de tiempo.
model.add(LSTM(128, input_shape=(x_train.shape[1:]), activation='relu', return_sequences=True))

model.add(Dropout(0.2))  # Agregar una capa de abandono para evitar el sobreajuste. Esto desactiva aleatoriamente el 20% de las unidades de salida durante el entrenamiento.

# Agregar otra capa LSTM con 128 unidades de memoria y activación 'relu'.
model.add(LSTM(128, activation='relu'))

model.add(Dropout(0.1))  # Agregar otra capa de abandono con una tasa de abandono del 10%.

# Agregar una capa densa completamente conectada con 32 unidades y activación 'relu'.
model.add(Dense(32, activation='relu'))

model.add(Dropout(0.2))  # Agregar otra capa de abandono con una tasa de abandono del 20%.

# Agregar una capa densa completamente conectada con 10 unidades (una para cada clase) y activación 'softmax'.
model.add(Dense(10, activation='softmax'))

# Configurar el optimizador Adam con una tasa de aprendizaje de 0.001 y un decaimiento de 1e-6.
opt = tf.keras.optimizers.Adam(learning_rate=0.001, decay=1e-6)

# Compilar el modelo con la función de pérdida 'sparse_categorical_crossentropy', el optimizador configurado anteriormente y la métrica de precisión.
model.compile(
    loss='sparse_categorical_crossentropy',
    optimizer=opt,
    metrics=['accuracy'],
)

# Entrenar el modelo utilizando los datos de entrenamiento (x_train, y_train) durante 3 épocas, con los datos de validación (x_test, y_test) utilizados para la validación.
model.fit(x_train,
          y_train,
          epochs=3,
          validation_data=(x_test, y_test))


Epoch 1/3
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m21s[0m 10ms/step - accuracy: 0.6142 - loss: 1.1153 - val_accuracy: 0.9557 - val_loss: 0.1458
Epoch 2/3
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m42s[0m 23ms/step - accuracy: 0.9508 - loss: 0.1722 - val_accuracy: 0.9650 - val_loss: 0.1166
Epoch 3/3
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m73s[0m 18ms/step - accuracy: 0.9698 - loss: 0.1095 - val_accuracy: 0.9800 - val_loss: 0.0655


<keras.src.callbacks.history.History at 0x187e06366c0>