### Entrenar Modelo con Dataset MNIST (Primera Versión del modelo)

In [None]:
import tensorflow as tf
from tensorflow.keras import layers, models, regularizers

# Cargar MNIST directamente
(x_train, y_train), (x_val, y_val) = tf.keras.datasets.mnist.load_data()

# Normalizar
x_train = x_train.astype('float32') / 255.
x_val = x_val.astype('float32') / 255.

# Redimensionar (se añade una dimensión ya que las cnn esperan 3 dimensiones)
x_train = x_train[..., tf.newaxis]  # (28,28,1)
x_val = x_val[..., tf.newaxis]

# Mostrar cada valor del sudoku (0-9) como un vector de 10 números para el entrenamiento
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_val = tf.keras.utils.to_categorical(y_val, 10)

# Definir el modelo
model = models.Sequential([
    # Primera capa convolucional con 32 filtros, tamaño de kernel 3x3, función de activación ReLU y forma de entrada (28,28,1)
    layers.Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1), kernel_regularizer=regularizers.l2(0.001)),
    layers.BatchNormalization(),
    # Capa de pooling (submuestreo) con tamaño de ventana 2x2 para reducir la dimensionalidad
    layers.MaxPooling2D((2,2)),
    # Segunda capa convolucional con 64 filtros, tamaño de kernel 3x3 y función de activación ReLU
    layers.Conv2D(64, (3,3), activation='relu', kernel_regularizer=regularizers.l2(0.001)),
    layers.BatchNormalization(),
    # Otra capa de pooling con tamaño de ventana 2x2
    layers.MaxPooling2D((2,2)),
    # Aplanar la salida
    layers.Flatten(),
    # Capa densa  con 64 neuronas y función de activación ReLU
    layers.Dense(128, activation='relu', kernel_regularizer=regularizers.l2(0.001)),
    layers.BatchNormalization(),
    # Capa de dropout con una tasa del 50% para prevenir el sobreajuste
    layers.Dropout(0.5),
    # Capa de salida con 10 neuronas (una para cada dígito) y función de activación softmax para clasificación
    layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, validation_data=(x_val, y_val), epochs=10, batch_size=128)

# Guardar el modelo
model.save('modelo_mnist.h5')

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/20
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m23s[0m 43ms/step - accuracy: 0.8949 - loss: 0.6245 - val_accuracy: 0.8248 - val_loss: 0.7016
Epoch 2/20
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m23s[0m 50ms/step - accuracy: 0.9787 - loss: 0.2267 - val_accuracy: 0.9879 - val_loss: 0.1499
Epoch 3/20
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m21s[0m 45ms/step - accuracy: 0.9850 - loss: 0.1510 - val_accuracy: 0.9858 - val_loss: 0.1249
Epoch 4/20
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m21s[0m 44ms/step - accuracy: 0.9867 - loss: 0.1204 - val_accuracy: 0.9888 - val_loss: 0.1110
Epoch 5/20
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m25s[0m 53ms/step - accuracy: 0.9872 - loss: 0.1111 - val_accuracy: 0.9886 - val_loss: 0.1079
Epoch 6/20
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m22s[0m 46ms/step - accuracy: 0.9866 - loss: 0.1118 - val_accuracy: 0.9899 - val_loss: 0.0993
Epoch 7/20
[1m4