### Entrenar Modelo con Dataset MNIST (Primera Versión del modelo)

In [1]:
import tensorflow as tf
from tensorflow.keras import layers, models, regularizers

# Cargar MNIST directamente
(x_train, y_train), (x_val, y_val) = tf.keras.datasets.mnist.load_data()

# Normalizar
x_train = x_train.astype('float32') / 255.
x_val = x_val.astype('float32') / 255.

# Redimensionar (se añade una dimensión ya que las cnn esperan 3 dimensiones)
x_train = x_train[..., tf.newaxis]  # (28,28,1)
x_val = x_val[..., tf.newaxis]

# Mostrar cada valor del sudoku (0-9) como un vector de 10 números para el entrenamiento
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_val = tf.keras.utils.to_categorical(y_val, 10)

# Definir el modelo
model = models.Sequential([
    # Primera capa convolucional con 32 filtros, tamaño de kernel 3x3, función de activación ReLU y forma de entrada (28,28,1)
    layers.Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1), kernel_regularizer=regularizers.l2(0.001)),
    layers.BatchNormalization(),
    # Capa de pooling (submuestreo) con tamaño de ventana 2x2 para reducir la dimensionalidad
    layers.MaxPooling2D((2,2)),
    # Segunda capa convolucional con 64 filtros, tamaño de kernel 3x3 y función de activación ReLU
    layers.Conv2D(64, (3,3), activation='relu', kernel_regularizer=regularizers.l2(0.001)),
    layers.BatchNormalization(),
    # Otra capa de pooling con tamaño de ventana 2x2
    layers.MaxPooling2D((2,2)),
    # Aplanar la salida
    layers.Flatten(),
    # Capa densa  con 64 neuronas y función de activación ReLU
    layers.Dense(128, activation='relu', kernel_regularizer=regularizers.l2(0.001)),
    layers.BatchNormalization(),
    # Capa de dropout con una tasa del 50% para prevenir el sobreajuste
    layers.Dropout(0.5),
    # Capa de salida con 10 neuronas (una para cada dígito) y función de activación softmax para clasificación
    layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, validation_data=(x_val, y_val), epochs=15, batch_size=128)

# Guardar el modelo
model.save('modelo_mnist.h5')

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/15
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m22s[0m 41ms/step - accuracy: 0.8972 - loss: 0.6169 - val_accuracy: 0.7656 - val_loss: 0.8698
Epoch 2/15
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 43ms/step - accuracy: 0.9794 - loss: 0.2295 - val_accuracy: 0.9824 - val_loss: 0.1643
Epoch 3/15
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m29s[0m 63ms/step - accuracy: 0.9841 - loss: 0.1524 - val_accuracy: 0.9831 - val_loss: 0.1362
Epoch 4/15
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m30s[0m 63ms/step - accuracy: 0.9861 - loss: 0.1205 - val_accuracy: 0.9889 - val_loss: 0.1024
Epoch 5/15
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m21s[0m 44ms/step - accuracy: 0.9868 - loss: 0.1102 - val_accuracy: 0.9894 - val_loss: 0.1024
Epoch 6/15
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m21s[0m 44ms/step - accuracy: 0.9879 - loss: 0.1056 - val_accuracy: 0.9844 - val_loss: 0.1115
Epoch 7/15
[1m4

