# Ejemplo de una red convolucional utilizando MNIST

**Autor:** [fchollet](https://twitter.com/fchollet)<br>
**Basado en la versión original:** (https://keras.io/examples/vision/mnist_convnet/)<br>


## Pasos iniciales

In [None]:
import numpy as np
import keras
from keras import layers
import matplotlib.pyplot as plt

## Preparando los datos

In [None]:
# Modelo / parámetros de los datos
num_classes = 10
input_shape = (28, 28, 1)

# Cargamos los datos y los dividimos en entrenamiento y prueba
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

Este Dataset contiene imágenes en arreglos de Numpy de 28x28. Las etiquetas (labels) son un arreglo de enteros, que van de 0 a 9. Estos corresponden a la clase (class) del número que la imagen representa.

```
0	Número 0
1	Número 1
2	Número 2
3	Número 3
4	Número 4
5	Número 5
6	Número 6
7	Número 7
8	Número 8
9	Número 9
```


Cada imagen corresponde a una etiqueta en particular, crearemos el arreglo de clases ya que éste no es proporcionado por el dataset.

In [None]:
class_names = ['cero', 'uno', 'dos', 'tres', 'cuatro',
               'cinco', 'seis', 'siete', 'ocho', 'nueve']

### Exploramos el Dataset

In [None]:
print(x_train.shape)
print(len(y_train))
print(y_train)

In [None]:
print(x_test.shape)
print(len(y_test))

In [None]:
plt.figure()
plt.imshow(x_train[10], cmap="gray")
plt.colorbar()
plt.grid(False)
plt.show()

### Estandarizamos los datos

In [None]:
# Escalamos las imágenes al rango [0, 1]
x_train = x_train.astype("float32") / 255
x_test = x_test.astype("float32") / 255

In [None]:
print(x_train[0])

Vamos a verificar que el conjunto de datos se encuentre en el formato adecuado desplegando las primeras 10 imágenes del *training set* y desplegaremos el nombre de cada clase debajo de la imagen.

In [None]:
plt.figure(figsize=(10,10))
for i in range(10):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(x_train[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[y_train[i]])
plt.show()

In [None]:
# Nos aseguramos que las imágenes tengan la forma (28, 28, 1)
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)
print("x_train shape:", x_train.shape)
print(x_train.shape[0], "train samples")
print(x_test.shape[0], "test samples")


# convertimos los vectores de clases a matrices de clases binarias
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

## Construyendo el modelo

In [None]:
model = keras.Sequential(
    [
        keras.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)

model.summary()

## Train the model

In [None]:
batch_size = 128
epochs = 15

model.compile(loss="categorical_crossentropy", optimizer="adam", metrics=["accuracy"])

model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, validation_split=0.1)

## Evaluando el modelo entrenado

In [None]:
score = model.evaluate(x_test, y_test, verbose=0)
print("Test loss:", score[0])
print("Test accuracy:", score[1])