# Módelos de clasificación con Keras

## Introducción

En este laboratorio, aprenderemos cómo usar la biblioteca Keras para construir modelos para problemas de clasificación. Esta vez utilizaremos el popular conjunto de datos MNIST, un conjunto de imágenes.

La base de datos MNIST (abreviatura de Modified National Institute of Standards and Technology database) es una gran base de datos de dígitos escritos a mano, comúnmente utilizada para entrenar diversos sistemas de procesamiento de imágenes. La base de datos también se usa ampliamente para entrenamiento y pruebas en el campo del aprendizaje automático.

La base de datos MNIST contiene 60,000 imágenes de entrenamiento y 10,000 imágenes de prueba de dígitos escritos por estudiantes de secundaria y empleados de la Oficina del Censo de Estados Unidos.

Además, de esta manera podrás comparar cómo se desempeñan las redes neuronales convencionales frente a las redes neuronales convolucionales, que construiremos en el siguiente módulo.

## Objetivos de este cuaderno
* Usar la base de datos MNIST para entrenar diversos sistemas de procesamiento de imágenes
* Construir una red neuronal
* Entrenar y probar la red


In [2]:
import keras
import matplotlib.pyplot as plt

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Input
from keras.utils import to_categorical

La biblioteca Keras incluye de manera conveniente el conjunto de datos MNIST como parte de su API. Puedes consultar otros conjuntos de datos dentro de la biblioteca Keras [aquí](https://keras.io/datasets/)
.

Así que, vamos a cargar el conjunto de datos MNIST desde la biblioteca Keras. El conjunto de datos ya está dividido en un conjunto de entrenamiento y un conjunto de prueba.

In [3]:
# import the data
from keras.datasets import mnist

# read the data
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 0us/step


Verifiquemos el número de imágenes en cada conjunto. Según la documentación del conjunto de datos, deberíamos tener 60,000 imágenes en X_train y 10,000 imágenes en X_test

In [4]:
X_train.shape

(60000, 28, 28)

El primer número en la tupla de salida es la cantidad de imágenes, y los otros dos números representan el tamaño de las imágenes en el conjunto de datos. Por lo tanto, cada imagen tiene 28 píxeles por 28 píxeles.

Vamos a visualizar la primera imagen del conjunto de entrenamiento usando la capa de scripting de Matplotlib.

In [None]:
plt.imshow(X_train[0])

Con las redes neuronales convencionales, no podemos alimentar la imagen como entrada tal cual. Por lo tanto, necesitamos aplanar las imágenes en vectores unidimensionales, cada uno de tamaño 1 x (28 x 28) = 1 x 784.

In [5]:
# flatten images into one-dimensional vector

num_pixels = X_train.shape[1] * X_train.shape[2] # find size of one-dimensional vector

X_train = X_train.reshape(X_train.shape[0], num_pixels).astype('float32') # flatten training images
X_test = X_test.reshape(X_test.shape[0], num_pixels).astype('float32') # flatten test images

Dado que los valores de los píxeles pueden variar de 0 a 255, vamos a normalizar los vectores para que estén entre 0 y 1.

In [None]:
# normalize inputs from 0-255 to 0-1
X_train = X_train / 255
X_test = X_test / 255

Finalmente, antes de empezar a construir nuestro modelo, recuerda que para clasificación necesitamos dividir nuestra variable objetivo en categorías. Para ello usamos la función to_categorical del paquete Keras Utilities.

In [6]:
# one hot encode outputs
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

num_classes = y_test.shape[1]
print(num_classes)

10


## Construye una red Neuronal

In [7]:
## Build a Neural Network

# define classification model
def classification_model():
    # create model

    model = Sequential()
    model.add(Input(shape=(num_pixels,)))
    model.add(Dense(num_pixels, activation='relu'))
    model.add(Dense(100, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))

    # compile model
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
    return model

## Entrena y prueba la red

In [8]:
# build the model
model = classification_model()

# fit the model
model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, verbose=2)

# evaluate the model
scores = model.evaluate(X_test, y_test, verbose=0)

Epoch 1/10
1875/1875 - 6s - 3ms/step - accuracy: 0.7656 - loss: 1.4059 - val_accuracy: 0.8754 - val_loss: 0.5504
Epoch 2/10
1875/1875 - 7s - 4ms/step - accuracy: 0.9122 - loss: 0.3489 - val_accuracy: 0.9391 - val_loss: 0.2371
Epoch 3/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9438 - loss: 0.2081 - val_accuracy: 0.9480 - val_loss: 0.2015
Epoch 4/10
1875/1875 - 5s - 3ms/step - accuracy: 0.9549 - loss: 0.1722 - val_accuracy: 0.9448 - val_loss: 0.2060
Epoch 5/10
1875/1875 - 5s - 3ms/step - accuracy: 0.9634 - loss: 0.1379 - val_accuracy: 0.9622 - val_loss: 0.1698
Epoch 6/10
1875/1875 - 5s - 3ms/step - accuracy: 0.9683 - loss: 0.1223 - val_accuracy: 0.9649 - val_loss: 0.1549
Epoch 7/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9731 - loss: 0.1033 - val_accuracy: 0.9629 - val_loss: 0.1747
Epoch 8/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9735 - loss: 0.1059 - val_accuracy: 0.9610 - val_loss: 0.1728
Epoch 9/10
1875/1875 - 5s - 3ms/step - accuracy: 0.9776 - loss: 0.0904 - val_accuracy: 0.9675 - 

Vamos a imprimir la exactitud (accuracy) y el error correspondiente.

In [10]:
print('Accuracy: {}% \n Error: {}'.format(scores[1], 1 - scores[1]))

Accuracy: 0.9692999720573425% 
 Error: 0.03070002794265747


Ejecutar solo 10 épocas podría tomar más de 20 minutos. Pero disfruta los resultados a medida que se van generando.

A veces, no es posible volver a entrenar tu modelo cada vez que quieres usarlo, especialmente si tienes recursos computacionales limitados y entrenar tu modelo puede tomar mucho tiempo. Por lo tanto, con la biblioteca Keras, puedes guardar tu modelo después del entrenamiento. Para hacer esto, usamos el método save

In [11]:
model.save('classification_model.keras')

Dado que nuestro modelo contiene arreglos multidimensionales de datos, los modelos generalmente se guardan como archivos .keras.

Cuando estés listo para usar tu modelo nuevamente, utiliza la función load_model de keras.saving.

In [12]:
pretrained_model = keras.saving.load_model('classification_model.keras')

## Practice Exercise 1

Crea un modelo de red neuronal con 6 capas densas y compara su exactitud (accuracy)

In [13]:
def classification_model_6layers():
    # create model

    model = Sequential()
    model.add(Input(shape=(num_pixels,)))
    model.add(Dense(num_pixels, activation='relu'))
    model.add(Dense(100, activation='relu'))
    model.add(Dense(100, activation='relu'))
    model.add(Dense(100, activation='relu'))
    model.add(Dense(100, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))


    # compile model
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
    return model

# build the model
model_6layers = classification_model_6layers()

# fit the model
model_6layers.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, verbose=2)

# evaluate the model
scores_6layers = model_6layers.evaluate(X_test, y_test, verbose=0)

print('Accuracy_3_layers: {}% \n Accuracy_6_layers: {}'.format(scores[1], scores_6layers[1]))

Epoch 1/10
1875/1875 - 8s - 4ms/step - accuracy: 0.8978 - loss: 0.4874 - val_accuracy: 0.9403 - val_loss: 0.2096
Epoch 2/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9507 - loss: 0.1768 - val_accuracy: 0.9517 - val_loss: 0.1725
Epoch 3/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9627 - loss: 0.1385 - val_accuracy: 0.9602 - val_loss: 0.1412
Epoch 4/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9694 - loss: 0.1118 - val_accuracy: 0.9665 - val_loss: 0.1318
Epoch 5/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9738 - loss: 0.0979 - val_accuracy: 0.9650 - val_loss: 0.1405
Epoch 6/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9767 - loss: 0.0857 - val_accuracy: 0.9720 - val_loss: 0.1102
Epoch 7/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9796 - loss: 0.0758 - val_accuracy: 0.9739 - val_loss: 0.1215
Epoch 8/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9817 - loss: 0.0695 - val_accuracy: 0.9668 - val_loss: 0.1255
Epoch 9/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9848 - loss: 0.0586 - val_accuracy: 0.9763 - 

## Practica Ejercicio 2

Ahora, carga el modelo guardado anteriormente, entrena el modelo durante 10 épocas adicionales y verifica la exactitud (accuracy).

In [None]:
#load the saved model
pretrained_model = keras.saving.load_model('classification_model.keras')

print("Pre-trained model loaded successufully")

# Further train the loaded model
pretrained_model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, verbose=2)

# evaluate the model
scores_20_epochs = pretrained_model.evaluate(X_test, y_test, verbose=0)
print('Accuracy_10_epochs: {}% \n Accuracy_20_epochs: {}'.format(scores[1], scores_20_epochs[1]))

Pre-trained model loaded successufully
Epoch 1/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9809 - loss: 0.0798 - val_accuracy: 0.9689 - val_loss: 0.1764
Epoch 2/10
1875/1875 - 6s - 3ms/step - accuracy: 0.9816 - loss: 0.0822 - val_accuracy: 0.9749 - val_loss: 0.1497
Epoch 3/10
1875/1875 - 5s - 3ms/step - accuracy: 0.9831 - loss: 0.0815 - val_accuracy: 0.9686 - val_loss: 0.1509
Epoch 4/10
