# Introducción al Deep Learning con Python || Edna Cruz Flores

8VO FORO NACIONAL DE SOFTWARE LIBRE 2021 - ITSNa

Jueves. 24 de junio, 2021

Implementación de una red neurnal artificial sencilla con el conjunto de datos  MNIST (Modified National Institute of Standards and Technology).

El módulo tf.keras.datasets proporciona algunos conjuntos de datos como MNIST. Contiene ejemplos de imágenes de números del 0 hasta el 9 escritos a mano.

![picture](https://upload.wikimedia.org/wikipedia/commons/2/27/MnistExamples.png)


## Cargar bibliotecas

In [None]:
from keras.datasets import mnist
import matplotlib.pyplot as plt
import numpy as np

from keras.models import Sequential
from keras.layers import Dense, Activation, Dropout
from tensorflow.keras.utils import to_categorical
from keras.utils.vis_utils import plot_model
from PIL import Image
from keras.preprocessing.image import load_img
from keras.preprocessing.image import img_to_array

## Carga y división del conjunto de datos




*   Conjunto de entrenamiento: Un subconjunto para entrenar un modelo.
*   Conjunto de prueba: Un subconjunto para probar el modelo entrenado.




In [None]:
# Descargar el conjunto de datos MNIST en un subconjunto de prueba y de entrenamiento.
(trainX, trainy), (testX, testy) = mnist.load_data()

In [None]:
# Dimensiones de los subconjuntos de datos
print('Conjunto de datos de entrenamiento: X=%s, y=%s\n' % (trainX.shape, trainy.shape))
print('Conjunto de datos de prueba: X=%s, y=%s\n' % (testX.shape, testy.shape))
# Graficar una submuestra del conjunto de datos
for i in range(9):
	# Definir el gráfico
	pyplot.subplot(330 + 1 + i)
	pyplot.imshow(trainX[i], cmap=pyplot.get_cmap('gray'))
# Mostrar el gráfico final
pyplot.show()

## Preprocesamiento de los datos

In [None]:
# Cálculo del número de clases desde el conjunto de entrenamiento
num_labels = len(np.unique(trainy))
print('Número de clases: ', num_labels)

Reajuste de las dimensiones de las matrices en ambos subconjuntos de datos. Los datos deben estar en tensores para que puedan ser recibidos como entrada por una red neuronal artificial. Para ello las matrices de pixeles se transformarán a vectores de 784 , siendo el resultado de la transformación de las matrices con dimensión de 28x28

In [None]:
# image dimensions (assumed square)
image_size = trainX.shape[1]
input_size = image_size * image_size
input_size

In [None]:
trainX = np.reshape(trainX, [-1, input_size])
testX = np.reshape(testX, [-1, input_size])

In [None]:
#Nuevas dimensiones del las matrices de pixeles de las imágenes
# Dimensiones de los subconjuntos de datos
print('Conjunto de datos de entrenamiento: X=%s, y=%s\n' % (trainX.shape, trainy.shape))
print('Conjunto de datos de prueba: X=%s, y=%s\n' % (testX.shape, testy.shape))

In [None]:
#Transformación a vectores binarios (one-hot encoding) las etiquetas los conjuntos de datos
trainY = to_categorical(trainy)
testY = to_categorical(testy)

Observemos el vector binario de la primer imágen en el conjunto de datos de prueba.

In [None]:
testY[0]

Observemos la etiqueta sin vector binario del conjunto de datos de prueba

In [None]:
testy[0]

Normalización de los valores de pixeles en ambos conjuntos de datos que contienen valores desde 0 hasta 255 a un rango de 0 a 1.

In [None]:
# primero se convierten a valores punto flotante
trainX_norm = trainX.astype('float32')
testX_norm = testX.astype('float32')
# Normalización de los valores de los pixeles a un rango entre 0 y 1
trainX_norm = trainX_norm / 255.0
testX_norm = testX_norm / 255.0

## Hiper parámetros de la red neurnal artificial

Los hiperparámetros de un modelo son los valores de las configuraciones utilizadas durante el proceso de entrenamiento.

Los parámetros son las variables que se estiman durante el proceso de entrenamiento con los conjuntos de datos.



*   Batch size es el número de ejemplos que se pasan al algoritmo en cada iteración de aprendizaje.
*   Dropout es una técnica de regularización para reducir el sobreajuste en redes neuronales artificiales.



In [None]:
batch_size = 128
hidden_units = 256
dropout = 0.45
no_epochs = 20

## Definición del modelo

In [None]:
model = Sequential()
model.add(Dense(hidden_units, input_dim=input_size))
model.add(Activation('relu'))
model.add(Dropout(dropout))
model.add(Dense(hidden_units))
model.add(Activation('relu'))
model.add(Dropout(dropout))
model.add(Dense(num_labels))
model.add(Activation('softmax'))

model.summary()

In [None]:

model.compile(loss='categorical_crossentropy', 
              optimizer='adam',
              metrics=['accuracy'])

In [None]:
plot_model(model, to_file='MyFistrNeuralNetwork_MNIST.png', show_shapes=True, show_layer_names=True)
display(Image.open('MyFistrNeuralNetwork_MNIST.png'))

In [None]:
model_history = model.fit(trainX, trainY, epochs=no_epochs, batch_size=batch_size,  validation_data=(testX, testY))

In [None]:
loss, acc = model.evaluate(testX, testY, batch_size=batch_size)
print("\nExactitud sobre el conjunto de prueba: %.1f%%" % (100.0 * acc))

In [None]:
# Plot training & validation accuracy values
fig, ax = plt.subplots(figsize=(7,5)) 
plt.plot(model_history.history['accuracy'],'b')
plt.plot(model_history.history['val_accuracy'],'r')
plt.title('Curvas de aprendizaje del accuracy')
plt.ylabel('Accuracy')
plt.xlabel('Epoch')
plt.legend(['Train', 'Test'], loc='lower right')
plt.show()

# Plot training & validation loss values
fig, ax = plt.subplots(figsize=(7,5)) 
plt.plot(model_history.history['loss'],'b')
plt.plot(model_history.history['val_loss'],'r')
plt.title('Curvas de aprendizaje de loss function')
plt.ylabel('Loss')
plt.xlabel('Epochs')
plt.legend(['Train', 'Test'], loc='upper right')
plt.show()

## Predicciones

Y, ¿qué es lo que sigue...?

¡Probarlo con datos reales!

Importamos una imagen desde un link de algún repositorio y guardamos el nombre en una variable

In [None]:
#Carga datos locales
from google.colab import files
uploaded = files.upload()

In [None]:
imagename = "sample_8real.png"

In [None]:
# Se carga la imagen, se aplica espala de grises y un resize a 28 x 28
sample = load_img(imagename, grayscale=True, target_size=(28, 28))
# Los pixeles de la imagen se pasan a una matriz
sample = img_to_array(sample)
# se redimensiona a un vector de 1 x 784
sample = sample.reshape(1, 784)
# se procesa el vector para entrar al modelo
sample = sample.astype('float32')
sample = sample / 255.0

In [None]:
prediction = model.predict_classes(sample)
print("\nPredicción de la imagen de entrada:  ",prediction[0],"\n")