# Proyecto Final Sistemas Inteligentes (2/2)
### Sistemas Inteligentes 
### Eduardo Vazquez Tuz - A00820409

El proyecto consistió en entrenar una red neuronal artificial con el propósito de reconocer dígitos escritos a mano. El dataset usado fue el Modified National Instrument Standards and Technology database (**MNIST**), el cuál consiste de 70,000 imágenes (60,000 de entrenamiento, 10,000 de prueba) de dígitos escritos a mano. El dataset fue accesado a través de la [interfaz de datasets provista por el API de Keras](https://www.tensorflow.org/api_docs/python/tf/keras/datasets/mnist/load_data). 
MNIST fue usado bajo los términos de la licencia [Creative Commons](https://creativecommons.org/licenses/by-sa/3.0/) bajo la cuál se encuentra registrado. 

Para facilitar la interpretación se dividió el proyecto en dos libretas; esta libreta comprende implementación del modelo. Para analizar el entorno de ejecución refiérase a [https://colab.research.google.com/drive/1QbGSDag2Ij1mi2twULkIv6iKmjxcOBvC?usp=sharing](esta libreta de Google Colab)

In [None]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from keras.utils import np_utils
import os

In [None]:
#descargando el dataset a través de Keras
(train_data, train_labels), (test_data, test_labels) = tf.keras.datasets.mnist.load_data()

In [None]:
print("Train_data shape", train_data.shape)
print("Train_label shape", train_labels.shape)
print("Test_data shape", test_data.shape)
print("Test_label shape", test_labels.shape)

In [None]:
#convirtiendo los datos a arreglos de vectores unidimensionales

train_data = train_data.reshape(60000, 784)
test_data = test_data.reshape(10000, 784)
train_data = train_data.astype('float32')
test_data = test_data.astype('float32')

#normalizando los sets

train_data = train_data/255
test_data = test_data/255

#un dato de salida como ejemplo
train_data[0]

In [None]:
#imprimiendo las etiquetas 
print(np.unique(train_labels, return_counts=True))

In [None]:
#convirtiendo las etiquetas a datos categoricos

#n = 10 es el número de clases
train_labels = np_utils.to_categorical(train_labels,10)
test_labels = np_utils.to_categorical(test_labels, 10)

In [None]:
#definiendo la arquitectura del modelo 

model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(512, input_shape=(784,)))
model.add(tf.keras.layers.Activation('relu'))
model.add(tf.keras.layers.Dropout(0.2))

model.add(tf.keras.layers.Dense(512))
model.add(tf.keras.layers.Activation('relu'))
model.add(tf.keras.layers.Dropout(0.2))

model.add(tf.keras.layers.Dense(10))
model.add(tf.keras.layers.Activation('softmax'))

#imprimiendo los detalles del modelo
model.summary()

In [None]:
#compilando y entrenando
model.compile(loss='categorical_crossentropy', metrics=['accuracy','mse'], optimizer='adam')
history = model.fit(train_data, train_labels, batch_size=128, epochs=20, validation_data=(test_data,test_labels))

In [None]:
#ploteando las metricas

fig = plt.figure(figsize=(20,15))
plt.subplot(2,1,1)
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('Accuracy')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc = 'lower right')


plt.subplot(2,1,2)
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('Loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc= 'upper right')

plt.tight_layout()
fig.show()

In [None]:
#almacenando el modelo

dir_name = './proyecto_mnist.h5'
model.save(dir_name)
print("Salvado en " + dir_name)

In [None]:
#comprobando que todo esté bien 

test_model = tf.keras.models.load_model(dir_name)
metricas = test_model.evaluate(test_data, test_labels)