# Modelo de Detección de Dígitos
Juliana Nieto Cárdenas
## Una pequeña red neuronal


In [12]:
from keras.datasets import mnist
from keras import models
from keras import layers
from tensorflow.keras.utils import to_categorical


### Los datos
Cada imagen está representada por una matriz de numpy, de dimensión 28 x 28


In [18]:
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

In [21]:
train_images.shape

(60000, 28, 28)

####  Preparando datos
- A continuación, se realiza un redimesionamiento de los datos, pasando de (28 x 28) a (784)
- También se transforman la columna que contiene la información de cada dígito (qué dígito es de 0 a 9) a datos, es decir se pasa de un dígito a un arreglo de ceros con un 1 en la posición de aquel dígito

In [22]:
train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype('float32') / 255
test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype('float32') / 255

In [24]:
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

## Red Neuronal

Este modelo, es una sencilla red neuronal que cuenta con dos capas. La primera capa recibe la información de los 784 dígitos que codifican una imagen, y la segunda capa indica 10 probabilidades de dicho dígito, siendo la mayor la predicción.
Estas dos capas estan totalmente conectadas, es decir cada neurona de cada capa esta conectada.

In [3]:
network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
network.add(layers.Dense(10, activation='softmax'))

Existen dos elementos claves de una red neuronal
- Loss function: Medida del éxito de nuestras predicciones, en este caso `categorical_crossentropy` la cual es usada donde la salida es más de una categoría (en este caso 10)
- Optimizer: Determina como se va actualizar nuestro modelo de acuerdo a la información entregada por la loss function, en este caso `rmsprop`.

In [4]:
network.compile(optimizer='rmsprop',
loss='categorical_crossentropy',
metrics=['accuracy'])

Ahora, entrenamos el modelo con los 60 mil datos de entrenamiento. El valor de `epochs` significa el número de veces que el modelo "verá" los datos. El valor de `batch_size` es el número de datos a evaluar en cada iteración.

In [14]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fd32b752b90>

Guardamos el modelo en formato `hdf5`

In [15]:
network.save("digit_recogniton.h5")