# Importación librerías

In [1]:
import numpy as np
import datetime
import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist

# Pre procesado de los datos

In [5]:
# Carga del dataset

(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


## Normalización de las imagenes

Se divide cada imagen en los conjuntos de entrenamiento y de testing entre el valor máximo de cada uno de los píxeles (255).

De este modo, cada píxel se allará en el rango [0, 1]. Al normalizar las imágenes, nos aseguramos que el modelo de RNA entrenará de forma mas eficiente

In [7]:
X_train = X_train / 255.0

In [8]:
X_test = X_test / 255.0

## Redimensionar el dataset

Al tratarse de una red neuronal totalmente conectada, se procede a redimensionar los subconjuntos de entrenamiento y de testing a formato de vector en vez de formato de matriz

In [9]:
#Como cada imagen tiene 28x28 píxeles, usamos la función reshape en todo el dataset de entrenamiento para convertirlo 
#en vectores de tamaño [-1 (todos los elementos), anchura * altura]

X_train = X_train.reshape(-1, 28*28)

In [10]:
X_train.shape

(60000, 784)

In [11]:
#Redimensionamos el conjunto de testing del mismo modo

X_test = X_test.reshape(-1, 28*28)

In [12]:
X_test.shape

(10000, 784)

# Construcción de la Red Neuronal Artificial

## Definición del modelo

In [26]:
model = tf.keras.models.Sequential()

## Añadir la primera capa totalmente conectada

In [27]:
model.add(tf.keras.layers.Dense(units = 128, activation = 'relu', input_shape = (784, )))

## Añadir una capa de Dropout

Dropout es una técnica de Regularization donde aleatoriamente se asignan a ciertas neuronas de la red el valor cero. De este modo, mientras se entrena, estas neuronas no actualizarán sus valores. Al tener cierto porcentaje de neuronas sin actualizar, el proceso de entrenamiento toma más tiempo pero por contra tenemos menos posibilidades de sufrir overfitting.

In [28]:
model.add(tf.keras.layers.Dropout(0.2))

## Añadir la capa de salida

- Unidades: número de clases (10 en el caso del Fashion MNIST)
- Función de activación: 'softmax' (probabilidades de cada clase)

In [29]:
model.add(tf.keras.layers.Dense(units=10, activation='softmax'))

## Compilar el modelo

- Optimizer: Adam
- Loss: Sparse softmax (categorical) crossentropy 

In [30]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['sparse_categorical_accuracy'])

In [31]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_7 (Dense)              (None, 128)               100480    
_________________________________________________________________
dropout (Dropout)            (None, 128)               0         
_________________________________________________________________
dense_8 (Dense)              (None, 10)                1290      
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________
