# Paso 1: Instalar Dependencias y Configurar Entorno de GPU 
### Imagen de:
https://www.kaggle.com/datasets/zalando-research/fashionmnist

#### Labels
Each training and test example is assigned to one of the following labels:

- 0 T-shirt/top
- 1 Trouser
- 2 Pullover
- 3 Dress
- 4 Coat
- 5 Sandal
- 6 Shirt
- 7 Sneaker
- 8 Bag
- 9 Ankle boot

# Paso 2: Importar las dependencias necesarias para el proyecto.

In [335]:
import numpy as np
import datetime
import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist

In [336]:
tf.__version__

'2.16.1'

# Paso 3: Preporcesado de datos

In [337]:
# Cargar el dataset Fashion Mnist 
(x_train, y_train), (x_test, y_test) =  fashion_mnist.load_data()

In [338]:
x_test

array([[[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       ...,

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 

### Normalizar los datos

Se divide cada imagen en los conjuntos de entrenamiento y testing entre el valor máximo de cada uno de los pixeles (255).
De este modo cada pixel se hallará en el rango entre [0,1]. Al normalizar las imagenes, nos aseguramos que nuestro modelo de RNA entrenará más rapidamente.

In [339]:
x_train = x_train/255.0
x_test = x_test/255.0

### Redimensionar el dataset
Como vamos a utilizar una red neuronal totalmente conectada, vamos a redimensionar los subconjuntos de entrenamiento y de testing a formato de vector en lugar de formato de matriz.

In [340]:
# Como cada imagen tiene 28x28 pixeles, usamos la función reshape en todo el dataset de entrenamiento para convertirlo 
# en vectores de tamaño [-1 (todos los elementos), ancho * altura]
x_train = x_train.reshape(-1, 28*28)

In [341]:
x_train.shape

(60000, 784)

In [342]:
# Redimensionamos el conjunto de testing del mismo modo
x_test = x_test.reshape(-1, 28*28)

# Paso 4: Construir la Red Neuronal Artificial

**Definir el modelo**

Simplemente se define un objeto de modelo Sequential

In [343]:
model = tf.keras.models.Sequential()

** Añadir la primera capa (Capa Densa)**

Hyper-parametros de la capa:

- Número de unidades/neuronas: 128
- Función de activación: Relu
- input_shape: (784,)

In [344]:
model.add(tf.keras.layers.Dense(units=128, activation='relu', input_shape=(784, )))
# Segunda midificación
# - Añade más capas ocultas more hidden layers
# Resultado => test loss: 0.36831656098365784, test accuracy: 0.8680999875068665
# model.add(tf.keras.layers.Dense(units=128, activation='relu', input_shape=(784, )))

**Añadir una capa de dropout**

Dropout es una técnica de regularización dónde aleatoriamente se asignan a ciertas neuronas de la red el valor de cero. De este modo, mientras se entrena, estás neuronas no actualizarán sus valores. Al tener cierto porcentaje de neuronas sin actualizar, el proceso de entrenamiento toma más tiempo, pero por contra tenemos menos posibilidad de sufrir overfitting

In [345]:
# Cuarta modificación:
# ratios de aprendizaje
# tf.keras.layers.Dropout(0.1) => resultado test loss: 0.35824349522590637, test accuracy: 0.8716999888420105
# tf.keras.layers.Dropout(0.3) => resultado test loss: 0.38459134101867676, test accuracy: 0.8597000241279602
# tf.keras.layers.Dropout(0.5) => resultado test loss: 0.3811980187892914, test accuracy: 0.8618000149726868
model.add(tf.keras.layers.Dropout(0.2))

**Añadir la segunda capa de salida (Capa de Salida)**
- unidades == número de clases (10 en el caso de fashion MNIST)
- función de activación='softmax'

In [346]:
# Quinta modificación para el ejericio:
# Cambia las funciones de activación.
# model.add(tf.keras.layers.Dense(units=10, activation='linear')) resultado => test loss: 2.30259108543396, test accuracy: 0.11909999698400497
# model.add(tf.keras.layers.Dense(units=10, activation='gelu')) resultado => test loss: 2.303168535232544, test accuracy: 0.12489999830722809
# model.add(tf.keras.layers.Dense(units=10, activation='hard_sigmoid')) resultado => test loss: 2.30259108543396, test accuracy: 0.10000000149011612
# model.add(tf.keras.layers.Dense(units=10, activation='selu')) resultado => test loss: 2.30259108543396, test accuracy: 0.16580000519752502
# model.add(tf.keras.layers.Dense(units=10, activation='sigmoid')) resultado => test loss: 0.35398903489112854, test accuracy: 0.8755999803543091
# model.add(tf.keras.layers.Dense(units=10, activation='tanh')) resultado => test loss: 2.30259108543396, test accuracy: 0.09960000216960907

model.add(tf.keras.layers.Dense(units=10, activation='softmax'))

### Compilar el modelo

- Optimizer: Adam
- Loss: Sparse softmax (categorical) crossentropy

In [347]:
# Tercera modificación para el ejrcicio:
# - Juega con el método de optimización
# Los optimizers están en tf.keras.optimizers
# tf.keras.optimizers.RMSprop, resultado => test loss: 0.40532565116882324, test accuracy: 0.8675000071525574
# tf.keras.optimizers.Adadelta resultado => test loss: 1.2366349697113037, test accuracy: 0.6489999890327454
# tf.keras.optimizers.Adamax resultado => test loss: 0.375081866979599, test accuracy: 0.8672999739646912
# tf.keras.optimizers.AdamW resultado => test loss: 0.3649269640445709, test accuracy: 0.8684999942779541
# tf.keras.optimizers.SGD resultado => test loss: 0.4408734440803528, test accuracy: 0.8464999794960022
model.compile(optimizer='Adam', loss='sparse_categorical_crossentropy', metrics=['sparse_categorical_accuracy'])

In [348]:
model.summary()

### Entrenar el modelo

In [349]:
# Primera modificación para el ejercicio:
# - Intenta entrenar la red neuronal con más epochs.
# model.fit(x_train, y_train, epochs=10)
# Resultado => test loss: 0.3399134874343872, test accuracy: 0.8878999948501587
model.fit(x_train, y_train, epochs=5)

Epoch 1/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 774us/step - loss: 0.6747 - sparse_categorical_accuracy: 0.7672
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 755us/step - loss: 0.4148 - sparse_categorical_accuracy: 0.8499
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 761us/step - loss: 0.3683 - sparse_categorical_accuracy: 0.8663
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 756us/step - loss: 0.3499 - sparse_categorical_accuracy: 0.8709
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 787us/step - loss: 0.3261 - sparse_categorical_accuracy: 0.8818


<keras.src.callbacks.history.History at 0x28a1c1310>

### Evaluación del modelo y predicción

In [350]:
test_loss, test_accuracy = model.evaluate(x_test, y_test)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 321us/step - loss: 0.3496 - sparse_categorical_accuracy: 0.8735


In [351]:
print("test loss: {0}, test accuracy: {1}".format(test_loss, test_accuracy))

test loss: 0.3537346422672272, test accuracy: 0.8730000257492065


# Paso 5: Guardar el modelo

**Guardar la arquitectura (topologia) de la red neuronal**

In [352]:
model_json = model.to_json()
with open("fashion_model.json", "w") as json_file:
    json_file.write(model_json)

**Guarda los pesos de la red neuronal**

In [353]:
model.save_weights(filepath="fashion_model.weights.h5")