<a href="https://colab.research.google.com/github/AlexRodriguezVillavicencio/DataScience-curriculum/blob/main/tensorflow/RNA.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Importamos las dependencias necesarias

In [3]:
import tensorflow as tf
import numpy as np
import datetime
from tensorflow.keras.datasets import fashion_mnist

### Preprocesamos los datos

In [12]:
(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

Se divide cada imagen en los conjuntos de entrenamiento y de testing entre el valor máximo de cada uno de los píxeles (255). De este modo, cada píxel se hallará en el rango [0,1]. Al normalizar las imágenes, nos aseguramos que nuestro modelo RNA se entrenará más rápido.

In [13]:
X_train = X_train / 255.0
X_test = X_test / 255.0

Como vamos a utilizar una red neuronal totalmente conectada, vamos a redimensionar los subconjuntos de entrenamiento y testing a formato de vector en lugar de formato de matriz.

In [15]:
# aplanamos en un vector de 784 elementos
print(X_train.shape)
# flattening
X_train = X_train.reshape(-1,28*28)
print(X_train.shape)

(60000, 28, 28)
(60000, 784)


### Definimos el modelo

In [25]:
model = tf.keras.models.Sequential()

# full conection
# units: números de neuronas
# activation: función de activación
# input_shape: número de entradas
model.add(tf.keras.layers.Dense(units=128, activation='relu', input_shape=(784,)))

Añadimos también una capa de Dropout. Que es una técnica de regularización donde aleatoriamente se asignan a ciertas neuronas de la red al valor `cero`. De este modo, mientras se entrenan, estas neuronas no actualizarán sus valores. Al tener cierto valor de neuronas sin actualizar, el procesos de entrenamiento tomás tiempo pero por contra tenemos menos posibilidades de sufrir `overfitting`.

In [26]:
model.add(tf.keras.layers.Dropout(0.2))

Añadimos la segunda capa

In [27]:
# capa de salida
model.add(tf.keras.layers.Dense(units=10,activation='softmax'))

Compilamos el modelo

In [32]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['sparse_categorical_accuracy'])

model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_3 (Dense)             (None, 128)               100480    
                                                                 
 dropout_3 (Dropout)         (None, 128)               0         
                                                                 
 dense_4 (Dense)             (None, 10)                1290      
                                                                 
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________


### Entrenamos el model

In [34]:
model.fit(X_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f10123d5f40>

### Evaluación del modelo y predicción

In [41]:
X_test = X_test.reshape(-1,28*28)

In [42]:
test_loss, test_accuracy  = model.evaluate(X_test,y_test)

print(f"test acurracy: {test_accuracy}")
print(f"test loss: {test_loss}")

test acurracy: 0.878000020980835
test loss: 0.33840855956077576


### Guardamos el modelo

In [44]:
#guardar la arquitectura (topología) de la red neuronal
model_json = model.to_json()
with open("fahsion_model.json","w") as json_file:
  json_file.write(model_json)

### Guardamos los pesos de la red neuronal

In [45]:
model.save_weights("fashion_model.h5")