## Arquitectura basica de una Red Neuronal Artificial

In [1]:
# Paso 1: instalar dependencias
# Paso 2: Importar dependencias
import numpy as np
import datetime
import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist

In [2]:
# Paso 3 : Cargado y pre-procesado de datos
(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

In [3]:
# 3.1 Normalizacion de datos en orden de que queden los valores de los pixeles en rangos de [0,1]
X_train = X_train / 255 # que es el valor maximo que pueden tomar.
X_test = X_test / 255

In [4]:
X_train.shape

(60000, 28, 28)

In [5]:
# 3.2 Redimensionar : Como vamos a utilizar una red neuronal totalmente conectada, vamos a redimensionar los subconjuntos de entrenamiento y testing a formato de vector en lugar de en formato de matriz.
X_train = X_train.reshape(-1, 28*28)
X_train.shape

(60000, 784)

In [6]:
# Paso 4: Construir la Red Neuronal
# 4.1 Definir el modelo
model = tf.keras.models.Sequential()

Hyper-parametros de la capa 

    número de unidades/neuronas: 128
    función de activación: ReLU
    input_shape: (784, ) ↓


In [7]:
# 4.2 Añadir la primera capa (Densa)
model.add(tf.keras.layers.Dense(units=128, activation='relu', input_shape=(784,)))

In [8]:
# 4.3 Añadir capa Droput
#Dropout es una técnica de Regularization donde aleatoriamente se asignan a ciertas neuronas de la red el valor cero. De este modo, mientras se entrena, estas neuronas no actualizarán sus valores. Al tener cierto porcentaje de neuronas sin actualizar, el proceso de entrenamiento toma más tiempo pero por contra tenemos menos posibilidades de sufrir overfitting.
model.add(tf.keras.layers.Dropout(rate=0.2))

In [9]:
# 4.4 Capa de Salida función que retorna la probabilidad de que una imagen sea de una clase especifica
model.add(tf.keras.layers.Dense(units=10, activation='softmax'))

In [11]:
# 4.5 Compilar el modelo
model.compile(optimizer='Adam', loss='sparse_categorical_crossentropy', metrics=['sparse_categorical_accuracy'])

In [12]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 128)               100480    
_________________________________________________________________
dropout (Dropout)            (None, 128)               0         
_________________________________________________________________
dense_1 (Dense)              (None, 10)                1290      
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________


In [13]:
# 4.6 Entrenar el modelo
model.fit(X_train, y_train, epochs=5)

Train on 60000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x1a273549cc8>

In [16]:
# redimensionamos el X_test del mismo modo
X_test = X_test.reshape(-1, 28*28)

# 4.7 Evaluar el modelo
test_loss, test_accuracy = model.evaluate(X_test, y_test)



In [17]:
print('Test Accuracy: {}'.format(test_accuracy))

Test Accuracy: 0.8654999732971191


In [18]:
# Opcional => Guardar el topología del modelo
model_json = model.to_json()
with open("fashion_model.json", "w") as json_file:
    json_file.write(model_json)

# Guardar los pesos del modelo
model.save_weights("fashio_model.h5")