# Actividad de cátedra 5: Batch Normalization
### Basado en la Tarea 1

Profesor de Cátedra: Pablo Estévez<br>
Profesor Auxiliar: Ignacio Reyes<br>
Ayudantes: Francisca Cona, Jhon Intriago, Pablo Montero, Óscar Pimentel, Esteban Reyes, Mauricio Romero

## Imports

In [25]:
import numpy as np
import tensorflow as tf

import itertools
import warnings
from sklearn.metrics import confusion_matrix as sk_conf_mat

# Se imprime la version de Tensorflow
print('Tensorflow version', tf.__version__)
# Se imprime si es que se esta utilizando GPU o no
device_name = tf.test.gpu_device_name()
if device_name != '/device:GPU:0':
    warnings.warn('GPU device not found')
else:
    print('Found GPU at: {}'.format(device_name))

Tensorflow version 2.3.1




## Preparación de la base de datos MNIST

In [26]:
BATCH_SIZE = 8

mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

x_train = x_train.astype(np.float32) / 255.0
x_test = x_test.astype(np.float32) / 255.0

y_train = y_train.astype(np.float32)
y_test = y_test.astype(np.float32)

training_dataset = tf.data.Dataset.from_tensor_slices(
    (x_train, y_train)).shuffle(buffer_size=1024).batch(BATCH_SIZE)
test_dataset = tf.data.Dataset.from_tensor_slices(
    (x_test, y_test)).shuffle(buffer_size=1024).batch(BATCH_SIZE)

## Definición de Clasificador MLP

In [27]:
mlp = tf.keras.Sequential()
mlp.add(tf.keras.layers.Flatten())
mlp.add(tf.keras.layers.BatchNormalization())
mlp.add(tf.keras.layers.Dense(300, activation="relu"))
mlp.add(tf.keras.layers.BatchNormalization())
mlp.add(tf.keras.layers.Dense(100, activation="relu"))
mlp.add(tf.keras.layers.BatchNormalization())
mlp.add(tf.keras.layers.Dense(10))

mlp.build(input_shape=(None, 28, 28))
mlp.summary()

Model: "sequential_2"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
flatten_2 (Flatten)          (None, 784)               0         
_________________________________________________________________
batch_normalization_6 (Batch (None, 784)               3136      
_________________________________________________________________
dense_6 (Dense)              (None, 300)               235500    
_________________________________________________________________
batch_normalization_7 (Batch (None, 300)               1200      
_________________________________________________________________
dense_7 (Dense)              (None, 100)               30100     
_________________________________________________________________
batch_normalization_8 (Batch (None, 100)               400       
_________________________________________________________________
dense_8 (Dense)              (None, 10)               

## Entrenamiento de MLP

In [28]:
loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
optimizer = tf.keras.optimizers.SGD(learning_rate=0.01)
mlp.compile(optimizer, loss, metrics=['accuracy'])

In [29]:
mlp.fit(
    training_dataset, 
    epochs=10,
    steps_per_epoch=200,
    validation_data=test_dataset,
    validation_freq=1,
    callbacks=[tf.keras.callbacks.TensorBoard('./logs/yes_1_bn', update_freq=100)]
)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x19deac1c250>

In [35]:
%reload_ext tensorboard

In [None]:
tensorboard --logdir=logs --host localhost --port 6006

In [None]:
%tensorboard --logdir logs

In [None]:
#%tensorboard --logdir=.

In [None]:
ls

# Instrucciones:
* Entrene la MLP sin batch normalization que se entrega en el código actual.
* Agregue 3 capas de batch normalization, cada una de ellas justo antes de cada capa fully-connected. Puede instanciar dicha capa con el comando tf.keras.layers.BatchNormalization()
* Modifique el directorio donde se guardan los logs de tensorboard para evitar escribir múltiples logs en la misma carpeta.
* Lance tensorboard y compare ambos entrenamientos.

# Preguntas
* ¿En qué caso se obtiene un mejor modelo?
* ¿Cómo cambian las curvas de aprendizaje?

# Entrega
* Entregue sus resultados y análisis en formato pdf.
* Inserte una captura de pantalla con las curvas de aprendizaje de tensorboard.
* Inserte una captura de pantalla con los grafos ambos modelos mostrados en tensorboard.

Nota: El "epoch" indicado en tensorboard corresponde a 200 iteraciones, no a una pasada completa por el dataset. Esto se configuró así para forzar al callback de keras a capturar métricas de validación de forma más seguida.
