In [None]:
# Python ≥3.5 is required
import sys
assert sys.version_info >= (3, 5)

# Scikit-Learn ≥0.20 is required
import sklearn
assert sklearn.__version__ >= "0.20"

try:
    # %tensorflow_version only exists in Colab.
    %tensorflow_version 2.x
except Exception:
    pass

# TensorFlow ≥2.0 is required
import tensorflow as tf
assert tf.__version__ >= "2.0"

# Common imports
import numpy as np
import os

# to make this notebook's output stable across runs
np.random.seed(42)

# To plot pretty figures
%matplotlib inline
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.rc('axes', labelsize=14)
mpl.rc('xtick', labelsize=12)
mpl.rc('ytick', labelsize=12)

# Where to save the figures
PROJECT_ROOT_DIR = "."
CHAPTER_ID = "ann"
IMAGES_PATH = os.path.join(PROJECT_ROOT_DIR, "images", CHAPTER_ID)
os.makedirs(IMAGES_PATH, exist_ok=True)

def save_fig(fig_id, tight_layout=True, fig_extension="png", resolution=300):
    path = os.path.join(IMAGES_PATH, fig_id + "." + fig_extension)
    print("Saving figure", fig_id)
    if tight_layout:
        plt.tight_layout()
    plt.savefig(path, format=fig_extension, dpi=resolution)

# Ignore useless warnings (see SciPy issue #5998)
import warnings
warnings.filterwarnings(action="ignore", message="^internal gelsd")

In [None]:
from tensorflow import keras

In [None]:
# Utilizar o Dataset CIFAR10: https://www.cs.toronto.edu/~kriz/cifar.html
# Está disponível nos datasets do Keras: https://keras.io/api/datasets/
# Criar os conjuntos de treino, validação e teste

(X_train_full, y_train_full), (X_test, y_test) = keras.datasets.cifar10.load_data()

y_train_full = y_train_full.squeeze()
y_test = y_test.squeeze()

X_train = X_train_full[5000:]
y_train = y_train_full[5000:]
X_valid = X_train_full[:5000]
y_valid = y_train_full[:5000]

class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']


In [None]:
# Confirme o número de elementos de cada conjunto

# Confirme a dimensão dos tensores que armazenam os dados dos exemplos e das labels


In [None]:
# Ver alguns exemplos

n_rows = 4
n_cols = 5
plt.figure(figsize=(n_cols * 1.2, n_rows * 1.2))
for row in range(n_rows):
    for col in range(n_cols):
        index = n_cols * row + col
        plt.subplot(n_rows, n_cols, index + 1)
        plt.imshow(X_train[index])
        plt.axis('off')
        plt.title(class_names[y_train[index]], fontsize=12)
plt.subplots_adjust(wspace=0.2, hspace=0.5)
save_fig('cifar10_plot', tight_layout=False)
plt.show()

In [None]:
keras.backend.clear_session()
tf.random.set_seed(42)
np.random.seed(42)

In [None]:
# Criar uma Rede Neuronal com a seguinte arquitetura
# 20 camadas escondidas com 100 neuronios cada
# Inicialização de pesos He
# Funções de ativação: Elu e Softmax (última camada)

model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32, 32, 3]))
for _ in range(20):
    model.add(keras.layers.Dense(100, kernel_initializer="he_normal"))
    model.add(keras.layers.Activation("elu"))
model.add(keras.layers.Dense(10, activation="softmax"))


In [None]:
# Compilar o modelo com a parametrização habitual

model.compile(loss="sparse_categorical_crossentropy",
              optimizer=keras.optimizers.SGD(lr=0.01),
              metrics=["accuracy"])

In [None]:
# Treinar o modelo durante 50 épocas, utilizando o batch size default (32)
history = model.fit(X_train, y_train, epochs=30,
          validation_data=(X_valid, y_valid))

In [None]:
# Criar gráfico para visualização da evolução da accuracy e do loss
import pandas as pd

pd.DataFrame(history.history).plot(figsize=(8, 5))
plt.grid(True)
save_fig("keras_learning_curves_plot")
plt.show()



In [None]:
# Verificar o desempenho do modelo do conjunto de avaliação

model.evaluate(X_test, y_test)


In [None]:
# Analisar e interpretar os resultados

In [None]:
keras.backend.clear_session()
tf.random.set_seed(42)
np.random.seed(42)

In [None]:
# Normalização de inputs: Escrever o código 


In [None]:
# Criar Rede

model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32, 32, 3]))
for _ in range(20):
    model.add(keras.layers.Dense(100, kernel_initializer="he_normal"))
    model.add(keras.layers.Activation("elu"))
model.add(keras.layers.Dense(10, activation="softmax"))

model.compile(loss="sparse_categorical_crossentropy",
              optimizer=keras.optimizers.SGD(lr=0.01),
              metrics=["accuracy"])

In [None]:
# Treinar Rede
history = model.fit(X_train, y_train, epochs=30,
          validation_data=(X_valid, y_valid))

In [None]:
import pandas as pd

pd.DataFrame(history.history).plot(figsize=(8, 5))
plt.grid(True)
save_fig("keras_learning_curves_plot")
plt.show()

In [None]:
# Repita os passos anteriores testar diversas configurações para a rede 
#(camadas escondidas e número de neurónios por camada) 
# Registe e interprete eventuais variações de desempenho

In [None]:
# Mudar Função de Ativação: SELU + LeCun Initialization
keras.backend.clear_session()
tf.random.set_seed(42)
np.random.seed(42)

model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32, 32, 3]))
for _ in range(20):
    model.add(keras.layers.Dense(100, kernel_initializer="lecun_normal"))
    model.add(keras.layers.Activation("selu"))
model.add(keras.layers.Dense(10, activation="softmax"))

model.compile(loss="sparse_categorical_crossentropy",
              optimizer=keras.optimizers.SGD(lr=0.01),
              metrics=["accuracy"])

history = model.fit(X_train, y_train, epochs=30,
          validation_data=(X_valid, y_valid))


In [None]:
import pandas as pd

pd.DataFrame(history.history).plot(figsize=(8, 5))
plt.grid(True)
save_fig("keras_learning_curves_plot")
plt.show()

In [None]:
# Testar impacto de Batch Normalization
keras.backend.clear_session()
tf.random.set_seed(42)
np.random.seed(42)


model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32, 32, 3]))
model.add(keras.layers.BatchNormalization())
for _ in range(20):
    model.add(keras.layers.Dense(100, kernel_initializer="he_normal"))
    model.add(keras.layers.BatchNormalization())
    model.add(keras.layers.Activation("elu"))
model.add(keras.layers.Dense(10, activation="softmax"))


model.compile(loss="sparse_categorical_crossentropy",
              optimizer=keras.optimizers.SGD(lr=0.01),
              metrics=["accuracy"])

history = model.fit(X_train, y_train, epochs=30,
          validation_data=(X_valid, y_valid))

In [None]:
# Identifique o local exato em que foram colocadas as camadas de normalização
# Analise a diferença no tempo de execução
# Quantos parâmetros existem a mais nesta rede resultantes da adição das camadas de Batch Normalization?


In [None]:
import pandas as pd

pd.DataFrame(history.history).plot(figsize=(8, 5))
plt.grid(True)
save_fig("keras_learning_curves_plot")
plt.show()

In [None]:
# Preparar a utilização do TensorBoard
import os 

# Diretoria Raiz
root_logdir = os.path.join(os.curdir, "my_logs")

# Sub-diretoria onde ficarão os dados da execução: tem um nome criado a partir da hora de inicio
def get_run_logdir():
    import time
    run_id = time.strftime("run_%Y_%m_%d-%H_%M_%S")
    return os.path.join(root_logdir, run_id)




In [None]:
# Treino de uma rede simplificada com recolha de informação para o TensorBoard

keras.backend.clear_session()
tf.random.set_seed(42)
np.random.seed(42)

model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32, 32, 3]))
for _ in range(5):
    model.add(keras.layers.Dense(50, kernel_initializer="he_normal"))
    model.add(keras.layers.Activation("elu"))
model.add(keras.layers.Dense(10, activation="softmax"))

model.compile(loss="sparse_categorical_crossentropy",
              optimizer=keras.optimizers.SGD(lr=0.01),
              metrics=["accuracy"])

# Criação do callback para executar a recolha de dados para o Tensorboard durante o treino
# Consultar os parâmetros aqui: https://keras.io/api/callbacks/tensorboard/
run_logdir = get_run_logdir()

tensorboard_cb = keras.callbacks.TensorBoard(run_logdir, histogram_freq=1)


# O método fit recebe informação sobre o callback do tensorboard
history = model.fit(X_train, y_train, epochs=5,
          validation_data=(X_valid, y_valid), callbacks=[tensorboard_cb])

In [None]:
# Lançar extensão TensorBoard
%load_ext tensorboard


In [None]:
# Iniciar o servidor TensorBoard 
# --port=6006
# --host=127.0.0.1
%tensorboard --logdir=./my_logs --host=127.0.0.1