# Laboratório #9

### Instruções

1. Quando você terminar os exercícios do laboratório, vá ao menu do Jupyter ou Colab e selecione a opção para fazer download do notebook.
    * Os notebooks tem extensão .ipynb. 
    * Este deve ser o arquivo que você irá entregar.
    * No Jupyter vá até a opção **File** -> **Download as** -> **Notebook (.ipynb)**.
    * No Colab vá até a opção **File** -> **Download .ipynb**.
2. Após o download do notebook, vá até a aba de tarefas do MS Teams, localize a tarefa referente a este laboratório e faça o upload do seu notebook. Veja que há uma opção de anexar arquivos à tarefa.
3. Não se esqueça de colocar seu **nome** e **matrícula** na célula de texto abaixo.

**Nome**:

**Matrícula**:

## Exercícios

#### 1)  Neste exercício, você irá utilizar o tensorflow para criar uma rede neural para a classificação de objetos.

Utilizaremos a base de dados conhecida como CIFAR10, a qual possui 50.000 32x32 imagens coloridas, ou seja, elas têm 3 dimensões, uma para cada uma das três cores, para treinamento e 10.000 32x32 imagens coloridas para validação. As imagens pertencem a 10 classes, as quais são listadas abaixo.

| Rótulo |  Descrição |
|:------:|:----------:|
|    0   |  airplane  |
|    1   | automobile |
|    2   |    bird    |
|    3   |     cat    |
|    4   |    deer    |
|    5   |     dog    |
|    6   |    frog    |
|    7   |    horse   |
|    8   |    ship    |
|    9   |    truck   |


1. Execute a célula de código abaixo para baixar a base de dados e analise as imagens geradas.

In [None]:
# TensorFlow
import tensorflow as tf

# Bibliotecas Auxiliares
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Download the dataset.
(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.cifar10.load_data()

# Reshaping the label arrays.
train_labels = train_labels.reshape(-1,)
test_labels = test_labels.reshape(-1,)

# Defining the class names.
class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

# Showing the first 25 images.
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

2. Normalize os conjuntos de treinamento e validação.

In [None]:
# Digite aqui o código do exercício.

3. Crie uma rede neural, usando a API `Sequential` do keras.

**DICAS**

+ Lembre-se que as imagens têm as seguintes dimensões 32x32x3.
+ Use o mesmo modelo do exemplo sobre Tensorflow, apenas mude as dimensões de entrada da camada de "achatamento".
+ A camada `Flatten` espera como `input_shape` as dimensões exatas das imagens, ou seja, 32x32x3.

In [None]:
# Digite aqui o código do exercício.

4. Compile o modelo.

**DICAS**

+ Use a mesma configuração do exemplo sobre Tensorflow.

In [None]:
# Digite aqui o código do exercício.

5. Treine o modelo por 25 épocas e armazene o histórico de valores da função de custo e da acurácia ao longo das épocas de treinamento. Após o treinamento, responda

    1. Qual fui a acurácia atingida?
    2. Ela poderia ser maior?
    3. Como podemos aumentar a acurácia do modelo?

In [None]:
# Digite aqui o código do exercício.

6. Execute o trecho de código abaixo para treinar um outro modelo mais adequado ao problema da classificação da base de dados CIFAR10. 

O modelo configurado abaixo é conhecido como VGG (Visual Geometry Group), também conhecido como VGGNet, uma arquitetura clássica de rede neural convolucional (CNN). O VGG foi desenvolvido para aumentar a profundidade de tais das redes convolutiocnais a fim de aumentar o desempenho do modelo. Para mais informações sobre esta rede, acesse: https://viso.ai/deep-learning/vgg-very-deep-convolutional-networks/

**DICAS**

+ Habilite o use de GPU para acelerar o treinamento.

In [None]:
# Define VGG model.
model2 = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same', input_shape=(32, 32, 3)),
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Conv2D(128, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.Conv2D(128, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu', kernel_initializer='he_uniform'),
    tf.keras.layers.Dense(10, activation='softmax')
])

# Compile the defined model.
model2.compile(loss='sparse_categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

# Train the VGG model.
history2 = model2.fit(train_images, train_labels, batch_size=64, validation_data=(test_images, test_labels), epochs=25)

7. Use as informações contidas no objeto do tipo `History` do segundo modelo para plotar uma figura do erro/acurácia em função das épocas de treinamento para os conjuntos de treinamento e validação.

**DICAS**

+ O objeto da classe `History` do segundo modelo armazena também as informações de loss e accuracy calculadas com o conjunto de validação. Para acessar os valores de loss do conjunto de validação, indexe o dicionário `history` com a chave `val_loss`. Para acessar os valores de acurácia do conjunto de validação, indexe o dicionário `history` com a chave `val_accuracy`. 

In [None]:
# Digite aqui o código do exercício.

8. Analise o gráfico com os valores de *loss*. Comparando a curva para o conjunto de treinamento com a curva para o conjunto de validação, o que podemos concluir sobre o comportamento do modelo?

<span style="color:blue">Escreva aqui a resposta do exercício.</span>

**Resposta**

9. Avalie a acurácia do segundo modelo no conjunto de validação.

In [None]:
# Digite aqui o código do exercício.

10. Plote a matriz de confusão para o conjunto de validação.

In [None]:
# Digite aqui o código do exercício.

11. O que poderia ser feito para melhorar o desempenho do segundo modelo no conjunto de validação?

<span style="color:blue">Escreva aqui a resposta do exercício.</span>

**Resposta**

12. Neste exercício iremos utilizar uma técnica de regularização conhecida como *dropout*. Execute a célula de código abaixo.

Dropout é uma técnica simples que elimina nós aleatoriamente da rede. Ele tem um efeito de regularização, pois os nós restantes devem se adaptar para compensar a folga criada pelos nós removidos. O *dropout* é adicionado ao modelo como camadas chamadas *Dropout*.

Para saber mais sobre esta técnica de regularização, acesse: https://machinelearningmastery.com/dropout-for-regularizing-deep-neural-networks/

In [None]:
# Define VGG model com dropout.
model3 = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same', input_shape=(32, 32, 3)),
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Conv2D(128, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.Conv2D(128, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu', kernel_initializer='he_uniform'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(10, activation='softmax')
])

# Compile the defined model.
model3.compile(loss='sparse_categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

# Train the VGG model.
history3 = model3.fit(train_images, train_labels, batch_size=64, validation_data=(test_images, test_labels), epochs=25)

13. Use as informações contidas no objeto do tipo `History` do terceiro modelo para plotar uma figura do erro/acurácia em função das épocas de treinamento para os conjuntos de treinamento e validação.

**DICAS**

+ O objeto da classe `History` do segundo modelo armazena também as informações de loss e accuracy calculadas com o conjunto de validação. Para acessar os valores de loss do conjunto de validação, indexe o dicionário `history` com a chave `val_loss`. Para acessar os valores de acurácia do conjunto de validação, indexe o dicionário `history` com a chave `val_accuracy`. 

In [None]:
# Digite aqui o código do exercício.

14. Analise o gráfico com os valores de *loss*. Comparando a curva para o conjunto de treinamento com a curva para o conjunto de validação, o que podemos concluir sobre o comportamento do modelo?

<span style="color:blue">Escreva aqui a resposta do exercício.</span>

**Resposta**

# Referência

[1] Jason Brownlee, "How to Develop a CNN From Scratch for CIFAR-10 Photo Classification", https://machinelearningmastery.com/how-to-develop-a-cnn-from-scratch-for-cifar-10-photo-classification/