# Exercício sobre datasets e análise dos resultados de treinamento

**Observação**: Verifiquem se o uso de GPU está habilitado.

## Importando as bibliotecas

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf

## Baixando o conjunto de dados MNIST


O conjunto de dados MNIST de dígitos manuscritos, pode ser baixado com o [TF](https://www.tensorflow.org/api_docs/python/tf/keras/datasets/mnist/load_data).

O conjunto contém imagens 28x28 pixels em tons de cinza dos 10 dígitos (0-9).
Ele possui um conjunto de treinamento com 60.000 imagens e um conjunto de teste com 10.000.

In [None]:
(ltrain_images, ltrain_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()

## Divindo em o conjunto inicial de treinamento em um conjunto de treinamento menor e um conjunto de validação

### Separamos as primeiras 10.000 imagens para o conjunto de validação.

In [None]:
val_images = ltrain_images[:10000]
val_labels = ltrain_labels[:10000]

In [None]:
print(val_images.shape)
print(val_labels.shape)

### As 50.000 restantes vão para o novo conjunto de treinamento (menor)

In [None]:
train_images = ltrain_images[10000:]
train_labels = ltrain_labels[10000:]

In [None]:
print(train_images.shape)
print(train_labels.shape)

## Pré-processamento dos dados

Vamos aplicar normalização aos dados (i.e., atributos) dos três conjuntos.

Como os valores dos pixels variam entre 0 e 255, basta dividí-los por 255.0 e o intervalo final ficará entre 0.0 e 1.0.

In [None]:
train_images  = train_images / 255.0
val_images = val_images / 255.0
test_images = test_images / 255.0

## Execute a célula de código abaixo e analise as figuras geradas e os resultados de desempenho nos três conjuntos.

In [None]:
# Definindo o modelo.
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Flatten(input_shape=(28, 28)))
model.add(tf.keras.layers.Dense(20, activation='relu'))
model.add(tf.keras.layers.Dense(10, activation='softmax'))

# Instanciando otimizador Adam.
opt = tf.keras.optimizers.Adam(learning_rate=0.1)

# Compilando a rede neural.
model.compile(
    optimizer=opt,
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

# Treinando o modelo.
history = model.fit(
    train_images,
    train_labels,
    epochs=30,
    validation_data=(val_images, val_labels)
)

# Plotando os resultados de perda.
plt.plot(history.history['loss'], label='Train')
plt.plot(history.history['val_loss'], label='Val')
plt.title('Perda do modelo')
plt.ylabel('Acurácia')
plt.xlabel('Época')
plt.legend(loc='upper left')
plt.xticks(range(20))
plt.grid()
plt.show()

# Plotando os resultados de acurácia.
plt.plot(history.history['accuracy'], label='Train')
plt.plot(history.history['val_accuracy'], label='Val')
plt.title('Acurácia do modelo')
plt.ylabel('Acurácia')
plt.xlabel('Época')
plt.legend(loc='upper left')
plt.xticks(range(20))
plt.grid()
plt.show()

# Avaliando o desempenho no conjunto de treinamento.
print('Treinamento:', model.evaluate(train_images, train_labels))
# Avaliando o desempenho no conjunto de validação.
print('Validação:', model.evaluate(val_images, val_labels))
# Avaliando o desempenho no conjunto de teste.
print('Teste:', model.evaluate(test_images, test_labels))

### O que você conclui sobre o treinamento deste modelo? Podemos dizer que o modelo treinado tem um bom desempenho? Caso não, o que pode ser feito para melhorar este desempenho? *Justifique suas respostas*

**Reposta**

Escreva sua resposta aqui.

## Execute a célula de código abaixo e analise as figuras geradas e os resultados de desempenho nos três conjuntos.

In [None]:
# Definindo o modelo.
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Flatten(input_shape=(28, 28)))
model.add(tf.keras.layers.Dense(20, activation='relu'))
model.add(tf.keras.layers.Dense(10, activation='softmax'))

# Instanciando otimizador Adam.
opt = tf.keras.optimizers.Adam(learning_rate=0.0001)

# Compilando a rede neural.
model.compile(
    optimizer=opt,
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

# Treinando o modelo.
epochs = 40
history = model.fit(
    train_images,
    train_labels,
    epochs=epochs,
    validation_data=(val_images, val_labels)
)

# Plotando os resultados de perda.
plt.plot(history.history['loss'], label='Train')
plt.plot(history.history['val_loss'], label='Val')
plt.title('Perda do modelo')
plt.ylabel('Acurácia')
plt.xlabel('Época')
plt.legend(loc='upper left')
plt.grid()
plt.show()

# Plotando os resultados de acurácia.
plt.plot(history.history['accuracy'], label='Train')
plt.plot(history.history['val_accuracy'], label='Val')
plt.title('Acurácia do modelo')
plt.ylabel('Acurácia')
plt.xlabel('Época')
plt.legend(loc='upper left')
plt.grid()
plt.show()

# Avaliando o desempenho no conjunto de treinamento.
print('Treinamento:', model.evaluate(train_images, train_labels))
# Avaliando o desempenho no conjunto de validação.
print('Validação:', model.evaluate(val_images, val_labels))
# Avaliando o desempenho no conjunto de teste.
print('Teste:', model.evaluate(test_images, test_labels))

### O que você conclui sobre o treinamento deste outro modelo? Podemos dizer que o modelo treinado tem um bom desempenho? Caso não, o que pode ser feito para melhorar este desempenho? *Justifique suas respostas*

**Reposta**

Escreva sua resposta aqui.

## Execute a célula de código abaixo e analise o código (mais especificamente a arquitetura da rede neural), as figuras geradas e os resultados de desempenho nos três conjuntos.

In [None]:
# Definindo o modelo.
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Flatten(input_shape=(28, 28)))
model.add(tf.keras.layers.Dense(128, activation='relu'))
model.add(tf.keras.layers.Dense(64, activation='relu'))
model.add(tf.keras.layers.Dense(32, activation='relu'))
model.add(tf.keras.layers.Dense(10, activation='softmax'))

# Instanciando otimizador Adam.
opt = tf.keras.optimizers.Adam(learning_rate=0.0001)

# Compilando a rede neural.
model.compile(
    optimizer=opt,
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

# Treinando o modelo.
epochs = 100
history = model.fit(
    train_images,
    train_labels,
    epochs=epochs,
    validation_data=(val_images, val_labels)
)

# Plotando os resultados de perda.
plt.plot(history.history['loss'], label='Train')
plt.plot(history.history['val_loss'], label='Val')
plt.title('Perda do modelo')
plt.ylabel('Acurácia')
plt.xlabel('Época')
plt.legend(loc='upper left')
plt.grid()
plt.show()

# Plotando os resultados de acurácia.
plt.plot(history.history['accuracy'], label='Train')
plt.plot(history.history['val_accuracy'], label='Val')
plt.title('Acurácia do modelo')
plt.ylabel('Acurácia')
plt.xlabel('Época')
plt.legend(loc='upper left')
plt.grid()
plt.show()

# Avaliando o desempenho no conjunto de treinamento.
print('Treinamento:', model.evaluate(train_images, train_labels))
# Avaliando o desempenho no conjunto de validação.
print('Validação:', model.evaluate(val_images, val_labels))
# Avaliando o desempenho no conjunto de teste.
print('Teste:', model.evaluate(test_images, test_labels))

### O que você conclui sobre o treinamento deste outro modelo? Podemos dizer que o modelo treinado tem um bom desempenho? Caso não, o que pode ser feito para melhorar este desempenho? *Justifique suas respostas*

**Reposta**

Escreva sua resposta aqui.

## Execute a célula de código abaixo e analise as figuras geradas e os resultados de desempenho nos três conjuntos.

In [None]:
# Definindo o modelo.
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Flatten(input_shape=(28, 28)))
model.add(tf.keras.layers.Dense(20, activation='relu'))
model.add(tf.keras.layers.Dense(10, activation='softmax'))

# Instanciando otimizador Adam.
opt = tf.keras.optimizers.Adam(learning_rate=0.0000001)

# Compilando a rede neural.
model.compile(
    optimizer=opt,
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

# Treinando o modelo.
epochs = 40
history = model.fit(
    train_images,
    train_labels,
    epochs=epochs,
    validation_data=(val_images, val_labels)
)

# Plotando os resultados de perda.
plt.plot(history.history['loss'], label='Train')
plt.plot(history.history['val_loss'], label='Val')
plt.title('Perda do modelo')
plt.ylabel('Acurácia')
plt.xlabel('Época')
plt.legend(loc='upper left')
plt.grid()
plt.show()

# Plotando os resultados de acurácia.
plt.plot(history.history['accuracy'], label='Train')
plt.plot(history.history['val_accuracy'], label='Val')
plt.title('Acurácia do modelo')
plt.ylabel('Acurácia')
plt.xlabel('Época')
plt.legend(loc='upper left')
plt.grid()
plt.show()

# Avaliando o desempenho no conjunto de treinamento.
print('Treinamento:', model.evaluate(train_images, train_labels))
# Avaliando o desempenho no conjunto de validação.
print('Validação:', model.evaluate(val_images, val_labels))
# Avaliando o desempenho no conjunto de teste.
print('Teste:', model.evaluate(test_images, test_labels))

### O que você conclui sobre o treinamento deste outro modelo? Podemos dizer que o modelo treinado tem um bom desempenho? Caso não, o que pode ser feito para melhorar este desempenho? Compare os resultados das figuras acima com os resultados obtidos com o treinamento do segundo modelo. *Justifique suas respostas*

**Reposta**

Escreva sua resposta aqui.