## Detecção de Imagens Manuscritas com Keras usando dados MNIST

Neste exercício trabalharemos com dados de imagem: especificamente o famoso conjunto de dados MNIST. Este conjunto de dados contém 70.000 imagens de dígitos manuscritos em tons de cinza (0=preto, 255 = branco). As imagens são de 28 pixels por 28 pixels para um total de 784 pixels. Isso é bem pequeno pelos padrões de imagem. Além disso, as imagens são bem centralizadas e isoladas. Isso torna este problema solucionável com redes neurais totalmente conectadas padrão sem muito pré-processamento.

Na primeira parte deste notebook, vamos orientá-lo no carregamento dos dados, construção de uma rede e seu treinamento. Então será sua vez de experimentar diferentes modelos e ver se consegue melhorar o desempenho

In [None]:
# Preliminares

from __future__ import absolute_import, division, print_function  # Compatibilidade Python 2/3

import warnings
warnings.filterwarnings("ignore")

import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
## Importar objetos do Keras para Deep Learning

import tensorflow.keras as keras
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.optimizers import RMSprop

Vamos explorar um pouco o conjunto de dados

In [None]:
# Carregar os dados, embaralhados e divididos entre conjuntos de treino e teste (x_train e y_train)
(x_train, y_train), (x_test, y_test) = mnist.load_data()

In [None]:
x_train[0].shape

In [None]:
# Vamos apenas observar um exemplo específico para ver o que há dentro

x_train[333]  ## Apenas um array numpy 28 x 28 de inteiros de 0 a 255

In [None]:
# Qual é o rótulo correspondente no conjunto de treinamento?
y_train[333]

In [None]:
# Vamos ver como essa imagem realmente se parece

plt.imshow(x_train[333], cmap='Greys_r')

In [None]:
# esta é a forma do np.array x_train
# é tridimensional.
print(x_train.shape, 'amostras de treino')
print(x_test.shape, 'amostras de teste')

In [None]:
## Para nossos propósitos, essas imagens são apenas um vetor de 784 entradas, então vamos converter
x_train = x_train.reshape(len(x_train), 28*28)
x_test = x_test.reshape(len(x_test), 28*28)

## Keras funciona com floats, então devemos converter os números para floats
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')

## Normalizar as entradas para que estejam entre 0 e 1
x_train /= 255
x_test /= 255

In [None]:
# converter vetores de classe em matrizes de classe binárias
num_classes = 10
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

y_train[333]  # agora o dígito k é representado por um 1 na k-ésima entrada (indexada em 0) do vetor de comprimento 10

In [None]:
# Construiremos um modelo com duas camadas ocultas de tamanho 512
# Entradas totalmente conectadas em cada camada
# Usaremos dropout de 0.2 para ajudar na regularização
model_1 = Sequential([
    Dense(64, activation='relu', input_shape=(784,)),
    Dropout(0.2),
    Dense(64, activation='relu'),
    Dropout(0.2),
    Dense(10, activation='softmax')
])

In [None]:
## Note que este modelo tem MUITOS parâmetros
model_1.summary()

In [None]:
# Vamos compilar o modelo
learning_rate = .001
model_1.compile(loss='categorical_crossentropy',
              optimizer=RMSprop(learning_rate=learning_rate),
              metrics=['accuracy'])
# note que `categorical cross entropy` é a generalização natural 
# da função de perda que tínhamos no caso de classificação binária, para o caso multiclasse

In [None]:
# E agora vamos treinar.

batch_size = 128  # mini-batch com 128 exemplos
epochs = 30
history = model_1.fit(
    x_train, y_train,
    batch_size=batch_size,
    epochs=epochs,
    verbose=1,
    validation_data=(x_test, y_test))

In [None]:
## Usaremos a função evaluate do Keras para avaliar o desempenho no conjunto de teste

score = model_1.evaluate(x_test, y_test, verbose=0)
print('Perda no teste:', score[0])
print('Precisão no teste:', score[1])

In [None]:
def plot_loss_accuracy(history):
    fig = plt.figure(figsize=(12, 6))
    ax = fig.add_subplot(1, 2, 1)
    ax.plot(history.history["loss"],'r-x', label="Perda de Treino")
    ax.plot(history.history["val_loss"],'b-x', label="Perda de Validação")
    ax.legend()
    ax.set_title('perda cross_entropy')
    ax.grid(True)


    ax = fig.add_subplot(1, 2, 2)
    ax.plot(history.history["accuracy"],'r-x', label="Precisão de Treino")
    ax.plot(history.history["val_accuracy"],'b-x', label="Precisão de Validação")
    ax.legend()
    ax.set_title('precisão')
    ax.grid(True)
    

plot_loss_accuracy(history)

Este é um desempenho razoavelmente bom, mas podemos fazer ainda melhor! A seguir, você construirá uma rede ainda maior e comparará o desempenho.

## Exercício
### Sua vez: Construa seu próprio modelo
Use a funcionalidade "Sequential" do Keras para construir `model_2` com as seguintes especificações:

1. Duas camadas ocultas.
2. Primeira camada oculta de tamanho 400 e segunda de tamanho 300
3. Dropout de 0.4 em cada camada
4. Quantos parâmetros seu modelo tem? Como ele se compara com o modelo anterior?
4. Treine este modelo por 20 épocas com RMSProp a uma taxa de aprendizado de 0.001 e tamanho de lote de 128




In [None]:
### Construa seu modelo aqui

## SOLUÇÃO

## Pense sobre as seguintes questões

1) Como model_1 e model_2 se comparam? Qual você prefere? Se você fosse colocar um em produção, qual escolheria e por quê?

2) Compare as trajetórias da função de perda no conjunto de treinamento e no conjunto de teste para cada modelo? Como elas se comparam? O que isso sugere sobre cada modelo? Faça o mesmo para a precisão? Qual você acha mais significativo, a perda ou a precisão?

3) Sugira uma melhoria para um dos modelos (mudança de estrutura, taxa de aprendizado, número de épocas, etc.) que você acha que resultará em um modelo melhor. Teste abaixo? Isso melhorou o desempenho?