## Classificando CIFAR-10 com Data Augmentation

Neste exercício, revisitamos o CIFAR-10 e as redes que construímos anteriormente. Usaremos data augmentation (aumento de dados) em tempo real para tentar melhorar nossos resultados.

Quando terminar de passar pelo notebook, experimente diferentes parâmetros de data augmentation e veja se eles ajudam (ou prejudicam!) o desempenho do seu classificador.

In [None]:
from __future__ import print_function
import tensorflow.keras as keras
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Activation, Flatten
from tensorflow.keras.layers import Conv2D, MaxPooling2D

import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# Os dados, embaralhados e divididos entre conjuntos de treino e teste:
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
print('Formato de x_train:', x_train.shape)
print(x_train.shape[0], 'amostras de treino')
print(x_test.shape[0], 'amostras de teste')

In [None]:
num_classes = 10

y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

In [None]:
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255

No Exercício 6, construímos dois modelos. Um era menor (181K parâmetros) enquanto o segundo era maior (1.25M parâmetros). Abaixo, usamos o modelo menor e o treinamos com data augmentation.

In [None]:
# Vamos construir uma CNN usando as capacidades Sequential do Keras

model_1 = Sequential()


## Convolução 5x5 com stride 2x2 e 32 filtros
model_1.add(Conv2D(32, (5, 5), strides = (2,2), padding='same',
                 input_shape=x_train.shape[1:]))
model_1.add(Activation('relu'))

## Outra convolução 5x5 com stride 2x2 e 32 filtros
model_1.add(Conv2D(32, (5, 5), strides = (2,2)))
model_1.add(Activation('relu'))

## Max pooling 2x2 reduz para 3 x 3 x 32
model_1.add(MaxPooling2D(pool_size=(2, 2)))
model_1.add(Dropout(0.25))

## Flatten transforma 3x3x32 em 288x1
model_1.add(Flatten())
model_1.add(Dense(512))
model_1.add(Activation('relu'))
model_1.add(Dropout(0.5))
model_1.add(Dense(num_classes))
model_1.add(Activation('softmax'))

model_1.summary()

Ainda temos 181K parâmetros, mesmo que este seja um modelo "pequeno".

In [None]:
batch_size = 32

# Inicializar otimizador RMSprop
opt = keras.optimizers.RMSprop(learning_rate=0.0005, decay=1e-6)

# Vamos treinar o modelo usando RMSprop
model_1.compile(loss='categorical_crossentropy',
              optimizer=opt,
              metrics=['accuracy'])

Aqui definimos o `ImageDataGenerator` que usaremos para servir imagens ao nosso modelo durante o processo de treinamento. Atualmente, ele está configurado para fazer alguns deslocamentos e inversão horizontal.

In [None]:
datagen = ImageDataGenerator(
    featurewise_center=False,  # definir média de entrada para 0 sobre o conjunto de dados
    samplewise_center=False,  # definir cada média de amostra para 0
    featurewise_std_normalization=False,  # dividir entradas pelo desvio padrão do conjunto de dados
    samplewise_std_normalization=False,  # dividir cada entrada pelo seu desvio padrão
    zca_whitening=False,  # aplicar whitening ZCA
    rotation_range=0,  # girar aleatoriamente imagens no intervalo (graus, 0 a 180)
    width_shift_range=0.1,  # deslocar aleatoriamente imagens horizontalmente (fração da largura total)
    height_shift_range=0.1,  # deslocar aleatoriamente imagens verticalmente (fração da altura total)
    horizontal_flip=True,  # inverter aleatoriamente imagens horizontalmente
    vertical_flip=False)  # inverter aleatoriamente imagens verticalmente
                   
datagen.fit(x_train)      # Isso calcula quaisquer estatísticas que possam ser necessárias (por exemplo, para centralização) a partir do conjunto de treinamento.

    
# Ajustar o modelo nos lotes gerados por datagen.flow().
model_1.fit(datagen.flow(x_train, y_train,
                                 batch_size=batch_size),
                    steps_per_epoch=x_train.shape[0] // batch_size,
                    epochs=15,
                    validation_data=(x_test, y_test))

Como o desempenho se compara com o treinamento sem augmentation?

## Exercício
### Sua Vez

1. Experimente acima com diferentes configurações dos parâmetros de data augmentation. Você consegue fazer o modelo ter um desempenho melhor? Você consegue fazer ele ter um desempenho pior?

2. Como no Exercício 6, construa um modelo mais complicado com o seguinte padrão:
    - Conv -> Conv -> MaxPool -> Conv -> Conv -> MaxPool -> (Flatten) -> Dense -> Classificação Final
    - Use strides de 1 para todas as camadas convolucionais.

3. Use data augmentation para treinar este modelo. Você consegue obter um desempenho melhor?

In [None]:
# Vamos construir uma CNN usando as capacidades Sequential do Keras

# Por favor, forneça seu código aqui

In [None]:
## Verificar número de parâmetros (imprimir o summary)


In [None]:
# Inicializar otimizador RMSprop

# Vamos treinar o modelo usando RMSprop

In [None]:
# Calcular quantidades necessárias para normalização por feature


# Ajustar o modelo nos lotes gerados por datagen.flow().