# Instituto de Educação Superior de Brası́lia – IESB
## Pós-Graduação em Inteligência Artificial
### Deep Learning e Redes Neurais

### Atividade 2 - Classificação de imagens na base de dados CIFAR-10 com CNN e Data Augmentation

#### Descrição do Dataset CIFAR-10

O dataset CIFAR-10 consiste de 60 mil imagens coloridas, com 10 classes distintas igualmente balanceadas (isto é, 6 mil imagens por classe).

O conjunto é separado em 50 mil imagens para treinamento e 10 mil para teste.

As imagens são de animais e objetos, com as seguintes classes:


  - 0 - Avião										
  - 1 - Automóvel
  - 2 - Pássaro
  - 3 - Gato
  - 4 - Cervo
  - 5 - Cachorro
  - 6 - Sapo
  - 7 - Cavalo
  - 8 - Barco
  - 9 - Caminhão

Fonte: https://www.cs.toronto.edu/~kriz/cifar.html

# Parte A

## 1) Dataset

 - Carregue o dataset.
```python
from tensorflow.keras.datasets import cifar10
(X_train, y_train), (X_test, y_test) = cifar10.load_data()
```

 - Escolha, aletoriamente (e de forma automatizada), 16 imagens na base de treino, e apresente-as visualmente em um gráfico 4x4 (subplot).
 
 
 - Verifique se as dimensões dos tensores estão de acordo com a descrição do dataset.


 - Realize, caso necessário, pré-processamento nos dados. (Ex: normalização, padronização, codificação de classes, etc).

In [1]:
# Insira seu código aqui
from random import choice

import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.datasets import cifar10

%matplotlib notebook

In [2]:
(xtrain, ytrain), (xtest, ytest) = cifar10.load_data()

xtrain.shape, ytrain.shape, xtest.shape, ytest.shape

((50000, 32, 32, 3), (50000, 1), (10000, 32, 32, 3), (10000, 1))

In [3]:
xtrain = xtrain.astype('float32')
xtest = xtest.astype('float32')
xtrain /= 255
xtest /= 255

In [4]:
CLASSES = {
    0: 'Avião', 1: 'Automóvel', 2: 'Pássaro', 3: 'Gato', 4: 'Cervo', 5: 'Cachorro',
    6: 'Sapo', 7: 'Cavalo', 8: 'Barco', 9: 'Caminhão'
}

In [5]:
def _sample_images(x, y, num: int):
    _r = range(x.shape[0])
    _l = []
    for _ in range(num):
        i = choice(_r)
        _l.append((x[i], y[i]))
    return _l

In [6]:
SAMPLE_IMAGES = _sample_images(xtrain, ytrain, 16)

PLT_ROWS, PLT_COLS, PLT_INDEX = 4, 4, 1

fig = plt.Figure(figsize=(8, 8))

for p in SAMPLE_IMAGES:
    plt.subplot(PLT_ROWS, PLT_COLS, PLT_INDEX)
    plt.title(CLASSES[p[1][0]])
    plt.imshow(p[0])
    PLT_INDEX += 1

plt.subplots_adjust(wspace=0.25, hspace=1.0)
plt.show()

<IPython.core.display.Javascript object>

## 2) Implementação do Modelo CNN

### 2.1 Arquitetura

 - Defina uma função que implemente uma arquitera de Rede Convolucional (utilizando o Keras) e retorne um objeto desse seu modelo.
 
 
 - A escolha de parâmetros do modelo, como, por exemplo, *quantidade de camadas convolucionais*, *quantidade de filtros em cada cada camada convolucional*, *quantidade de camadas densas*,  *funções de ativação*, fica a critério do projetista. 


 - Instancie um modelo usando a função implementada, e apresente um resumo da arquitetura.

In [7]:
# Insira seu código aqui
import keras
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Flatten, Conv2D, MaxPooling2D, BatchNormalization, Dropout
from keras.callbacks import EarlyStopping, ReduceLROnPlateau, ModelCheckpoint

In [8]:
ytrain = np_utils.to_categorical(ytrain, 10)
ytest = np_utils.to_categorical(ytest, 10)

In [9]:
def modelo_cifar10():

    keras.backend.clear_session()

    clf = Sequential()

    clf.add(layer=Conv2D(filters=32, kernel_size=(3, 3), activation='relu', name='conv1',
                    input_shape=xtrain.shape[1:]))
    clf.add(layer=MaxPooling2D(pool_size=(2, 2), name='maxpool1'))

    clf.add(layer=Conv2D(filters=64, kernel_size=(3, 3), activation='relu', name='conv2'))
    clf.add(layer=MaxPooling2D(pool_size=(2, 2), name='maxpool2'))

    clf.add(layer=Flatten(name='flatten'))

    clf.add(layer=Dense(units=128, activation='relu', name='dense1'))
    clf.add(Dropout(rate=0.2, name='dropout1'))

    clf.add(layer=Dense(units=10, activation='softmax', name='softmax'))

    print(clf.summary())

    return clf

In [10]:
clf = modelo_cifar10()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv1 (Conv2D)               (None, 30, 30, 32)        896       
_________________________________________________________________
maxpool1 (MaxPooling2D)      (None, 15, 15, 32)        0         
_________________________________________________________________
conv2 (Conv2D)               (None, 13, 13, 64)        18496     
_________________________________________________________________
maxpool2 (MaxPooling2D)      (None, 6, 6, 64)          0         
_________________________________________________________________
flatten (Flatten)            (None, 2304)              0         
_________________________________________________________________
dense1 (Dense)               (None, 128)               295040    
_________________________________________________________________
dropout1 (Dropout)           (None, 128)               0

### 2.2 Compilação

 - Baseado no problema descrito, defina a função custo que será otimizada, e qual otimizador será utilizado.
 
 
 - Defina também quais métricas serão avaliadas pelo modelo durante a etapa de treinamento e de validação.

In [21]:
clf.compile(optimizer='adam', loss='categorical_crossentropy', metrics='accuracy')

### 2.3 Treinamento e Validação 
 
 - Defina a quantidade máxima de épocas para o treinamento.
 
 
 - Utilize alguma rotina de *callback* para que o treinamento não dure o máximo de épocas definido, caso isso não seja necessário.


 - Utilize 20% da base de treino para validar o modelo a cada época.  <br>


 - Mostre em um gráfico o comportamento da função custo (*loss*) e da acurácia, ao longo das epócas, para as bases de treino e de validação.

In [12]:
# Insira seu código aqui
es = EarlyStopping(monitor='loss',
                   min_delta=1e-10,
                   patience=5, verbose=1)
mcp = ModelCheckpoint(filepath='cifar10-weights.h5',
                      save_best_only=True,
                      monitor='loss',
                      verbose=1)

In [13]:
clf_history = clf.fit(x=xtrain, y=ytrain,
                      batch_size=120, epochs=40,
                      validation_data=(xtest, ytest),
                      validation_split=0.2,
                      callbacks=[es, mcp])

Epoch 1/40

Epoch 00001: loss improved from inf to 1.73869, saving model to cifar10-weights.h5
Epoch 2/40

Epoch 00002: loss improved from 1.73869 to 1.36332, saving model to cifar10-weights.h5
Epoch 3/40

Epoch 00003: loss improved from 1.36332 to 1.19556, saving model to cifar10-weights.h5
Epoch 4/40

Epoch 00004: loss improved from 1.19556 to 1.08535, saving model to cifar10-weights.h5
Epoch 5/40

Epoch 00005: loss improved from 1.08535 to 1.00122, saving model to cifar10-weights.h5
Epoch 6/40

Epoch 00006: loss improved from 1.00122 to 0.92487, saving model to cifar10-weights.h5
Epoch 7/40

Epoch 00007: loss improved from 0.92487 to 0.86411, saving model to cifar10-weights.h5
Epoch 8/40

Epoch 00008: loss improved from 0.86411 to 0.80946, saving model to cifar10-weights.h5
Epoch 9/40

Epoch 00009: loss improved from 0.80946 to 0.75705, saving model to cifar10-weights.h5
Epoch 10/40

Epoch 00010: loss improved from 0.75705 to 0.71021, saving model to cifar10-weights.h5
Epoch 11/40




Epoch 00036: loss improved from 0.20863 to 0.20112, saving model to cifar10-weights.h5
Epoch 37/40

Epoch 00037: loss did not improve from 0.20112
Epoch 38/40

Epoch 00038: loss did not improve from 0.20112
Epoch 39/40

Epoch 00039: loss did not improve from 0.20112
Epoch 40/40

Epoch 00040: loss improved from 0.20112 to 0.19722, saving model to cifar10-weights.h5


In [14]:
def plot_history(history):
    plt.figure(figsize=(8,4))

    plt.subplot(1, 2, 1)
    plt.plot(history.history['accuracy'])
    plt.plot(history.history['val_accuracy'])
    plt.title('Model accuracy')
    plt.ylabel('Accuracy')
    plt.xlabel('Epoch')
    plt.legend(['Train', 'Test'], loc='upper left')

    plt.subplot(1, 2, 2)
    plt.plot(history.history['loss'])
    plt.plot(history.history['val_loss'])
    plt.title('Model loss')
    plt.ylabel('Loss')
    plt.xlabel('Epoch')
    plt.legend(['Train', 'Test'], loc='upper left')

    plt.subplots_adjust(wspace=0.25, hspace=1.0, bottom=0.2)
    plt.show()

In [15]:
plot_history(clf_history)

<IPython.core.display.Javascript object>

### 2.4 Desempenho na Base de Teste

 - Realize, com o modelo treinado, predições na base de teste (método *predict*).
 

 - Com as predições, calcule a precisão e a revocação para cada classe.  <br>
   (Pode ser utilizada a função *classification_report* do *scikit-learn* ou alguma outra similar).

In [16]:
from sklearn.metrics import classification_report

In [18]:
LIMIAR = 0.5

In [19]:
pred = clf.predict(xtest)
pred_argmax = [np.argmax(x) for x in (pred > LIMIAR)]
ytest_argmax = [np.argmax(x) for x in ytest]

In [20]:
print(classification_report(y_true=ytest_argmax, y_pred=pred_argmax))

              precision    recall  f1-score   support

           0       0.58      0.80      0.67      1000
           1       0.83      0.79      0.81      1000
           2       0.56      0.60      0.58      1000
           3       0.55      0.47      0.50      1000
           4       0.61      0.72      0.66      1000
           5       0.68      0.50      0.57      1000
           6       0.76      0.79      0.77      1000
           7       0.76      0.73      0.74      1000
           8       0.88      0.72      0.79      1000
           9       0.77      0.80      0.79      1000

    accuracy                           0.69     10000
   macro avg       0.70      0.69      0.69     10000
weighted avg       0.70      0.69      0.69     10000



# Parte B: Data Augmentation

## 1) Recarregue o Dataset CIFAR-10


 - Recarregue o dataset CIFAR-10, conforme feito na parte A, porém sem realizar pré-processamentos.


 - Utilize a classe **ImageDataGenerator** do Keras para fazer os pré-processamentos adequados, e aplicar as transformações nas imagens, de forma a gerar novos exemplos para o treinamento (*data augmentation*). A escolha das transformações é livre ao projetista.


 - Mostre em um gráfico 4x4 (subplot), 16 exemplos aleatórios dessas imagens transformadas, com seus respectivos rótulos.


 - Configure 20% dos dados para validação. Isso deve ser feito durante o instanciamento do objeto que irá manipular o dataset.
 
 
 - Obs: Aplique as transformações apenas no conjunto de treino retornado pela função *cifar10.load_data()*. No conjunto de teste, apenas os pré-processamentos devem ser utilizados (não utilize *data augmentation* nessa base)

In [64]:
from keras.preprocessing.image import ImageDataGenerator

In [97]:
(xtrain, ytrain), (xtest, ytest) = cifar10.load_data()

xtrain.shape, ytrain.shape, xtest.shape, ytest.shape

((50000, 32, 32, 3), (50000, 1), (10000, 32, 32, 3), (10000, 1))

In [98]:
xtrain = xtrain.astype('float32')
xtest = xtest.astype('float32')
xtrain /= 255
xtest /= 255

In [99]:
ytrain = np_utils.to_categorical(ytrain, 10)
ytest = np_utils.to_categorical(ytest, 10)

In [100]:
datagen = ImageDataGenerator(validation_split=0.2)
datagen.fit(xtrain)

In [101]:
gen_train = datagen.flow(xtrain, ytrain)

In [109]:
PLT_ROWS, PLT_COLS = 4, 4

fig = plt.Figure(figsize=(8, 8))

for xbatch, ybatch in gen_train:
    for i in range(0, PLT_ROWS*PLT_COLS):
        plt.subplot(PLT_ROWS, PLT_COLS, i+1)
        plt.title(CLASSES[np.argmax(ybatch[i])])
        plt.imshow(xbatch[i])
        PLT_INDEX += 1
    break

plt.subplots_adjust(hspace=0.50)
plt.show()

<IPython.core.display.Javascript object>

## 2) Retreine o seu modelo

### 2.1 Compilação e Treinamento

 - Utilizando a mesma função definida na parte A, instancie um novo modelo (com os pesos "zerados").

 
 - Treine esse novo modelo utilizando para treino e validação os objetos definidos pelo *ImageDataGenerator*.
 
 
 - Mostre em um gráfico o comportamento da função custo (loss) e da acurácia, ao longo das epócas, para as bases de treino e de validação.


### 2.2 Desempenho na Base de Teste

 - Após o término do treinamento, calcule as mesmas métricas de desempenho descritas na parte A para a base de teste.


 - Houve melhora no desempenho?

In [110]:
clf_gen = modelo_cifar10()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv1 (Conv2D)               (None, 30, 30, 32)        896       
_________________________________________________________________
maxpool1 (MaxPooling2D)      (None, 15, 15, 32)        0         
_________________________________________________________________
conv2 (Conv2D)               (None, 13, 13, 64)        18496     
_________________________________________________________________
maxpool2 (MaxPooling2D)      (None, 6, 6, 64)          0         
_________________________________________________________________
flatten (Flatten)            (None, 2304)              0         
_________________________________________________________________
dense1 (Dense)               (None, 128)               295040    
_________________________________________________________________
dropout1 (Dropout)           (None, 128)               0

In [111]:
clf_gen.compile(optimizer='adam', loss='categorical_crossentropy', metrics='accuracy')

In [112]:
clf_history = clf_gen.fit(gen_train, batch_size=120, epochs=40, validation_data=(xtest, ytest))

Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40
Epoch 12/40
Epoch 13/40
Epoch 14/40
Epoch 15/40
Epoch 16/40
Epoch 17/40
Epoch 18/40
Epoch 19/40
Epoch 20/40
Epoch 21/40
Epoch 22/40
Epoch 23/40
Epoch 24/40
Epoch 25/40
Epoch 26/40
Epoch 27/40
Epoch 28/40
Epoch 29/40
Epoch 30/40
Epoch 31/40
Epoch 32/40
Epoch 33/40
Epoch 34/40
Epoch 35/40
Epoch 36/40
Epoch 37/40
Epoch 38/40
Epoch 39/40
Epoch 40/40


In [113]:
plot_history(clf_history)

<IPython.core.display.Javascript object>

In [114]:
LIMIAR = 0.5

pred = clf_gen.predict(xtest)

pred_argmax = [np.argmax(x) for x in (pred > LIMIAR)]
ytest_argmax = [np.argmax(x) for x in ytest]

print(classification_report(y_true=ytest_argmax, y_pred=pred_argmax))

              precision    recall  f1-score   support

           0       0.53      0.71      0.61      1000
           1       0.84      0.75      0.80      1000
           2       0.60      0.60      0.60      1000
           3       0.52      0.50      0.51      1000
           4       0.68      0.55      0.61      1000
           5       0.60      0.59      0.59      1000
           6       0.78      0.75      0.76      1000
           7       0.77      0.70      0.73      1000
           8       0.76      0.83      0.80      1000
           9       0.75      0.80      0.77      1000

    accuracy                           0.68     10000
   macro avg       0.68      0.68      0.68     10000
weighted avg       0.68      0.68      0.68     10000

