# Redes neurais convolucionais no Keras

Neste notebook, discute-se como implementar redes neurais convolucionais usando o Keras.

---
## Camadas convolucionais no Keras

<img src='img/full_padding_no_strides_transposed.gif' width=300px>

Para criar uma camada convolucional no Keras, primeiro é necessário importar o módulo [**`Conv2D`**](https://keras.io/layers/convolutional/#conv2d), como no exemplo abaixo:

```
from keras.layers import Conv2D
```

Então, para de fato criar a camada, usa-se o formato a seguir:

```
Conv2D(filters, kernel_size, strides, padding, activation='relu', input_shape)
```

### Argumentos

Deve-se passar os seguintes argumentos:

* **`filters`**: número de filtros.
* **`kernel_size`**: número ou tupla que especifica as dimensões (altura e largura) da janela de convolução.

Há também argumentos opcionais que podem ser ajustados:

* **`strides`**: número ou tupla que especifica o passo da convolução. Se não for especificado, assume o valor padrão de `1`.
* **`padding`**: pode ser `'valid'` (não há preenchimento, fazendo com que a janela de convolução ocupe apenas as posições válidas) ou `'same'` (há preechimento, fazendo com que a convolução resulte em uma saída com as mesmas dimensões da entrada). Se não for especificado, assume o valor padrão `'valid'`.
* **`activation`**: tipicamente `'relu'`. É sempre recomendado que essa seja a função de ativação em camadas convolucionais. Se não for especificado, assume `None`.
* **`input_shape`**: tupla que especifica a altura, a largura e a profundidade, nesta ordem, da entrada. ***É importante lembrar que este argumento deve ser usado apenas na primeira camada (após a camada de entrada) de um modelo, e não deve ser incluído nas outras camadas.***

Existem outros argumentos ajustáveis que podem ser configurados para alterar o comportamento de uma camada convolucional. Para ler mais sobre estes argumentos, é recomendável que se leia a [documentação](https://keras.io/layers/convolutional/#conv2d).

### Exemplos

**Primeiro exemplo:** Digamos que você esteja construindo uma CNN e sua camada de entrada aceite imagens em níveis de cinza de 200 por 200 pixeis (correspondentes a um arranjo 3d de altura 200, largura 200 e profundidade 1). Digamos que você gostaria que a próxima camada fosse uma camada convolucional com 16 filtros, cada um com altura e largura de 2. Quando estiver realizando a convolução, vocÇe também gostaria que o filtro pulasse 2 pixels por vez, e não gostaria que o filtro fosse aplicado fora dos limites da imagem (em outras palavras, você não quer preencher a imagem com zeros). Para construir esta camada, você deve usar a seguinte linha de código:

```
Conv2D(filters=16, kernel_size=2, strides=2, activation='relu', input_shape=(200, 200, 1))
```

**Segundo exemplo:** Digamos que você gostaria que a próxima camada da sua CNN fosse uma camada convolucional que receberá a camada construído no primeiro exemplo como entrada. Digamos que você gostaria que sua nova camada tivesse 32 filtros, cada um com altura e largura 3. Quando estiver realizando a convolução, você gostaria que o filtro pulasse 1 pixel por vez. Você quer que a camada convolucional veja todas as regiões da camada anterior, então não se importa se o filtro se estender além da borda da camada anterior quando estiver realizando a convolução. Para construir essa camada, você deve usar a seguinte linha de código:

```
Conv2D(filters=32, kernel_size=3, padding='same', activation='relu')
```

**Terceiro exemplo:** Se você pesquisar sobre CNN no Keras, possivelmente verá códigos no seguinte formato:

```
Conv2D(64, (2, 2), activation='relu')
```

Neste caso, existem 64 filtros, cada um com tamanho 2x2, e a camada tem uma função de ativação ReLu. Os outros argumentos da camada assumem valores padrão, então a convolução tem um passo de 1 e o preenchimento foi configurado como `'valid'`.

---
## Dimensionalidade das camadas convolucionais

<img src='img/convolution_schematic.gif' width=300px>

Assim como redes neurais, uma CNN é criada no Keras por meio de um modelo `Sequential` em primeiro lugar. As camadas são adicionadas à rede usando o método `.add()`.

O código abaixo cria uma CNN que não será treinada; em vez disso, será utilizada para estudar como a dimensionalidade das camadas convolucionais mudam de acordo com os argumentos fornecidos.

In [1]:
from keras.models import Sequential
from keras.layers import Conv2D

model = Sequential()

model.add(Conv2D(filters=16, kernel_size=2, strides=2, padding='valid', 
                 activation='relu', input_shape=(200, 200, 1)))

model.summary()

Using TensorFlow backend.


_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_1 (Conv2D)            (None, 100, 100, 16)      80        
Total params: 80
Trainable params: 80
Non-trainable params: 0
_________________________________________________________________


Nas células abaixo, faremos algumas mudanças nos argumentos da camada convolucional. Observe como o **número de parâmetros** muda, e também como a **forma** da camada convolucional muda. Note que a forma corresponde ao valor `Output Shape` que aparece na saída do terminal (no modelo acima, `None` corresponde ao tamanho do lote, e a camada convolucional tem uma altura de `100`, largura de `100` e profundidade de `16`).

In [2]:
model = Sequential()

# Mudança em kernel_size (de 2 para 4)
model.add(Conv2D(filters=16, kernel_size=4, strides=2, padding='valid', 
                 activation='relu', input_shape=(200, 200, 1)))

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_2 (Conv2D)            (None, 99, 99, 16)        272       
Total params: 272
Trainable params: 272
Non-trainable params: 0
_________________________________________________________________


In [3]:
model = Sequential()

# Mudança em filters (de 16 para 32)
model.add(Conv2D(filters=32, kernel_size=2, strides=2, padding='valid', 
                 activation='relu', input_shape=(200, 200, 1)))

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_3 (Conv2D)            (None, 100, 100, 32)      160       
Total params: 160
Trainable params: 160
Non-trainable params: 0
_________________________________________________________________


In [4]:
model = Sequential()

# Mudança em input_shape (de (200, 200, 1) para (480, 480, 3))
model.add(Conv2D(filters=16, kernel_size=2, strides=2, padding='valid', 
                 activation='relu', input_shape=(480, 480, 3)))

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_4 (Conv2D)            (None, 240, 240, 16)      208       
Total params: 208
Trainable params: 208
Non-trainable params: 0
_________________________________________________________________


### Número de parâmetros em uma camada convolucional

O número de parâmetros em uma camada convolucional depende do número de filtros na camada (`filters`), das dimensões dos filtros convolucionais (`kernel_size`) e da profundidade da camada anterior (ou seja, do último valor da tupla `input_shape`).

Chamando o número de filtros de `NF`, a altura do filtro convolucional de `AK`, a largura do filtro convolucional de `LK` e a profundidade da camada anterior de `PCA`, temos:

* $AK * LK * PCA$ pesos por filtro;
* $AK * LK * PCA * NF$ pesos na camada convolucional;
* $AK * LK * PCA * NF + NF$ parâmetros na camada convolucional.

**Nota**: para total compreensão da última fórmula listada acima, é importante lembrar que existe um termo de viés por filtro (por isso adiciona-se `NF` ao número de filtros na camada convolucional).

### Profundidade da camada convolucional

A profundidade da camada convolucional será sempre igual ao número de filtros (`filters`).

### Formato da camada convolucional

O formato de uma camada convolucional depende da dimensão dos filtros convolucionais (`kernel_size`), das dimensões da camada anterior (`input_shape`), do preenchimento da camada convolucional (`padding`) e do passo da convolução (`stride`).

Chamando a altura do filtro convolucional de `AK`, a largura do filtro convolucional de `LK`, a altura da camada anterior de `AE`, a largura da camada anterior de `LE` e o passo da convolução de `P`, temos:

1. se `padding='same'`, as dimensões da camada convolucional serão:
    * altura = math.ceil($\frac{AE}{P}$)
    * largura = math.ceil($\frac{LE}{P}$)
2. se `padding='valid'`, as dimensões da camada convolucional serão:
    * altura = math.ceil($\frac{AE - AK + 1}{P}$)
    * largura = math.ceil($\frac{LE - LK + 1}{P}$)

**Nota**: a função `math.ceil(x)` retorna o menor inteiro maior ou igual a `x`. Observe que `x` dever ser um `float`.

### Exemplo

Para nos certificarmos que as fórmulas descritas acima são coerentes, usaremos o trecho de código abaixo para calcular quantos parâmetros a camada convolucional tem, qual sua profundidade e quais as dimensões de sua saída.

In [5]:
from keras.models import Sequential
from keras.layers import Conv2D
from math import ceil

model = Sequential()
model.add(Conv2D(filters=32, kernel_size=3, strides=2, padding='same', 
                 activation='relu', input_shape=(128, 128, 3)))

NF = 32
AK = 3
LK = 3
PCA = 3
P = 2
AE = 128
LE = 128
print('Quantidade de parâmetros: {}'.format(AK * LK * PCA * NF + NF))
print('Profundidade da camada convolucional: {}'.format(NF))
print('Altura da saída: {}'.format(ceil(float(AE)/float(P))))
print('Largura da saída: {}'.format(ceil(float(LE)/float(P))))

model.summary()

Quantidade de parâmetros: 896
Profundidade da camada convolucional: 32
Altura da saída: 64
Largura da saída: 64
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_5 (Conv2D)            (None, 64, 64, 32)        896       
Total params: 896
Trainable params: 896
Non-trainable params: 0
_________________________________________________________________


---
## Agragação max pooling no Keras

<img src='img/maxpool.jpeg' width=500px>

Para criar camadas max pooling no Keras, é necessário importar o módulo [**`MaxPooling2D`**](https://keras.io/layers/pooling/#maxpooling2d), como no exemplo abaixo:

```
from keras.layers import MaxPooling2D
```

Para criar a camada, usa-se o formato a seguir:

```
MaxPooling2D(pool_size, strides, padding)
```

### Argumentos

O seguinte argumento é obrigatório em uma camada max pooling no Keras:

* **`pool_size`**: número ou tupla que especifica as dimensões (altura e largura) da janela de agregação.

Os argumentos a seguir são opcionais:

* **`strides`**: número ou tupla que especifica o passo vertical e horizontal da agregação. Se não for especificado, assume o mesmo valor que `pool_size`.
* **`padding`**: pode ser `'valid'` (não há preenchimento, fazendo com que a janela de convolução ocupe apenas as posições válidas) ou `'same'` (há preechimento, fazendo com que a convolução resulte em uma saída com as mesmas dimensões da entrada). Se não for especificado, assume o valor padrão `'valid'`.

Para mais explicações a respeito do módulo, é recomendável que se leia a [documentação](https://keras.io/layers/pooling/#maxpooling2d).

### Exemplos

**Primeiro exemplo:** Digamos que você está construindo uma CNN e gostaria de reduzir a dimensionalidade de uma camada convolucional, adicionando uma camada max pooling na sequência. Digamos que a camada convolucional tem tamanho `(100, 100, 15)`, e você gostaria que a camada max pooling tivesse tamanho `(50, 50, 15)`. Você pode fazer isso usando uma janela 2x2 na sua camada de agregação max-pooling, com um passo de 2, o que pode ser feito com a seguinte linha de código:

```
MaxPooling2D(pool_size=2, strides=2)
```

**Segundo exemplo:** Se você quisess usar um passo de 1, mas manter o tamanho da janela em 2x2, então você usaria:

```
MaxPooling2D(pool_size=2, strides=1)
```

---
## Dimensionalidade das camadas max pooling

Altere os argumentos da camada max pooling do código abaixo e observe como a saída muda para entender como a forma da camada max pooling se altera:

In [15]:
from keras.models import Sequential
from keras.layers import MaxPooling2D

model = Sequential()
model.add(MaxPooling2D(pool_size=2, strides=2, 
                       input_shape=(100, 100, 15)))
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
max_pooling2d_10 (MaxPooling (None, 50, 50, 15)        0         
Total params: 0
Trainable params: 0
Non-trainable params: 0
_________________________________________________________________


---
## CNNs para classificação de imagens

Nesta seção, vamos implementar uma CNN simples que pode ser treinada usando as imagens do CIFAR-10 (cujas dimensões são (32, 32, 3)). O código abaixo já implementa toda a rede, e logo em seguida há uma discussão sobre o que foi implementado.

In [16]:
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

model = Sequential()

model.add(Conv2D(filters=16, kernel_size=2, padding='same', 
                 activation='relu', input_shape=(32, 32, 3)))
model.add(MaxPooling2D(pool_size=2))
model.add(Conv2D(filters=32, kernel_size=2, padding='same', 
                 activation='relu'))
model.add(MaxPooling2D(pool_size=2))
model.add(Conv2D(filters=64, kernel_size=2, padding='same', 
                 activation='relu'))
model.add(MaxPooling2D(pool_size=2))
model.add(Flatten())
model.add(Dense(500, activation='relu'))
model.add(Dense(10, activation='relu'))

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_6 (Conv2D)            (None, 32, 32, 16)        208       
_________________________________________________________________
max_pooling2d_11 (MaxPooling (None, 16, 16, 16)        0         
_________________________________________________________________
conv2d_7 (Conv2D)            (None, 16, 16, 32)        2080      
_________________________________________________________________
max_pooling2d_12 (MaxPooling (None, 8, 8, 32)          0         
_________________________________________________________________
conv2d_8 (Conv2D)            (None, 8, 8, 64)          8256      
_________________________________________________________________
max_pooling2d_13 (MaxPooling (None, 4, 4, 64)          0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 1024)              0         
__________

A rede começa com uma sequência de três camadas convolucionais, cada uma com uma camada max pooling logo em seguida. Estas primeiras seis camadas são projetadas para receber o vetor de pixels de uma imagem de entrada e converte este em um vetor em que toda a informação espacial fo espremida, de modo que apenas informações sobre o conteúdo da imagem permanecem. O vetor bidimensional é então achatada em um vetor simples na sétima camada da CNN. Na sequência, foram adicionadas duas camadas densas para esclarecer ainda mais o conteúdo da imagem. A última camada tem uma entrada para cada classe de objeto no conjunto de dados do CIFAR-10, além de uma função de ativação softmax, para que ela retorne probabilidades.

**Lembretes**
* É recomendável que sempre se adicione uma função de ativação ReLu às camadas `Conv2D` de uma CNN; exceto pela última camada da rede, camadas `Dense` também devem ter uma função de ativação ReLu.
* Quando estiver construindo uma rede para classificação, a última camada da rede deve ser uma camada `Dense` com função de ativação softmax. O número de nós dessa camada deve ser igual ao número total de classes no conjunto de dados.