# Aula 04 - CNNs

Na aula de hoje, vamos explorar os seguintes tópicos em Python:

- Redes Neurais Convolucionais (CNN);
- Convoluções;
- _Pooling_;
- Exercícios.

##   

# Redes Neurais Convolucionais (CNN)

As Redes Neurais Convolucionais são um ti´po de arquitetura específica para a análise de __imagens__, sendo um braço forte para modelos de __visão computacional__. As principais diferenças entre uma rede neural tradicional e uma CNN são dois tipos de camadas: as __convoluções__ e a __subamostragem (pooling)__.

<img src="https://miro.medium.com/max/3288/1*uAeANQIOQPqWZnnuH-VEyw.jpeg" width=600>


## Convoluções

As convoluções têm como objetivo destacar elementos nas imagens que forem relevantes utilizando da aplicação de filtros. A forma como o filtro funciona seria como uma transformação matemática entre matrizes:

<img src="https://miro.medium.com/max/658/0*jLoqqFsO-52KHTn9.gif" width=500>

Com esses filtros, consegue-se criar os chamados __features maps__ ou mapas de atributo, que seria novas imagens destaques em determinados pontos da imagem de acordo com os filtros a serem aplicados:

<img src="https://miro.medium.com/max/875/1*ixuhX9vaf1kUQTWicVYiyg.png" width=900>

## Pooling

A camada de _Pooling_ ou também chamada de Subamostragem, ajuda a selecionar os principais elementos de uma imagem garantindo que seja representativo da imagem de origem. Então determinada uma janela de aplicação da subamostragem, o modelo percorre toda imagem aplicando algum tipo de agregação, como por exemplo média, máximo ou mesmo soma:

<img src="https://miro.medium.com/max/2340/1*Fw-ehcNBR9byHtho-Rxbtw.gif" width=600>

<img src="https://www.bouvet.no/bouvet-deler/understanding-convolutional-neural-networks-part-1/_/attachment/inline/e60e56a6-8bcd-4b61-880d-7c621e2cb1d5:6595a68471ed37621734130ca2cb7997a1502a2b/Pooling.gif" width=600>

A Aplicação do _Pooling_ auxilia na rede no sentido de manter determinados pontos relevantes da imagem, mas auxilia ao mesmo tempo a generalizar para as demais imagens.

<img src = "https://www.bouvet.no/bouvet-deler/understanding-convolutional-neural-networks-part-2/_/attachment/inline/607c9f97-d102-4025-9d6d-4149831f1bc2:7486b2c8566539842998faeec3cd28d2d0aa5360/Screenshot%202019-07-01%20at%2019.43.59.png" width=800>


Notem que fazer esses processos envolvem sempre redução do tamanho ou da qualidade da imagem, mas podemos evitar esse tipo de efeito utilizando de duas técnicas auxiliares que são o __zero-padding__ e o __stride__

<br><br>

- _Zero-Padding_: Consiste em adicionar uma camada de zeros ao redor da imagem com o intuito de preservar o tamanho da imagem antes da convoluções ou subamostragem e sem acrescentar viés a transformação:

<img src = "https://deeplizard.com/assets/jpg/2b25a0c1.jpg" width=800>

- _Stride_: Consiste em determinar "saltos" durante a aplicação das janelas de filtros, sendo esses saltos tanto na vertical quanto na horizontal:

<img src = "https://miro.medium.com/max/1400/1*4wZt9G7W7CchZO-5rVxl5g@2x.gif" width=600>

## 

##  Exemplo - Fashion MNIST

Vamos revisitar o exercício do MNIST utilizando agora de uma CNN para avaliar as imagens:

In [None]:
# TensorFlow e tf.keras
import tensorflow
import keras

# Bibliotecas Auxiliares
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [None]:
#Baixando a nossa base de dados

fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

In [None]:
class_names = ['T-shirt/top', 
               'Trouser', 
               'Pullover', 
               'Dress', 
               'Coat',
               'Sandal', 
               'Shirt', 
               'Sneaker', 
               'Bag', 
               'Ankle boot']

## Pré-Processamento dos Dados

In [None]:
# Reshape

#Faça o reshape da train_images dividindo por 255. e salvando na mesma variavel


#Faça o reshape da test_images dividindo por 255. e salvando na mesma variavel


In [None]:
# Montar as camadas


In [None]:
# Crie um compile() com os seguintes parametros:


# Crie o summary() para o modelo


In [None]:
# Faça o fit do modelo passando train_images, train_labels e epochs = 10


In [None]:
# crie o pred_labels usando a função predict_classes para o test_images


In [None]:
from mlxtend.plotting import plot_confusion_matrix
from sklearn.metrics import classification_report, confusion_matrix

# Faça o print do classification_report para pred_labels e test_labels


In [None]:
# Crie a matriz de confusão para o pred_labels e test_labels


## 

## Exercícios

__1)__ Desenvolva uma rede CNN para a base MNIST de classificação de dígitos, seguindo os passos abaixo:
- Carregue os dados segundo a função dada em aula, utilize os dados de teste como dados em __produção__, ou seja iremos usar em um outro momento;
- Nomeie os dados de treino como X e faça as seguintes separações: X em treino e teste (90/10%) e depois o X de treino em treino e validação (80/20%);
- Monte uma CNN;
- Faça as predições, avalie overfitting e salve o modelo final e os dados de produção;
- Carregue o modelo treinado e os dados de produção, e faça as novas predições.