# Redes neurais convolucionais (CNN)

Normalmente utilizamos essas redes para processar imagens ou vídeos.

A diferença entre uma rede neural densa e a convolucional, é que a rede neural densa possui todos os neurônios de uma camada conectados a todos os neurônios da próxima camada.

Já a rede neural convolucional é uma rede densa, mas nela é realizado um pré processamento das entradas (que normalmente são imagens ou vídeos). Com isso esse pré processamento, não são utilizados todos os pixels como entrada para a rede.

Isso se deve ao fato de que seria muitas entradas, caso seja uma imagem grande e colorida. Exemplo uma imagem colorida de 1024px x1024px teria o total de 1024 * 1024 = 1.048.576‬ pixels.

Como sabemos, as imagens coloridas são compostas por 3 canais de cores. Vermelho, verde e azul, como mostra a figura abaixo:

![](rgb_image.png)

Então, temos que considerar que a quantidade total de pixels que a rede neural terá que processar de apenas uma imagem colorida seria 1.048.576‬ * 3 = 3.145.728‬ pixels ao total.

Por isso que é feito o pré processamento antes de inserir as entradas na rede.



Logo, a CNN irá identificar automaticamente qual será as características importantes da imagem para que consigamos classificá-las. Pois nem todos os pixels serão importantes para a classificação.

## Vamos seguir algumas etapas para fazer a rede neural convolucional

Todo o processo pode ser observar com a imagem a seguir e vamos detalhá-los a seguir.


![](Convolutional_neural_network_process.png)

### Etapa de convolução


O processo de convolução de imagens pode ser representado pela figura abaixo:
![](convolutional_process.png)

Onde o convolution filter é o kernel que multiplica a imagem (que é representada por uma matriz).

O destination pixel é parte da nova imagem após multiplicarmos o kernel pela imagem original.

Aplicamos o kernel em cada pixel da imagem, até que todos os pixels tenham sido percorridos.

E nota-se que dependendo do kernel que aplicamos, teremos uma imagem resultando com um efeito diferente. No caso da imagem acima, o filtro Sobel realça as bordas da imagem.

Na imagem abaixo podemos visualizar os diferentes efeitos que podemos obter:



![](kernels_examples.png)

Há um site que é possível aplicar diversos kernels diferentes a fim de obter imagens com filtros diferentes.
Basta acessar: https://setosa.io/ev/image-kernels/

O processo da aplicação do kernel pode ser visto na animação abaixo:
![](process_application_kernel_in_image.gif)

Nesta parte da convolução é possível aplicar filtros de modo que a gente adquira da imagem apenas determinadas características. Como por exemplo ao aplicarmos filtros de realce de bordas.

Todo o processo pode ser mostrado na imagem:
![](convolutional_layer.png)

Podemos notar que ao aplicarmos o kernel na imagem, vamos diminuir a dimensão da imagem resultante. E essa imagem resultante, chamamos de feature map, pois ela possui as características principais.

E quando convoluimos a imagem, iremos gerar várias feature maps pois o algoritmo irá decidir qual será as características principais.

##### Observação

Quando a imagem possui valores negativos, podemos aplicar a função RELU nas imagens. Que tem por resultado a retirada de partes escuras da imagem.

Que possui um efeito mostrado abaixo: 
![](relu_in_images.png)

### Etapa de pooling

Nessa etapa, será realçada as características que antes foram encontradas.

Podemos ver uma simulação de como funciona o pooling na animação abaixo.
Na animação abaixo estamos observando o máx pooling, porém podemos ter o mín pooling, o mean pooling, etc.

![](max_pooling_operations.gif)

Podemos notar que ao aplicarmos o pooling, a dimensão da imagem resultante também será reduzida.

Lembrando que: 
- Essa etapa pode reduzir o overfitting da rede e ruídos desnecessários
- Como nas redes neurais convolucionais queremos maximizar as características relevantes, utilizamos o máx pooling.

### Etapa de Flattening


Nesta etapa iremos transformar a matriz da etapa anterior em um vetor praticamente. Como ilustrado na figura abaixo:

![](flattening.png)

Como temos um vetor, então poderemos utilizá-lo como entrada para a rede neural.

## Resumo


Todo o processo pode ser resumido com as imagens abaixo.

![](Convolutional_neural_network_process2.png)

Tem um site que permite que você desenhe algum número e permite que você veja cada etapa em 3D.

O site é: https://www.cs.ryerson.ca/~aharley/vis/conv/

E a imagem abaixo mostra o processo de reconhecimento do número 1, por exemplo.

![](process_cnn_3D.png)