# Videoaula: Camadas em redes convolucionais

## Camadas de Pooling e Max Pooling

> Esta camada recebe as saídas do mapa, originado na camada convolucional, e para ela cria um mapa de características condensado.

> A camada de pooling é capaz de resumir uma região de neurônios da camada anterior.

> Na maioria das ocasiões ocorre o Max-Pooling, onde uma unidade gera uma unidade máxima em sua respectiva região de entrada.

> No pooling temos a camada convolucional com multiplos mapas de características, e desta forma, cada mapa recebe o Max Pooling, separadamente.

> Generalizando, temos que o Max-Pooling permite que seja encontrada a informação da localização aproximada de certo parâmetro em uma imagem, embora não mantenha a sua localização exata.

> O que importa aqui é a localização com relação aos outros elementos e recursos da imagem, por exemplo.

> Este processo acumula muto menos recursos, o que indica a existência de uma menor quantidade de parâmetros para as camadas seguintes.

> Como opção ao Max-Pooling existe o Pooling L2, que realiza a raiz quadrada para a soma dos quadrados das ativações de uma determinada região.

> Mas a "intuição" é semelhante nos processos de Pooling L2 e Max-Pooling, pois ambos condensam as informações da camada convolucional.

> A camada de conexão final conecta cada neurônio na camada de agrupamento máximo a cada um dos 10 neurônios de saída.

> Essa arquitetura totalmente conectada é a mesma usada no capítulo anterior.

> Tenho uma rede que consiste em muitas entidades simples cujo comportamento é determinado por seus pesos e vieses. O objetivo geral é o mesmo.

> Os dados de treinamento devem ser utilizados para aprender os pesos e vieses da rede para que a rede classifique adequadamente os dígitos de entrada.

Principais projetos que contribuíram para as arquiteturas atuais de Redes Neurais:

**- LeNET:** Criado em 1998, contém as camadas de convolução e a respectiva sequência CONV - POOL - CONV - POOL - FC - FC.

**- AlexNET:** Criado em 2012, com 5 camadas de convolução, 128 de Batch e inaugurou o uso da função de ativação ReLU.

**- VGG:** Criada em 2014 apresentando filtros menores para ser aplicada em redes com maior profundidade, ou seja, mais de 12 convoluções para Max-Pooling de 2x2. O grande problema é a demanda por memória ram.

# Pré-processamento em ConvNets

## Execução de algoritmo utilizando a camada Max Pooling

In [1]:
import numpy as np
from tf_keras.models import Sequential
from tf_keras.layers import MaxPooling2D




In [2]:
# Define input image
image = np.array([
    [2, 2, 7, 3],
    [9, 4, 6, 1],
    [8, 5, 2, 4],
    [3, 1, 2, 6],
                  ])

image = image.reshape(1, 4, 4, 1)

In [3]:
# Define model containing just a single max pooling layer
model = Sequential([MaxPooling2D(pool_size= 2, strides= 2)])





In [4]:
# Generated pooled output
output = model.predict(image)



In [5]:
# Print output image
output = np.squeeze(output)
print(output)

[[9 7]
 [8 6]]


## Execução de algoritmo utilizando a camada Pooling médio

In [15]:
import numpy as np
from tf_keras.models import Sequential
from tf_keras.layers import AveragePooling2D
import tensorflow as tf

In [16]:
# Define input image
image = np.array([
    [2, 2, 7, 3],
    [9, 4, 6, 1],
    [8, 5, 2, 4],
    [3, 1, 2, 6],
                  ])

In [17]:
image = image.reshape(1, 4, 4, 1)
image = tf.cast(image, tf.float32)  # Convert to float32

In [18]:
# Define model containing just a single max pooling layer
model = Sequential([AveragePooling2D(pool_size= 2, strides= 2)])

In [19]:
# Generated pooled output
output = model.predict(image)



In [20]:
# Print output image
output = np.squeeze(output)
print(output)

[[4.25 4.25]
 [4.25 3.5 ]]


## Execução do algoritmo utilizando camada de agrupamento global

In [25]:
import numpy as np
from tf_keras.models import Sequential
from tf_keras.layers import GlobalAveragePooling2D, GlobalMaxPooling2D
import tensorflow as tf

In [26]:
# Define input image
image = np.array([
    [2, 2, 7, 3],
    [9, 4, 6, 1],
    [8, 5, 2, 4],
    [3, 1, 2, 6],
                  ])

In [27]:
image = image.reshape(1, 4, 4, 1)
image = tf.cast(image, tf.float32)  # Convert to float32

In [28]:
# Define model containing just a single max pooling layer
gm_model = Sequential([GlobalMaxPooling2D()])
ga_model = Sequential([GlobalAveragePooling2D()])

In [29]:
# Generated pooled output
gm_output = gm_model.predict(image)
ga_output = ga_model.predict(image)



In [30]:
# Print output image
gm_output = np.squeeze(gm_output)
ga_output = np.squeeze(ga_output)
print(f'gm_output: {gm_output}\nga_output: {ga_output}\n')

gm_output: 9.0
ga_output: 4.0625

