# CAMADA DE POOLING

In [1]:
import torch
from torch import nn

from skimage import data

In [2]:
tensor = torch.FloatTensor([ [ [ 1, 2,3 ], 
                            [4,5,6], 
                            [7,8,9]  ] ] )
# camada de pooling
pool = nn.MaxPool2d(2, # tamanho do kernel
                    stride=1) # tamanho do stride
saida = pool(tensor)

print(tensor.size())
print(tensor)
print(saida.size())
print(saida)


torch.Size([1, 3, 3])
tensor([[[1., 2., 3.],
         [4., 5., 6.],
         [7., 8., 9.]]])
torch.Size([1, 2, 2])
tensor([[[5., 6.],
         [8., 9.]]])


In [3]:
conv = nn.Conv2d(in_channels=3, out_channels=16, 
                 kernel_size=3, padding=1)

rgb = data.astronaut()
rgb_tns = torch.Tensor(rgb)
rgb_tns = rgb_tns.permute(2, 0, 1).unsqueeze(0)
mapa_de_ativacao = conv(rgb_tns)
print('Feature Map:', mapa_de_ativacao.shape)

Feature Map: torch.Size([1, 16, 512, 512])


In [4]:
#em geral se deixa a janela deslizante (stride) do mesmo tamanho do kernel
pool = nn.MaxPool2d(kernel_size=2)
saida = pool(mapa_de_ativacao)
print(saida.size())

torch.Size([1, 16, 256, 256])


# CAMADA DE NORMALIZAÇÃO

Ela deve ser reinstanciada sempre que utilizada, pois possui estado: parâmetros aprendidos ao longo da execução.

In [8]:
# rgb_tns: foto astronauta

kernel_size_val1 = 3
kernel_size_val2 = 10
bloco_conv = nn.Sequential(
    nn.Conv2d(3, 32, kernel_size=kernel_size_val1, padding=1), # 32 camadas de ativação
    nn.BatchNorm2d(32), # 32 canais para normalizar -> não muda a dimensionalidade
    nn.ReLU(),
    nn.MaxPool2d(kernel_size=kernel_size_val2)
)
print(bloco_conv)
print(rgb_tns.size())

saida = bloco_conv(rgb_tns)
print(saida.size())



Sequential(
  (0): Conv2d(3, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (1): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (2): ReLU()
  (3): MaxPool2d(kernel_size=10, stride=10, padding=0, dilation=1, ceil_mode=False)
)
torch.Size([1, 3, 512, 512])
torch.Size([1, 32, 51, 51])
