References:

- [Clean, scalable and easy to use ResNet implementation in Pytorch, Francesco Saverio Zuppichini.](https://github.com/FrancescoSaverioZuppichini/ResNet)
- [Dumoulin, V., & Visin, F. (2016). A guide to convolution arithmetic for deep learning. arXiv preprint arXiv:1603.07285.](https://arxiv.org/pdf/1603.07285.pdf)
-

__Redigir isso aqui em inglês (para praticar).__

As operações de convolução aplicadas ao longo da rede devem manter a dimensionalidade do tensor de entrada, e a redução dessa dimensionalidade é controlada pelas operações de pooling (operação essa que tanto reduz o custo de processamento quanto tem benefícios quanto ao aprendizado do modelo).

É possível determinar relações aritméticas simples entre a dimensão de saída da convolução e os seus parâmetros, em particular, utilizando o parâmetro unitário de stride (s) (quantidade de passos do kernel convolucional) e zero padding (p) (adição de zeros nas bordas do tensor), sendo $i$, $k$ e $o$ as dimensões de input, do kernel e de output, respectivamente, temos a seguinte relação:

__Relação 1:__ Para quaisquer $i$, $k$, $p$ e $s = 1$, vale que $o = (i - k) + 2p + 1$.

Portanto, supondo que $k = 2\cdot n + 1$ para algum $n \in \mathbb{N}$, então podemos definir o parâmetro de padding como $p = k // 2 = n$, e conseguimos $o = (i - 2\cdot n - 1) + 2 \cdot [(2n + 1) // 2] + 1 = i$. Para simplificar a implementação, é possível implementar (classe __Conv2dAuto__) o padding automático como uma extensão da classe base de convolução bidimensional disponível no PyTorch.

In [None]:
class Conv2dAuto(nn.Conv2d):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.padding = (self.kernel_size[0] // 2, self.kernel_size[1] // 2) 

__Bloco Residual__

Explicar o funcionamento do bloco residual.

Responder:

1. Por que utilizar uma classe abstrata ResidualBlock?

Explicar:

1. "property"
2. Expansion e Downsampling
3. self.conv no ResNetResidualBlock
4. Diferença entre ResidualBlock e ResNetResidualBlock
5. Ordered Dict
6. Por que usar uma convolução de 1 entrada no shortcut?
7. Diferença entre ResidualBlock, ResNetResidualBlock, ResNetBasicBlock
8. Pra que serve o BottleNeckBlock

In [2]:
from torch import Tensor
from torch.nn import Sequential

In [None]:
from collections import OrderedDict

In [None]:
class ResidualBlock(nn.Module):
    def __init__(self, in_channels: int, out_channels: int):
        super().__init__()
        self.in_channels, self.out_channels = in_channels, out_channels
        self.blocks = nn.Identity()
        self.shortcut = nn.Identity()
        
    def forward(self, x: Tensor) -> Tensor:
        residual = self.shortcut(x) if self.should_apply_shortcut else x
        x = self.blocks(x) + residual
        return x
    
    @property
    def should_apply_shortcut(self):
        return self.in_channels != self.out_channels
    
def conv_bn(in_channels, out_channels, convolution, *args, **kwargs) -> Sequential:
    return nn.Sequential(OrderedDict({
        'conv': convolution(in_channels, out_channels, *args, **kwargs),
        'bn': nn.BatchNorm2d(out_channels)
    }))
    
class ResNetResidualBlock(ResidualBlock):
    def __init__(self, in_channels: int, out_channels: int, expansion: int = 1, downsampling: int = 1, 
                 *args, **kwargs):
        self.expansion = expansion
        self.downsampling = downsampling
        self.conv = partial(Conv2dAuto, kernel_size = 3, bias = False) # Really needed?
        
        self.shortcut = conv_bn(self.in_channels, self.expanded_channels, nn.Conv2d, 
                                kernel_size = 1, stride = self.downsampling, bias = False) if self.should_apply_shortcut else None
    @property
    def expanded_channels(self):
        return self.out_channels * self.expansion
    
    @property
    def should_apply_shortcut(self):
        return self.in_channels != self.expanded_channels
    

class ResNetBasicBlock(ResNetResidualBlock):
    expansion = 1
    def __init__(self, in_channels, out_channels, activation = nn.ReLU, *args, **kwargs):
        super().__init__(in_channels, out_channels, *args, **kwargs)
        self.blocks = nn.Sequential(
            conv_bn(self.in_channels, self.out_channels, conv = self.conv, bias = False, stride = self.downsampling),
            activation(),
            conv_bn(self.out_channels, self.expanded_channels, conv = self.conv, bias = False),
        )
        
class ResNetBottleNeckBlock(ResNetResidualBlock):
    expansion = 4
    def __init__(self, in_channels, out_channels, activation = nn.ReLU, *args, **kwargs):
        super().__init__(in_channels, out_channels, expansion = 4, *args, **kwargs)
        self.blocks = nn.Sequential(
            conv_bn(self.in_channels, self.out_channels, self.conv, kernel_size = 1),
            activation(),
            conv_bn(self.out_channels, self.out_channels, self.conv, kernel_size = 3, stride = self.downsampling),
            activation(),
            conv_bn(self.out_channels, self.expanded_channels, self.conv, kernel_size = 1),
        )
        
class ResNetLayer(nn.Module):
    def __init__(self, in_channels, out_channels, block = ResNetBasicBlock, n = 1, *args, **kwargs):
        super().__init__()
        downsmapling = 2 if in_channels != out_channels else 1
        
        self.blocks = nn.Sequential(
            block(in_channels, out_channels, *args, **kwargs, downsampling = downsmapling),
            *[block(out_channels * block.expansion, out_channels, downsampling = 1, *args, **kwargs) for _ in range(n - 1)]
        )
        
    def forward(self, x: Tensor) -> Tensor:
        x = self.blocks(x)
        return x

__Estrutura do Texto__

1. Explicação das componentes da rede.
2. Explicação dos dois módulos principais da rede.
3. Rede propriamente dita.

Por que aumentar os atributos ao longo do encoder?

Para que serve o gate?

In [None]:
class ResNetEncoder(nn.Module):
    def __init__(self, in_channels = 3, blocks_sizes = [64, 128, 256, 512], depths = [2, 2, 2, 2],
                 activation = nn.ReLU, block = ResNetBasicBlock, *args, **kwargs):
        super().__init__()
        
        self.blocks_sizes = blocks_sizes
        
        self.gate = nn.Sequential(
            nn.Conv2d(in_channels, self.blocks_sizes[0], kernel_size = 7, stride = 2, padding = 3, bias = False),
            nn.BatchNorm2d(self.blocks_sizes[0]),
            activation(),
            nn.MaxPool2d(kernel_size = 3, stride = 2, padding = 1)
        )
        
        self.in_out_block_sizes = list(zip(blocks_sizes, blocks_sizes[1:]))
        self.blocks = nn.ModuleList([
            ResNetLayer()
        ])