# Convolutional Neural Networks (Conv2d)

## Импорт библиотек

In [5]:
import torch
import torch.nn as nn

### Расчет внутренних параметров для модели

**Универсальная формула размера выхода сверточного слоя:**

$$
H_{out} = \left\lfloor \frac{H_{in} + 2P - 1*(K[0]-1)-1}{S[0]} + 1 \right\rfloor
$$

$$
W_{out} = \left\lfloor \frac{W_{in} + 2P - 1*(K[1]-1)-1}{S[1]} + 1 \right\rfloor
$$

Где:
- $H_{in}, W_{in}$ — высота и ширина входа,
- $K$ — размер ядра (kernel),
- $S$ — шаг (stride),
- $P$ — дополнение (padding),
- $\lfloor \cdot \rfloor$ — округление вниз.

**Формула для квадратных карт и ядер:**

$$
O = \left\lfloor \frac{I + 2P - K}{S} \right\rfloor + 1
$$

$(O = H_{out} = W_{out}, \quad I = H_{in} = W_{in})$

**Стандартные комбинации параметров для построения CNN**
    
$\textcolor{blue}{\ \ \ kernel = (3,3), \ \ stride = (1,1), \ \ padding = (0, 0)}$

$ \ \ \ \ \ \  H_{out} = H_{in} - 2 $

$ \ \ \ \ \ \  W_{out} = W_{in} - 2 $


$\textcolor{blue} {\ \ \ kernel = (3,3), \ \ stride = (1,1),  \ \ padding = (1, 1)}$

$ \ \ \ \ \ \  H_{out} = H_{in}$

$ \ \ \ \ \ \  W_{out} = W_{in}$


$\textcolor{blue} {\ \ \ kernel = (3,3), \ \ stride = (2,2), \ \ padding = (0, 0)}$

$ \ \ \ \ \ \  H_{out} = \frac{(H_{in} - 3 )}{2} + 1$

$ \ \ \ \ \ \  W_{out} = \frac{(W_{in} - 3 )}{2} + 1 $

### Первый способ создания модели

In [6]:
# модель, на вход котрой можно подать тензор любого размера, так как H и W не указаны, но их нужно контролировать

model = nn.Sequential(
            nn.Conv2d(3, 32, (3, 3)),   # inp => (batch_size, 3, 28, 28), out => (batch_size, 32, 26, 26)
            nn.ReLU(),
            nn.Conv2d(32, 64, (3, 3))   # inp => (batch_size, 32, 26, 26), out => (batch_size, 64, 24, 24)
        )

model

Sequential(
  (0): Conv2d(3, 32, kernel_size=(3, 3), stride=(1, 1))
  (1): ReLU()
  (2): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1))
)

In [7]:
input = torch.rand([16, 3, 28, 28], dtype = torch.float32)

out = model(input)
out.shape

torch.Size([16, 64, 24, 24])

### Второй способ создания модели

In [8]:
# модель, на вход котрой можно подать тензор любого размера, так как H и W не указаны, но их нужно контролировать

model = nn.Sequential()
model.add_module('layer_1', nn.Conv2d(3, 32, (3, 3)))   # inp => (batch_size, 3, 28, 28), out => (batch_size, 32, 26, 26)
model.add_module('ReLU', nn.ReLU())
model.add_module('layer_2', nn.Conv2d(32, 64, (3, 3)))   # inp => (batch_size, 32, 26, 26), out => (batch_size, 64, 24, 24)

model

Sequential(
  (layer_1): Conv2d(3, 32, kernel_size=(3, 3), stride=(1, 1))
  (ReLU): ReLU()
  (layer_2): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1))
)

In [9]:
input = torch.rand([16, 3, 28, 28], dtype = torch.float32)

out = model(input)
out.shape

torch.Size([16, 64, 24, 24])

In [10]:
model.state_dict()

OrderedDict([('layer_1.weight',
              tensor([[[[-3.4244e-02, -5.9679e-02, -5.3168e-02],
                        [ 1.8156e-01, -1.6948e-01, -6.8992e-02],
                        [-1.6176e-01,  1.6712e-01, -1.2808e-01]],
              
                       [[-5.5074e-02, -1.8277e-01,  7.7060e-03],
                        [ 1.5343e-01, -9.0706e-03, -8.0588e-02],
                        [-3.7625e-02, -7.8920e-02, -4.7904e-02]],
              
                       [[-1.2547e-01, -1.5489e-01,  1.7422e-01],
                        [-1.8869e-01,  1.7620e-01, -4.6875e-02],
                        [-1.6121e-01,  1.4552e-01, -1.0176e-01]]],
              
              
                      [[[-2.2150e-02,  9.3035e-02,  2.1313e-02],
                        [ 1.4509e-01,  9.3141e-02, -1.8331e-01],
                        [-2.7137e-02, -3.5629e-02, -1.0729e-01]],
              
                       [[-1.0296e-01,  9.4397e-02,  2.2084e-02],
                        [ 1.0534e-02, -3.01

In [11]:
model.state_dict()['layer_1.weight'].shape

torch.Size([32, 3, 3, 3])

### Создание класса для модели нейронной сети

In [12]:
class MyModel(nn.Module):
    def __init__(self, in_channels, out_channels):
        super().__init__()
        self.conv_1 = nn.Conv2d(in_channels, 32, (3,3))
        self.conv_2 = nn.Conv2d(32, 

SyntaxError: incomplete input (1800263872.py, line 5)