## Convolution
* 이미지 위에서 stride 값 만큼 filter(kernel)을 이동시키면서 겹쳐지는 부분의 각 원소의 값을 굽해서 모두 더한 값을 출력으로 하는 연산
* stride : filter를 한번에 얼마나 이동할 것인가
* padding : zero-padding (0으로 둘러쌈) 



* torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)
    * kernel_size = (axb) 원하는 형태로 만들수 있음 
        * kernel_size = 3 -> 3x3 filter
    * channel : rgb는 3채널
    
    
### 입력의 형태
* input type: torch.Tensor
* input shape : (N x C x H x W) (batch_size, channel, height, width)

* Convolution output의 크기
    * $output size = \frac{input size -filter size + (2*padding)}{Stride} + 1$
    * input size가 정사각형이 아닐때도 (a,b)를 각각 계산

* Pooling
    * Max Pooling -> 크기를 줄이면서 각 파트별로 max값만 남김
    * Average Pooling -> 크기를 줄이면서 각 파트마다 평균값만 남김


* nn.Conv2d에 입력
* filter size 변경(size = 1x1, 3x3, 5x5)
* bias
* stride
* padding

### Cross-correlation vs Convolution
* 뒤집고 계산하면 Convolution
* 안 뒤집고 계산하면 Cross-Correlation
* 크게 중요하지 않음

In [3]:
import torch
import torch.nn as nn

In [13]:
# input image size : 227 x 227
# filter size = 11 x 11
# stride =4
# padding = 0

conv = nn.Conv2d(1,1,11, stride=4, padding=0)

In [14]:
conv

Conv2d(1, 1, kernel_size=(11, 11), stride=(4, 4))

In [15]:
inputs = torch.Tensor(1,1,227,227)

In [11]:
inputs.shape

torch.Size([1, 1, 227, 227])

In [18]:
out = conv(inputs)
out

tensor([[[[-0.0852, -0.0852, -0.0852,  ..., -0.0852, -0.0852, -0.0852],
          [-0.0852, -0.0852, -0.0852,  ..., -0.0852, -0.0852, -0.0852],
          [-0.0852, -0.0852, -0.0852,  ..., -0.0852, -0.0852, -0.0852],
          ...,
          [-0.0852, -0.0852, -0.0852,  ..., -0.0852, -0.0852, -0.0852],
          [-0.0852, -0.0852, -0.0852,  ..., -0.0852, -0.0852, -0.0852],
          [-0.0852, -0.0852, -0.0852,  ..., -0.0852, -0.0852, -0.0852]]]],
       grad_fn=<MkldnnConvolutionBackward>)

In [17]:
out.shape

torch.Size([1, 1, 55, 55])

In [21]:
# input image size : 64 x 32
# filter size = 11 x 11
# stride = 2
# padding = 1
conv = nn.Conv2d(1,1,11, stride=2, padding=1)
inputs = torch.Tensor(1,1,64,32)
conv(inputs).shape

torch.Size([1, 1, 28, 12])

In [23]:
inputs = torch.Tensor(1,1,28,28)
conv1 = nn.Conv2d(1,5,5)
pool = nn.MaxPool2d(2) # 최대값 Pooling
out = conv1(inputs)
out2 = pool(out)
print(out.size())
print(out2.size())

torch.Size([1, 5, 24, 24])
torch.Size([1, 5, 12, 12])
