# **填充和步长**

假设图片的维度是$n_h \times n_w$， 卷积核的维度为$ k_h \times k_w$。    
则输出的形状应该是：
$(n_h - k_h + 1) \times (n_w - k_w + 1)$     
但是是建立在不考虑**步长**和**填充**的基础上的

In [2]:
import torch
import torch.nn as nn

## **填充**

**在图片的长和高两侧各添加0使得输入和输出相等大小的操作**    
假设padding在高两侧总共添加$p_h$行，在宽两边总共添加了$p_w$列，则卷积之后的大小为：    
$(n_h - k_h + p_h + 1) \times (n_w - k_w + p_w + 1)$      
如果要使输出和输入处于同样的维度的话$p_h = k_h - 1$   $p_w = k_w - 1$

在下面的例子里面我们假设一个8\*8维的图片，卷积核的大小为3\*3, 我们在图片的两端各添加一列一行，则输出也是8\*8的

In [6]:
x = torch.randn(8,8)

我们使用torch自带的conv类

In [7]:
conv2d = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, padding=1)

In [8]:
def comp_conv2d(conv2d, X):
    X = X.view((1, 1) + X.shape) # (1, 1, 8, 8)为了加入batch_size和channels才能进行计算
    Y = conv2d(X)
    return Y.view(Y.shape[2:])

In [10]:
comp_conv2d(conv2d, x).shape

torch.Size([8, 8])

当卷积核大小不是矩形时，padding的大小也应该做相应的转化

In [12]:
con2d = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(con2d, x).shape

torch.Size([8, 8])

## **步长**

步长是一次互相关运算后，卷积核移动的幅度,假设步长分别为$s_h \times s_w$,那么输出的维度为：     
$(\large {\frac {n_h - k_h + p_h}{s_h} + 1) \times (\frac {n_w - k_w + p_w}{s_w} + 1)}$

In [16]:
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, x).shape

torch.Size([4, 4])

In [19]:
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, x).shape

torch.Size([2, 2])

[参考链接](https://pytorch.org/docs/stable/nn.html#conv2d)