# 8 PyTorch 中的卷积运算

## 8.1 标准卷积

使用 PyTorch 进行标准卷积运算主要涉及到以下三种类：`nn.Conv1d`、`nn.Conv2d` 和 `nn.Conv3d`。这些类分别用于处理不同类型的数据，如一维序列、二维图像和三维视频数据。

以二维卷积为例，`nn.Conv2d` 类用于二维卷积运算，主要应用于处理图像数据，如在卷积神经网络（CNN）中对图像进行特征提取。

`nn.Conv2d` 的初始化参数如下：

- `in_channels`: 输入数据的通道数。
- `out_channels`: 输出数据的通道数，也是卷积核的数量。
- `kernel_size`: 卷积核的大小，可以是一个整数或者一个二元组 (height, width)。
- `stride`: 卷积核在输入数据上的步长，默认为1，可以是一个整数或者一个二元组 (height, width)。
- `padding`: 输入数据两侧填充的宽度，默认为0，可以是一个整数或者一个二元组 (height, width)。
- `dilation`: 卷积核元素之间的间距，默认为1，可以是一个整数或者一个二元组 (height, width)。
- `groups`: 控制输入和输出之间的连接方式，默认为1，表示输入通道和输出通道是一一对应的。
- `bias`: 是否添加偏置项，默认为True。
- `padding_mode`: 填充模式，默认为'zeros'。

In [3]:
import torch
import torch.nn as nn

conv2d = nn.Conv2d(in_channels=3, out_channels=16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), dilation=(1, 1), groups=1, bias=True, padding_mode='zeros')

# 示例输入数据：batch_size = 4, height = 32, width = 32
input_data = torch.randn(4, 3, 32, 32)

# 进行卷积运算
output_data = conv2d(input_data)

print("Input shape: ", input_data.shape)  # 输出：Input shape:  torch.Size([4, 3, 32,32])
print("Output shape: ", output_data.shape)  # 输出：Output shape:  torch.Size([4, 16, 32, 32])



Input shape:  torch.Size([4, 3, 32, 32])
Output shape:  torch.Size([4, 16, 32, 32])




## 8.2 转置卷积

## 8.3 分组卷积

## 8.4 深度可分离卷积