***
## [torch.nn](https://pytorch.org/docs/stable/nn.html)
nn是神经网络Neural Network的简写，这个库里集成了pytorch的神经网络相关的算法和模型。
***
### Containers
Containers是pytorch中的神经网络模型的容器。
|类|简介|
|---|---|
|Module|所有神经网络模块的基类|
|Sequential|顺序存储容器|
|ModuleList|子模块列表|
|ModuleDict|子模块字典|
|ParameterList|参数列表|
|ParameterDict|参数字典|

其中Module类最常使用。
#### [Module](https://pytorch.org/docs/stable/generated/torch.nn.Module.html#torch.nn.Module)
Module是所有神经网络模块的基类，我们的模型都需要继承它，并且重写其中的__init__和forward等方法。

In [2]:
from torch import nn
import torch

class MyModule(nn.Module):
    def __init__(self):
        super().__init__()

    def forward(self, input):
        output = input + 1
        return output

md = MyModule()
x = torch.tensor(1.)
y = md.forward(x)
print(y)

tensor(2.)


### Convolution Layers 卷积层
Convolution Layers为torch中提供的卷积层模型。
|类|简介|
|---|---|
|nn.Conv1d|对输入进行一维卷积|
|nn.Conv2d|对输入进行二维卷积|
|nn.Conv3d|对输入进行三维卷积|
|nn.ConvTranspose1d|一维转置卷积|
|nn.ConvTranspose2d|二维转置卷积|
|nn.ConvTranspose3d|三维转置卷积|
|nn.LazyConv1d|省略输入参数的Conv1d|
|nn.LazyConv2d|省略输入参数的Conv2d|
|nn.LazyConv3d|省略输入参数的Conv3d|
|nn.LazyConvTranspose1d|省略in_channel的ConvTranspose1d|
|nn.LazyConvTranspose2d|省略in_channel的ConvTranspose2d|
|nn.LazyConvTranspose3d|省略in_channel的ConvTranspose3d|
|nn.Unfold|滑动窗口提取|
|nn.Fold|逆滑动窗口提取|

其中nn.Conv2d常用于图像识别中。
```python
torch.nn.Conv1d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

torch.nn.Conv3d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

torch.nn.ConvTranspose1d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros', device=None, dtype=None)

torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros', device=None, dtype=None)

torch.nn.ConvTranspose3d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros', device=None, dtype=None)
```
**Parameters**
* in_channels   - 输入通道数
* out_channels  - 卷积产生的通道数
* kernel_size   - 卷积核大小，int或者tuple
* stride        - 卷积步长，可选int或者tuple
* padding       - 填充数目，可选int或者tuple
* padding_mode  - 填充模式，可选'zeros', 'reflect', 'replicate' or 'circular'
* dilation      - 卷积核点间隔，可选int或者tuple
* groups        - 控制分组卷积
* bias          - 控制是否有偏差参数，bool

#### [卷积层参数演示动画](https://github.com/vdumoulin/conv_arithmetic)
#### [卷积原理讲解推荐](https://www.bilibili.com/video/BV1Vd4y1e7pj/)


In [3]:
import torch
import torchvision
import torch.nn as nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10("./data", train=False, transform=torchvision.transforms.ToTensor(), download=True)
dataloader = DataLoader(dataset, batch_size=64)

class MyConv(nn.Module):
    def __init__(self):
        super(MyConv, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=3, out_channels=3, kernel_size=3)

    def forward(self, x):
        x = self.conv1(x)
        return x

myConv = MyConv()
writer = SummaryWriter("./logs")
step = 0
for data in dataloader:
    img, target = data
    output = myConv(img)
    if(step == 0):
        print(img.shape)
        print(output.shape)
    writer.add_images("conv_input", img, step)
    writer.add_images("conv_output", output, step)
    step += 1


Files already downloaded and verified
torch.Size([64, 3, 32, 32])
torch.Size([64, 3, 30, 30])


***
### Pooling layers 池化层
|类|简介|
|---|---|
|nn.MaxPool1d|一维最大池化|
|nn.MaxPool2d|二维最大池化|
|nn.MaxPool3d|三维最大池化|
|nn.MaxUnpool1d|一维反最大池化|
|nn.MaxUnpool2d|二维反最大池化|
|nn.MaxUnpool3d|三维反最大池化|
|nn.AvgPool1d|一维平均池化|
|nn.AvgPool2d|二维平均池化|
|nn.AvgPool3d|三维平均池化|
|nn.FractionalMaxPool1d|一维分数最大池化|
|nn.FractionalMaxPool2d|二维分数最大池化|
|nn.FractionalMaxPool3d|三维分数最大池化|
|nn.LPPool1d|一维LP池化|
|nn.LPPool2d|二维LP池化|
|nn.LPPool3d|三维LP池化|
|nn.AdaptiveMaxPool1d|一维自适应最大池化|
|nn.AdaptiveMaxPool2d|二维自适应最大池化|
|nn.AdaptiveMaxPool3d|三维自适应最大池化|
|nn.AdaptiveAvgPool1d|一维自适应平均池化|
|nn.AdaptiveAvgPool2d|二维自适应平均池化|
|nn.AdaptiveAvgPool3d|三维自适应平均池化|

#### 池化
由于参与运算的张量太大时，会影响计算速度和计算结果，所以需要使用池化对张量进行采样，提取图像特征，减少运算量等。
#### 池化特点
* 池化层没有训练参数
* 只改变特征矩阵的W和H，不改变channel（深度）（如果一个4 x 4 x3 （WHC）的矩阵，若经大小为2 x 2、且布距也为2 的池化核操作，最终会得到2 x 2 x 3 的矩阵结果）
* 一般pool size（池化核大小）和 stride（步距）相同
#### 池化作用
* 下采样（downsamping），降维、去除冗余信息，同时增大了感受野，保留feature map的特征信息，降低参数量
* 可以实现特征不变性（feature invariant）
* 实现非线性，在一定程度上能防止过拟合的发生
#### MaxPool 最大池化
选定某一卷积核的区域，取这个区域中输入张量的最大值。
|||||
|---|---|---|---|
|1|1|2|4|
|5|6|7|8|
|3|2|1|0|
|1|2|3|4|

-MaxPool->

|||
|---|---|
|6|8|
|3|4|

```python
torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)
```
**Parameters**
* kernel_size   - 池化核大小
* stride        - 池化步长
* padding       - 填充数目
* dilation      - 池化核点间隔
* return_indices    - 为True时返回最大值点位置索引
* ceil_mode     - 为Ture时用向上取整的方法计算输出形状，默认是向下取整
#### AvgPool 平均池化
选定某一卷积核的区域，取这个区域中输入张量的平均值。
|||||
|---|---|---|---|
|1|1|2|4|
|5|6|7|8|
|3|2|1|0|
|1|2|3|4|

-AvgPool->

|||
|---|---|
|3.25|5.25|
|2|2|

```python
torch.nn.AvgPool2d(kernel_size, stride=None, padding=0, ceil_mode=False, count_include_pad=True, divisor_override=None)
```
**Parameters**
* kernel_size   - 池化核大小
* stride        - 池化步长
* padding       - 填充数目
* ceil_mode     - 为Ture时用向上取整的方法计算输出形状，默认是向下取整
* count_include_pad - 为True时将把zero-padding的内容一起计算
* divisor_override  - 指定时将使用该数字作为除数，否则为池化核大小
#### 自适应池化
AdaptivePooling，自适应池化层。函数通过输入原始尺寸和目标尺寸，自适应地计算核的大小和每次移动的步长。如告诉函数原来的矩阵是7x7的尺寸，我要得到3x1的尺寸，函数就会自己计算出核多大、该怎么运动。
#### MaxUnpool 反池化
通过接受Maxpool的结果和最大值索引，进行部分Maxpool的逆运算。
```python
torch.nn.MaxUnpool2d(kernel_size, stride=None, padding=0)
```
**Parameters**
* kernel_size   - 池化核大小
* stride        - 池化步长
* padding       - 填充数目

In [4]:
import torch
import torchvision
import torch.nn as nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10("./data", train=False, transform=torchvision.transforms.ToTensor(), download=True)
dataloader = DataLoader(dataset, batch_size=64)

class MyPool(nn.Module):
    def __init__(self):
        super(MyPool, self).__init__()
        self.maxpoll1 = nn.MaxPool2d(kernel_size=3)
    
    def forward(self, x):
        y = self.maxpoll1(x)
        return y

myPool = MyPool()
writer = SummaryWriter("./logs")
step = 0
for data in dataloader:
    img, target = data
    output = myPool(img)
    if(step == 0):
        print(img.shape)
        print(output.shape)
    writer.add_images("pool_input", img, step)
    writer.add_images("pool_output", output, step)
    step += 1

Files already downloaded and verified
torch.Size([64, 3, 32, 32])
torch.Size([64, 3, 10, 10])
