### 网络中的网络(NiN)

NiN提出了另外一个设计网络结构的思路，即串联多个由卷积层和代替全连接的1x1卷积层构成的小网络来构建一个深层网络。

### NiN块

NiN与之前AlexNet、VGG的区别:
![image.png](attachment:image.png)

NiN块是NiN中的基础块。它由一个卷积层加两个充当全连接层的1x1卷积层串联而成。其中第一个卷积层的超参数可以自行设置，而第二和第三个卷积层的超参数一般是固定的。

除了使用NiN块之外，NiN还有一个设计与AlexNet显著不同:NiN去掉了AlexNet最后的3个全连接层，取而代之地，NiN使用了输出通道数等于标签类别数的NiN块，然后使用全局平均池化层对每个通道中所有元素求平均并直接用于分类。

NiN的创新之处在于:
* 重复使用由卷积层和1X1卷积层构成的NiN块来构建深层网络。
* NiN去除了容易造成过拟合的全连接输出层，而是将其替换成输出通道数等于标签类别数的NiN块和全局平均池化层。

### 简单实现

In [1]:
import torch
import time
from torch import nn
import utils
import torch.nn.functional as F

In [2]:
#定义NiN块
def nin_block(in_channels,out_channels,kernel_size,stride,padding):
    blk=nn.Sequential(
                    nn.Conv2d(in_channels,out_channels,kernel_size,stride,padding),
                    nn.ReLU(),
                    nn.Conv2d(out_channels,out_channels,kernel_size=1),
                    nn.ReLU(),
                    nn.Conv2d(out_channels,out_channels,kernel_size=1),
                    nn.ReLU()
                    )
    return blk

In [3]:
#定义全局平均池化层
class GlobalAvgPool2d(nn.Module):
    def __init__(self):
        super(GlobalAvgPool2d,self).__init__()
    def forward(self,x):
        return F.avg_pool2d(x,kernel_size=x.size()[2:])

In [4]:
net=nn.Sequential(
    nin_block(1,96,kernel_size=11,stride=4,padding=0),
    nn.MaxPool2d(kernel_size=3,stride=2),
    nin_block(96,256,kernel_size=5,stride=1,padding=2),
    nn.MaxPool2d(kernel_size=3,stride=2),
    nin_block(256,384,kernel_size=3,stride=1,padding=1),
    nn.MaxPool2d(kernel_size=3,stride=2),
    nn.Dropout(0.5),
    nin_block(384,10,kernel_size=3,stride=1,padding=1),
    #GlobalAvgPool2d的作用是对每一个通道取平均值
    GlobalAvgPool2d(),
    utils.FlattenLayer()
)

In [5]:
#查看每一层的输出
X=torch.rand(1,1,224,224)
for name,blk in net.named_children():
    X=blk(X)
    print(name,'output shape:',X.shape)

0 output shape: torch.Size([1, 96, 54, 54])
1 output shape: torch.Size([1, 96, 26, 26])
2 output shape: torch.Size([1, 256, 26, 26])
3 output shape: torch.Size([1, 256, 12, 12])
4 output shape: torch.Size([1, 384, 12, 12])
5 output shape: torch.Size([1, 384, 5, 5])
6 output shape: torch.Size([1, 384, 5, 5])
7 output shape: torch.Size([1, 10, 5, 5])
8 output shape: torch.Size([1, 10, 1, 1])
9 output shape: torch.Size([1, 10])
