# GoogleLeNet
## Inception 块

输入->

（减少通道数）3个1 * 1卷积层+1个最大池化层->

（提取空间尺寸信息）1个3 * 3卷积层 + 1个5 * 5卷积层 + 1 * 1卷积层->

通道合并层

4条并行线路。同时4条线路都使用了合适的填充来使输入与输出的高和宽一致。最后我们将每条线路的输出在通道维上连结。

In [1]:
import time
import torch
import torch.nn as nn
import torch.optim as optim

import torch.nn.functional as F
import d2lzh_pytorch as d2l
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [2]:
class Inception(nn.Module):
    def __init__(self, in_c, c1, c2, c3, c4):
        super(Inception, self).__init__()
        # 线路1，单 1*1 卷积层
        self.p1_1 = nn.Conv2d(in_c, c1, kernel_size=1)
        # 线路2，1*1 后接 3*3 卷积层
        self.p2_1 = nn.Conv2d(in_c, c2[0], kernel_size=1)
        self.p2_2 = nn.Conv2d(c2[0], c2[1], kernel_size=3, padding=1)
        # 线路3，1*1 后接 5*5 卷积层
        self.p3_1 = nn.Conv2d(in_c, c3[0], kernel_size=1)
        self.p3_2 = nn.Conv2d(c3[0], c3[1], kernel_size=5, padding=2)
        # 线路4，3*3最大池化层，后接1*1 卷积层
        self.p4_1 = nn.MaxPool2d(kernel_size=3, stride=1, padding=1)
        self.p4_2 = nn.Conv2d(in_c, c4, kernel_size=1)
    
    def forward(self, x):
        p1 = F.relu(self.p1_1(x))
        p2 = F.relu(self.p2_2(F.relu(self.p2_1(x))))
        p3 = F.relu(self.p3_2(F.relu(self.p3_1(x))))
        p4 = F.relu(self.p4_2(self.p4_1(x)))
        return torch.cat((p1, p2, p3, p4), dim=1)

主体卷积部分使用5个模块，每个模块之间用步幅为2的3 * 3最大池化层来减小输出高宽。

In [3]:
# 第一个模块使用64通道的7 * 7卷积层
b1 = nn.Sequential(
    nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),
    nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
)

In [4]:
# 第二个模块，首先是64通道的1 * 1卷积层，
# 然后将通道增大3倍的3 * 3卷积层，对应Inception块中的第二条线路
b2 = nn.Sequential(
    nn.Conv2d(64, 64, kernel_size=1),
    # 3倍
    nn.Conv2d(64, 192, kernel_size=3, padding=1),
    nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
)

第三个模块串联2个完整的Inception块。

第一个输出通道数为：64+128+32+32=256

第二个输出通道数为：128+192+96+64=480

注意每条输出通路的比值，对于输入来说，在每条通路输入通道数都是先减小了

1: 192->96 192->16

2: 256->128 256->32

第一个模块将 96/192 = 1/2 和 16/192 = 1/12 

第二个模块将 128/256 = 1/2 和 32/256 = 1/8

第二条线路输出最多通道，其次是第一条线路，之后是第三条和第四条线路

In [5]:
b3 = nn.Sequential(
    Inception(192, 64, (96, 128), (16, 32), 32),
    Inception(256, 128, (128, 192), (32, 96), 64),
    nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
)

第四模块更加复杂。它串联5个Inception块，其输出通道分别是

- 192 + 208 + 48 + 64 = 512
- 160 + 224 + 64 + 64 = 512
- 128 + 256 + 64 + 64 = 512
- 112 + 288 + 64 + 64 = 528
- 256 + 320 + 128 + 128 = 832

In [10]:
b4 = nn.Sequential(
    Inception(480, 192, (96, 208), (16, 48), 64),
    Inception(512, 160, (112, 224), (24, 64), 64),
    Inception(512, 128, (128, 256), (24, 64), 64),
    Inception(512, 112, (144, 288), (32, 64), 64),
    Inception(528, 256, (160, 320), (32, 128), 128),
    nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
)

第五模块有两个Inception，输出通道数如下：

- 256 + 320 + 128 + 128 = 832
- 384 + 384 + 128 + 128 = 1024

In [7]:
b5 = nn.Sequential(
    Inception(832, 256, (160, 320), (32, 128), 128),
    Inception(832, 384, (192, 384), (48, 128), 128),
    d2l.GlobalAvgPool2d()
)

将输出变成二维数组后，接上一个输出个数为标签类别数的全连接层。

In [11]:
net = nn.Sequential(
    b1, b2, b3, b4, b5, 
    d2l.FlattenLayer(), 
    nn.Linear(1024, 10)
)

In [12]:
X = torch.rand(1, 1, 96, 96)
for name, blk in net.named_children():
    X = blk(X)
    print('name: ', name, 'output shape: ', X.shape)

name:  0 output shape:  torch.Size([1, 64, 24, 24])
name:  1 output shape:  torch.Size([1, 192, 12, 12])
name:  2 output shape:  torch.Size([1, 480, 6, 6])
name:  3 output shape:  torch.Size([1, 832, 3, 3])
name:  4 output shape:  torch.Size([1, 1024, 1, 1])
name:  5 output shape:  torch.Size([1, 1024])
name:  6 output shape:  torch.Size([1, 10])


# 获取数据

In [None]:
batch_size = 128
train_iter, test_iter = d2l.load_data_fashion_mnist2(batch_size, resize=96)

lr, num_epochs = 0.001, 5
optimizer = optim.Adam(net.parameters(), lr=lr)
d2l.train_cuda_cpu(net, train_iter, test_iter, batch_size, optimizer, device, num_epochs)

train不动 * n。。。