## 05卷积神经网络
___

In [2]:
import torch 
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms

In [3]:
# 配置设备
device = torch.device('cpu')

In [4]:
# 设置超参数
num_epochs = 5
num_classes = 10 
batch_size = 100
learning_rate = 0.001
# MNIST数据集
train_dataset = torchvision.datasets.MNIST(root='/home/wangye/data',
                                          train=True,
                                          transform=transforms.ToTensor(),
                                          download=True)
test_dataset = torchvision.datasets.MNIST(root='/home/wangye/data',
                                         train=False,
                                         transform=transforms.ToTensor())
# 数据加载
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                          batch_size=batch_size,
                                          shuffle=True)

test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
                                         batch_size=batch_size,
                                         shuffle=False)

In [6]:
# 定义包含两个卷积层的卷积神经网络
class ConvNet(nn.Module):
    def __init__(self,num_classes=10):
        super(ConvNet,self).__init__()
        self.layer1 = nn.Sequential(
            nn.Conv2d(1,16,kernel_size=5,stride=1,padding=2),
            nn.BatchNorm2d(16),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2,stride=2)
        )
        self.layer2 = nn.Sequential(
            nn.Conv2d(16,32,kernel_size=5,stride=1,padding=2),
            nn.BatchNorm2d(32),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2,stride=2)
        )
        self.fc = nn.Linear(7*7*32,num_classes)
    def forward(self,x):
        out = self.layer1(x)
        out = self.layer2(out)
        print(out.shape)
        out = out.reshape(out.size(0),-1)
        out = self.fc(out)
        return out

## 上述代码讲解：
1. class torch.nn.Sequential(* args)
    * 这是一个时序的容器，可以按照我们传入的顺序添加进去，帮助我们快速搭建神经网络
2. class torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True):
    * 二维卷积层，输入尺寸为（N,C_in,H_in,W_in）输出尺寸为(N,C_out,H_out,W_out)
    * 参数讲解：
        * in_channels:输入的通道数,比如说灰色图片通道为1，彩色为3（RGB）
        * out_channels:输出的通道数，输出的通道数跟卷积核的数量有关，或者说等于卷积核的数量。
        * kernel_size:卷积核大小
        * stride:表示步长
        * padding:为了保持输入和输出相同，补0的层数
            * 根据公式$1+2*2-5+1=1$可见padding设置为2刚好满足要求
3. class torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True)：
    * 对输入的数据进行标准化处理，现在不需要深究，以后会展开讲
    * 参数讲解：
        * num_features:期望输入的特征数
        * 其他参数默认设置就好，不作讲解
4. class torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)：
    * 对输入的数据做二维的最大池化操作
    * 参数讲解：
         * kernel_size: max pooling的窗口大小
         * stride:窗口移动的步长
         * 其余参数可以参考文档，此处不展开讲解
         

## 神经网络的输入输出shape解释：
其实非常简单，只要熟悉卷积核运算后的输出shape1公式，和max池化后的输出shape2公式，问题便迎刃而解
1. shape_1公式：
    $W_{out} = \frac{W_{in}+2*P-F}{S}+1$
2. shape_2公式：
    $W_{out} =\frac{W_{in}-F}{S}+1$
3. 参数：
    * W即为输入的宽，长也一样
    * P 为Padding的长度
    * F 为滤波器的大小
    * S 为步长
对于本网络的具体推导，以图片的形式展示出来：
![shape推导]()