Define Network

Pytorch中的神经网络依赖于torch.nn库，神经网络训练依靠autograd自动求算梯度。nn.Module 中包含了神经网络的layer，还有前向传播forward(input)函数。

通常按如下方法搭建神经网络：

1. 定义具有可学习参数的网络；
2. 在输入数据上迭代；
3. 在神经网络中处理输入数据；
4. 计算损失；
5. 反向计算参数的梯度
6. 更新参数

定义神经网络

In [17]:
import torch
import torch.nn as nn 
import torch.nn.functional as F

class Net(nn.Module):
    
    def __init__(self):
        super(Net,self).__init__()
        # 定义卷积层
        self.conv1 = nn.Conv2d(1,6,5) # 一个输入channel，六个输出channel，5×5的卷积核
        self.conv2 = nn.Conv2d(6,16,5)
        # 定义全连接层
        self.fc1 = nn.Linear(16 * 5 * 5,120)
        self.fc2 = nn.Linear(120,84)
        self.fc3 = nn.Linear(84,10)
        
    def forward(self,x):
        # 最大池化
        x = F.max_pool2d(F.relu(self.conv1(x)),(2,2))
        x = F.max_pool2d(F.relu(self.conv2(x)),2)
        x = x.view(-1,self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
    
    def num_flat_features(self,x):
        size = x.size()[1:]
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

net = Net()
print(net)

Net(
  (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)


backward()函数不需要额外定义，可以直接使用。

可以通过net.parameters()方法查看可学习参数：

In [18]:
params = list(net.parameters())
params[0].size(),params[1].size(),params[2].size()

(torch.Size([6, 1, 5, 5]), torch.Size([6]), torch.Size([16, 6, 5, 5]))

我们可以尝试给这个神经网络输入一个32×32的input。

In [19]:
in_put = torch.randn(1,1,32,32)
out = net(in_put)
out

tensor([[-0.0930, -0.0167,  0.1068, -0.0696, -0.0360,  0.0530, -0.0292,
         -0.0061,  0.0455,  0.1357]])