In [1]:
import torch
import numpy as np
from torch import nn,optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import torch.nn.functional as F
import time

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
#训练集
train_dataset = datasets.MNIST(root = './', train = True, transform=transforms.ToTensor(),
                              download = True)


test_dataset = datasets.MNIST(root = './', train = False, transform=transforms.ToTensor(),
                              download = True)


In [3]:
#批次大小
batch_size = 64

#装载训练集
train_loader = DataLoader(train_dataset, batch_size = batch_size,
                         shuffle=True)
#装载测试集
test_loader = DataLoader(test_dataset, batch_size = batch_size,
                         shuffle=True)

In [4]:
for i,data in enumerate(train_loader):
    inputs, labels = data
    print(inputs.shape)
    print(labels.shape)
    break

torch.Size([64, 1, 28, 28])
torch.Size([64])


In [11]:
#定义网络结构
class Net(nn.Module):
    def __init__(self):
        super().__init__()
        
        self.conv1 = nn.Sequential(nn.Conv2d(1, 32, 5, 1, 2), nn.ReLU(), nn.MaxPool2d(2,2))
        self.conv2 = nn.Sequential(nn.Conv2d(32, 64, 5, 1, 2), nn.ReLU(), nn.MaxPool2d(2,2))
        self.fc1 = nn.Sequential(nn.Linear(64 * 7 * 7, 1000), nn.ReLU())
        self.fc2 = nn.Sequential(nn.Linear(1000, 10), nn.Softmax(dim=-1))

    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        #([64,1,28,28])-> (64,784) 在全连接层做计算的时候只能是两维的数据
        x = x.view(x.size()[0], -1)
        x = self.fc1(x)
        out = self.fc2(x)
        return out

In [12]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
LR = 0.001
#定义模型
model = Net()
model.to(device) 
#定义损失函数
cross_loss = nn.CrossEntropyLoss()
#定义优化器
optimizer = optim.Adam(model.parameters(),LR)

In [14]:
def train():
    for i, batch in enumerate(train_loader):
        #获得一个批次的数据和标签
        inputs, labels = batch
        inputs = inputs.to(device)
        labels = labels.to(device)
        #获得模型预测结果
        out = model(inputs)
        #交叉熵代价函数out(batch, C(类别的数量))，labels(batch)
        
        
        #计算loss
        loss = cross_loss(out, labels)

        #清除梯度
        optimizer.zero_grad()

        #计算梯度
        loss.backward()

        #修改权值
        optimizer.step()

def test():
    correct = 0
    for i, batch in enumerate(test_loader):
        #获得一个批次的数据和标签
        inputs, labels = batch
        inputs = inputs.to(device)
        labels = labels.to(device)
        #获得模型预测结果
        out = model(inputs)
        #获得最大值，以及最大值所在的位置
        _,predicted = torch.max(out, 1)
        #预测正确的数量
        correct += (predicted == labels).sum()
    print("正确率为：{}".format(correct.item()/len(test_dataset)))
        

In [15]:

# 开始计时
start_time = time.time()
for epoch in range(100):
    print('epoch:', epoch)
    train()
    test()
end_time = time.time()
print(end_time - start_time)

epoch: 0
正确率为：0.9818
epoch: 1
正确率为：0.9804
epoch: 2
正确率为：0.9874
epoch: 3
正确率为：0.9841
epoch: 4
正确率为：0.991
epoch: 5
正确率为：0.9896
epoch: 6
正确率为：0.9829
epoch: 7
正确率为：0.9884
epoch: 8
正确率为：0.9856
epoch: 9
正确率为：0.983
epoch: 10
正确率为：0.9847
epoch: 11
正确率为：0.9839
epoch: 12
正确率为：0.9853
epoch: 13
正确率为：0.98
epoch: 14
正确率为：0.9874
epoch: 15
正确率为：0.9852
epoch: 16
正确率为：0.9859
epoch: 17
正确率为：0.989
epoch: 18
正确率为：0.9884
epoch: 19
正确率为：0.9856
epoch: 20
正确率为：0.9879
epoch: 21
正确率为：0.9903
epoch: 22
正确率为：0.9764
epoch: 23
正确率为：0.9913
epoch: 24
正确率为：0.9887
epoch: 25
正确率为：0.9832
epoch: 26
正确率为：0.9898
epoch: 27
正确率为：0.9834
epoch: 28
正确率为：0.9853
epoch: 29
正确率为：0.9902
epoch: 30
正确率为：0.9876
epoch: 31
正确率为：0.9757
epoch: 32
正确率为：0.9773
epoch: 33
正确率为：0.9851
epoch: 34
正确率为：0.9889
epoch: 35
正确率为：0.9798
epoch: 36
正确率为：0.9882
epoch: 37
正确率为：0.988
epoch: 38
正确率为：0.9834
epoch: 39
正确率为：0.9853
epoch: 40
正确率为：0.986
epoch: 41
正确率为：0.9857
epoch: 42
正确率为：0.9837
epoch: 43
正确率为：0.9707
epoch: 44
正确率为：0.9875
epoch: 45
正确率为：0.9888
epoch

KeyboardInterrupt: 

In [83]:
123445 * 125689

15515678605

In [None]:
84.22844743728638