# 1. GPU训练30轮次

In [4]:
import torchvision
import torch
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
import time

# 定义训练的设备
#device = torch.device("cpu")
device = torch.device("cuda")   # 使用 GPU 方式一 
#device = torch.device("cuda:0") # 使用 GPU 方式二
#device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("当前的设备为：", device)

# from model import * 相当于把 model中的所有内容写到这里，这里直接把 model 写在这里
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()        
        self.model1 = nn.Sequential(
            nn.Conv2d(3,32,5,1,2),  # 输入通道3，输出通道32，卷积核尺寸5×5，步长1，填充2    
            nn.MaxPool2d(2),
            nn.Conv2d(32,32,5,1,2),
            nn.MaxPool2d(2),
            nn.Conv2d(32,64,5,1,2),
            nn.MaxPool2d(2),
            nn.Flatten(),  # 展平后变成 64*4*4 了
            nn.Linear(64*4*4,64),
            nn.Linear(64,10)
        )
        
    def forward(self, x):
        x = self.model1(x)
        return x

# 准备数据集
train_data = torchvision.datasets.CIFAR10("./dataset",train=True,transform=torchvision.transforms.ToTensor(),download=True)       
test_data = torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)       

# length 长度
train_data_size = len(train_data)
test_data_size = len(test_data)
# 如果train_data_size=10，则打印：训练数据集的长度为：10
print("训练数据集的长度：{}".format(train_data_size))
print("测试数据集的长度：{}".format(test_data_size))


# 利用 Dataloader 来加载数据集
train_dataloader = DataLoader(train_data, batch_size=64)        
test_dataloader = DataLoader(test_data, batch_size=64)


# 创建网络模型
tudui = Tudui()
tudui = tudui.to(device)  # 也可以不赋值，直接 tudui.to(device) 

# 损失函数
loss_fn = nn.CrossEntropyLoss()  # 交叉熵，fn 是 function 的缩写
loss_fn = loss_fn.to(device)  # 也可以不赋值，直接loss_fn.to(device)

# 优化器
learning_rate = 0.01  # 1e-2 就是 0.01 的意思
optimizer = torch.optim.SGD(tudui.parameters(), lr=learning_rate)  # 随机梯度下降优化器  


# 设置网络的一些参数
# 记录训练的次数
total_train_step = 0
total_test_step = 0

# 训练的轮次
epoch = 30


# 添加 tensorboard
writer = SummaryWriter("logs")

start_time = time.time()
last_time = time.time()

for i in range(epoch):
    print("-----第 {} 轮训练开始-----".format(i+1))
    
    # 训练步骤开始
    tudui.train()  # 当网络中有dropout层、batchnorm层时，tudui.train()会使得这些层能起作用
    for data in train_dataloader:
        imgs, targets = data
        imgs = imgs.to(device)  # 也可以不赋值，直接 imgs.to(device)
        targets = targets.to(device)  # 也可以不赋值，直接 targets.to(device)
        outputs = tudui(imgs)
        loss = loss_fn(outputs, targets) # 计算实际输出与目标输出的差距
        
        # 优化器对模型调优
        optimizer.zero_grad()  # 梯度清零
        loss.backward() # 反向传播，计算损失函数的梯度
        optimizer.step()   # 根据梯度，对网络的参数进行调优
        
        total_train_step += 1
        
        if total_train_step % 100 == 0:
            end_time = time.time()
            print(f"总时间为：{end_time - start_time}秒") # 运行训练一百次后的时间间隔
            print(f"每轮时间：{end_time - last_time}秒")
            last_time = end_time
            print("训练次数：{}，Loss：{}".format(total_train_step, loss.item()))  # 方式二：获得loss值
            writer.add_scalar("train_loss", loss.item(), total_train_step)
    
    # 测试步骤开始
    #（每一轮训练后都查看在测试数据集上的loss情况）
    tudui.eval()  # 当网络中有dropout层、batchnorm层时，tudui.eval()会使得这些层不能起作用
    total_test_loss = 0
    total_accuracy = 0
    with torch.no_grad():  # 没有梯度了
        for data in test_dataloader:  # 测试数据集提取数据
            imgs, targets = data
            
            imgs = imgs.to(device)  # 也可以不赋值，直接 imgs.to(device)
            targets = targets.to(device)  # 也可以不赋值，直接 targets.to(device)
            outputs = tudui(imgs)
            
            loss = loss_fn(outputs, targets)  # 仅data数据在网络模型上的损失
            
            total_test_loss += loss.item() # 所有loss
            
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy += accuracy
            
    print("整体测试集上的Loss：{}".format(total_test_loss))
    print("在测试集上每个batch的平均Loss：{}".format(total_test_loss * 64 / test_data_size))
    print("整体测试集上的分类正确率为：{}%".format(total_accuracy / test_data_size * 100))
    writer.add_scalar("test_loss", total_test_loss, total_test_step)
    writer.add_scalar("test_accuracy", total_accuracy / test_data_size, total_test_step)  
    total_test_step += 1
    
    torch.save(tudui, "./model/tudui_{}.pth".format(i))  # 保存每一轮训练后的结果
    # torch.save(tudui.state_dict(), "./model/tudui_{}.pth".format(i))  # 另一种保存方式
    print("模型已保存")
        
writer.close()

当前的设备为： cuda
Files already downloaded and verified
Files already downloaded and verified
训练数据集的长度：50000
测试数据集的长度：10000
-----第 1 轮训练开始-----
总时间为：1.1507329940795898秒
每轮时间：1.1507062911987305秒
训练次数：100，Loss：2.2853338718414307
总时间为：2.2994325160980225秒
每轮时间：1.1486995220184326秒
训练次数：200，Loss：2.285290479660034
总时间为：3.446033477783203秒
每轮时间：1.1466009616851807秒
训练次数：300，Loss：2.2274346351623535
总时间为：4.591372966766357秒
每轮时间：1.1453394889831543秒
训练次数：400，Loss：2.1635615825653076
总时间为：5.735844135284424秒
每轮时间：1.1444711685180664秒
训练次数：500，Loss：2.1004605293273926
总时间为：6.8807172775268555秒
每轮时间：1.1448731422424316秒
训练次数：600，Loss：2.03259539604187
总时间为：8.02559781074524秒
每轮时间：1.1448805332183838秒
训练次数：700，Loss：1.9879624843597412
整体测试集上的Loss：320.5063395500183
在测试集上每个batch的平均Loss：2.051240573120117
整体测试集上的分类正确率为：27.089998245239258%
模型已保存
-----第 2 轮训练开始-----
总时间为：10.804321050643921秒
每轮时间：2.7787232398986816秒
训练次数：800，Loss：1.8766422271728516
总时间为：11.948857545852661秒
每轮时间：1.1445364952087402秒
训练次数：900，Loss：1.88334774971

总时间为：111.54706311225891秒
每轮时间：1.1421337127685547秒
训练次数：8300，Loss：1.2515535354614258
总时间为：112.69000959396362秒
每轮时间：1.142946481704712秒
训练次数：8400，Loss：1.0433595180511475
总时间为：113.83206939697266秒
每轮时间：1.1420598030090332秒
训练次数：8500，Loss：1.1961382627487183
总时间为：114.9745421409607秒
每轮时间：1.142472743988037秒
训练次数：8600，Loss：0.9056577086448669
整体测试集上的Loss：186.87713253498077
在测试集上每个batch的平均Loss：1.196013648223877
整体测试集上的分类正确率为：58.099998474121094%
模型已保存
-----第 12 轮训练开始-----
总时间为：117.74911046028137秒
每轮时间：2.7745683193206787秒
训练次数：8700，Loss：1.1855067014694214
总时间为：118.89421439170837秒
每轮时间：1.145103931427002秒
训练次数：8800，Loss：1.3576641082763672
总时间为：120.03567481040955秒
每轮时间：1.1414604187011719秒
训练次数：8900，Loss：1.0233747959136963
总时间为：121.17726540565491秒
每轮时间：1.1415905952453613秒
训练次数：9000，Loss：1.1333001852035522
总时间为：122.31895041465759秒
每轮时间：1.1416850090026855秒
训练次数：9100，Loss：1.0926451683044434
总时间为：123.46036314964294秒
每轮时间：1.1414127349853516秒
训练次数：9200，Loss：1.0366268157958984
总时间为：124.60585689544678秒
每轮时间：1.14

整体测试集上的Loss：169.23971420526505
在测试集上每个batch的平均Loss：1.0831341709136963
整体测试集上的分类正确率为：63.599998474121094%
模型已保存
-----第 22 轮训练开始-----
总时间为：223.82850980758667秒
每轮时间：2.772918939590454秒
训练次数：16500，Loss：0.975710391998291
总时间为：224.9677815437317秒
每轮时间：1.1392717361450195秒
训练次数：16600，Loss：0.8183400630950928
总时间为：226.1073670387268秒
每轮时间：1.1395854949951172秒
训练次数：16700，Loss：0.9378455877304077
总时间为：227.24818634986877秒
每轮时间：1.1408193111419678秒
训练次数：16800，Loss：0.719350278377533
总时间为：228.38605904579163秒
每轮时间：1.1378726959228516秒
训练次数：16900，Loss：0.6483535766601562
总时间为：229.5261218547821秒
每轮时间：1.1400628089904785秒
训练次数：17000，Loss：1.061880350112915
总时间为：230.6662015914917秒
每轮时间：1.1400797367095947秒
训练次数：17100，Loss：0.68842613697052
总时间为：231.80604696273804秒
每轮时间：1.139845371246338秒
训练次数：17200，Loss：0.6699042320251465
整体测试集上的Loss：170.0798933506012
在测试集上每个batch的平均Loss：1.0885113174438477
整体测试集上的分类正确率为：63.650001525878906%
模型已保存
-----第 23 轮训练开始-----
总时间为：234.5755798816681秒
每轮时间：2.7695329189300537秒
训练次数：17300，Loss：0.946

# 2. 验证狗是否识别

① 完整的模型验证(测试，demo)套路，利用已经训练好的模型，然后给它提供输入。

In [26]:
import torchvision
from PIL import Image
from torch import nn
import torch

image_path = "imgs/dog.png"
image = Image.open(image_path)  # PIL类型的Image
image = image.convert("RGB")  # 4通道的RGBA图片转为3通道的RGB图片
print(image)

transform = torchvision.transforms.Compose([torchvision.transforms.Resize((32,32)),   
                                            torchvision.transforms.ToTensor()])

image = transform(image)
print(image.shape)


class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()        
        self.model1 = nn.Sequential(
            nn.Conv2d(3,32,5,1,2),
            nn.MaxPool2d(2),
            nn.Conv2d(32,32,5,1,2),
            nn.MaxPool2d(2),
            nn.Conv2d(32,64,5,1,2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(64*4*4,64),
            nn.Linear(64,10)
        )
        
    def forward(self, x):
        x = self.model1(x)
        return x


model = torch.load("model/tudui_29.pth", map_location=torch.device('cpu'))  # GPU上训练的pth文件需要映射到CPU上    
print(model)

image = torch.reshape(image,(1,3,32,32))  # 转为四维，符合网络输入需求

model.eval()
with torch.no_grad():  # 不进行梯度计算，减少内存计算
    output = model(image)

print(output)
print(output.argmax(1))  # 概率最大类别的输出

<PIL.Image.Image image mode=RGB size=592x354 at 0x7F9A21BE3AF0>
torch.Size([3, 32, 32])
Tudui(
  (model1): Sequential(
    (0): Conv2d(3, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (2): Conv2d(32, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (4): Conv2d(32, 64, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (5): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (6): Flatten(start_dim=1, end_dim=-1)
    (7): Linear(in_features=1024, out_features=64, bias=True)
    (8): Linear(in_features=64, out_features=10, bias=True)
  )
)
tensor([[-5.1236, -9.2203, -0.0977,  4.9035,  2.6987,  7.3353,  5.5696,  4.5287,
         -7.8172, -3.0620]])
tensor([5])


![classes](./imgs/classes.png)

# 3. 验证飞机是否识别

In [18]:
import torchvision
from PIL import Image
from torch import nn
import torch

image_path = "imgs/plane.png"
image = Image.open(image_path)  # PIL类型的Image
image = image.convert("RGB")  # 4通道的RGBA转为3通道的RGB图片
print(image)

transform = torchvision.transforms.Compose([torchvision.transforms.Resize((32,32)),   
                                            torchvision.transforms.ToTensor()])

image = transform(image)
print(image.shape)

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()        
        self.model1 = nn.Sequential(
            nn.Conv2d(3,32,5,1,2),
            nn.MaxPool2d(2),
            nn.Conv2d(32,32,5,1,2),
            nn.MaxPool2d(2),
            nn.Conv2d(32,64,5,1,2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(64*4*4,64),
            nn.Linear(64,10)
        )
        
    def forward(self, x):
        x = self.model1(x)
        return x

model = torch.load("model/tudui_29.pth", map_location=torch.device('cpu'))  # GPU上训练的东西映射到CPU上    
print(model)

image = torch.reshape(image,(1,3,32,32))  # 转为四维，符合网络输入需求

model.eval()
with torch.no_grad():  # 不进行梯度计算，减少内存计算
    output = model(image)

print(output)
print(output.argmax(1))  # 概率最大类别的输出

<PIL.Image.Image image mode=RGB size=604x340 at 0x7F9A226039A0>
torch.Size([3, 32, 32])
Tudui(
  (model1): Sequential(
    (0): Conv2d(3, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (2): Conv2d(32, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (4): Conv2d(32, 64, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (5): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (6): Flatten(start_dim=1, end_dim=-1)
    (7): Linear(in_features=1024, out_features=64, bias=True)
    (8): Linear(in_features=64, out_features=10, bias=True)
  )
)
tensor([[ 7.5431,  3.2615,  2.3299, -2.0899, -0.3996, -3.8349, -8.4790,  1.5732,
          4.1464, -2.7509]])
tensor([0])


![image.png](attachment:image.png)