# 模型测试

In [1]:
import torch
import torchvision
from PIL import Image
from Model_save import *

In [2]:
# 特别说明：
# RGB图像是3通道的，PNG图像是4通道的（相比于RGB图像还多了一个透明度通道色）
# 所以需要使用image.convert（‘RGB'）来剔除掉透明度通道，只保留三原色通道

In [3]:
# 准备图像
image_pth = "./images/dog.png"
img = Image.open(image_pth)
img = img.convert('RGB')

In [4]:
transform = torchvision.transforms.Compose([torchvision.transforms.Resize((32, 32)),
                                            torchvision.transforms.ToTensor()])

In [5]:
# 准备图像
image = transform(img)
image = torch.reshape(image, (1, 3, 32, 32))
print(image.shape)

torch.Size([1, 3, 32, 32])


In [6]:
# 准备训练好的模型
model = LeNet_5()
# 加载模型参数
# model_weight = torch.load("./models/LeNet_5/LeNet_5_No_10_Loss_10.pth", weights_only=True)
# 如果模型参数是在 GPU 上训练来的，需要在使用时指定使用设备
model_weight = torch.load("./models/LeNet_5/LeNet_5_No_10_Loss_10.pth", weights_only=True, map_location = torch.device('cpu'))
model.load_state_dict(model_weight)
print(model)

LeNet_5(
  (model1): Sequential(
    (conv1): Conv2d(3, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (pool1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (conv2): Conv2d(32, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (pool2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (conv3): Conv2d(32, 64, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (pool3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (flatten): Flatten(start_dim=1, end_dim=-1)
    (fc1): Linear(in_features=1024, out_features=64, bias=True)
    (fc2): Linear(in_features=64, out_features=10, bias=True)
  )
)


In [7]:
# 使用模型识别图像
model.eval()
with torch.no_grad():
    output = model(image)
print(torch.argmax(output))
# 预测结果
# 0表示飞机
# 1表示汽车
# 2表示鸟
# 3表示猫
# 4表示鹿
# 5表示狗
# 6表示青蛙
# 7表示马
# 8表示船
# 9表示卡车


tensor(5)
