# Alexnet 

1. 加载预训练好的 AlexNet 模型

In [1]:
import ipykernel
ipykernel

<module 'ipykernel' from '/home/joseph/anaconda3/envs/nn_env/lib/python3.8/site-packages/ipykernel/__init__.py'>

In [3]:
import torch
import torchvision.models as models
import os
# 加载预训练好的 AlexNet 模型
alexnet = models.alexnet(pretrained=True)


这里的 pretrained=True 参数表示加载预训练好的模型，如果不加该参数，则会加载一个未经过训练的模型。

2. 对图像进行预处理

AlexNet 模型对输入的图像要求尺寸为 224x224，像素值归一化为 [0, 1]，并按照 BGR 通道顺序排列。因此，我们需要对输入的图像进行预处理，将其转换为符合要求的格式。

In [20]:
from torchvision import transforms

# 对输入图像进行预处理
transform = transforms.Compose([
    transforms.Resize(256),  # 缩放图像大小至 256x256
    transforms.CenterCrop(224),  # 在中心位置裁剪出 224x224 大小的图像
    transforms.ToTensor(),  # 将图像转换为 Tensor 格式
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # 对图像像素值进行归一化
])


3. 加载图像并进行预测

首先需要将图像加载为 PIL.Image.Image 格式，然后使用 transform 对图像进行预处理，并将其转换为 PyTorch 的 Tensor 格式。最后将 Tensor 作为输入传入模型，并获取模型的输出结果。

In [23]:
from PIL import Image
# 加载图像并进行预测 这里要换成你下载的
home = os.path.expanduser('~')
# /home/joseph/Code/ML_group/alexnet/dog.jpg
image_path = os.path.join(home, 'Code/ML_group/alexnet/dog.jpg')
image = Image.open(image_path)  # 加载图像
input_tensor = transform(image)  # 对图像进行预处理，并将其转换为 Tensor 格式
input_batch = input_tensor.unsqueeze(0)  # 将 Tensor 包装成一个 Batch

# 将 Batch 传入模型，并获取模型的输出结果
with torch.no_grad():
    output = alexnet(input_batch)
    probabilities = torch.nn.functional.softmax(output[0], dim=0)

# 输出结果

import json

# 加载 ImageNet 类别标签信息
with open(os.path.join(home, "Code/ML_group/alexnet/imagenet_class_index.json")) as f:
    class_idx = json.load(f)

# 找到预测结果所对应的类别标签
# torch.argmax(probabilities) 返回概率最大的那个类别的索引
pred_label = class_idx[str(int(torch.argmax(probabilities)))]
# pred_label[1] 表示输出的是类别标签的名称
print("Predicted Label使用AlexNet预测你提供的图片属于种类是: ", pred_label[1])



Predicted Label使用AlexNet预测你提供的图片属于种类是:  golden_retriever
