In [None]:
import onnxruntime as ort         # 导入onnxruntime库，它是一个高性能的ONNX模型推理引擎，可以用来运行预训练的ONNX格式模型。
import numpy as np                # 导入numpy库，它是Python中用于科学计算的核心库，特别擅长处理数组和矩阵运算。
import scipy.special              # 导入scipy.special模块，其中包含了特殊的数学函数，这里主要用到softmax函数。
from PIL import Image             # 从PIL (Pillow) 库导入Image模块，用于图像处理，如打开、调整大小、裁剪等。


# 预处理图像
def preprocess_image(image, resize_size=256, crop_size=224, mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]):
  # `preprocess_image` 是一个函数，用于将原始图像处理成模型可以接受的格式。
  # `image`: 待处理的PIL Image对象。
  # `resize_size=256`: 图像首先会被缩放到这个尺寸（例如256x256）。
  # `crop_size=224`: 缩放后，会从中心裁剪出这个尺寸的图像（例如224x224）。
  # `mean` 和 `std`: 图像归一化时使用的均值和标准差，这些值通常是根据ImageNet数据集预训练模型而来的。

  image = image.resize((resize_size, resize_size), Image.BILINEAR)
  # 将输入图像等比例缩放到 `resize_size` x `resize_size` (例如256x256像素)。
  # `Image.BILINEAR` 是一种高质量的图像插值算法，用来在调整图像大小时平滑像素。

  w, h = image.size
  # 获取缩放后图像的宽度 `w` 和高度 `h`。

  left = (w - crop_size) / 2
  top = (h - crop_size) / 2
  # 计算中心裁剪的左上角坐标。
  # `(w - crop_size) / 2` 得到水平方向上需要裁剪掉的边距的一半。
  # `(h - crop_size) / 2` 得到垂直方向上需要裁剪掉的边距的一半。
  # 这样可以确保裁剪出的 `crop_size` x `crop_size` 图像是原图的中心部分。

  image = image.crop((left, top, left + crop_size, top + crop_size))
  # 对图像进行中心裁剪，得到 `crop_size` x `crop_size` (例如224x224) 大小的图像。

  image = np.array(image).astype(np.float32)
  # 将PIL Image对象转换为NumPy数组。
  # `np.array(image)` 得到一个形状为 (高, 宽, 颜色通道) 的NumPy数组（例如 (224, 224, 3)）。
  # `.astype(np.float32)` 将数组元素的数据类型从默认的uint8（0-255整数）转换为浮点数（32位），这是深度学习模型通常要求的输入类型。

  image = image / 255.0
  # 对图像像素值进行归一化。
  # 将像素值从 [0, 255] 范围缩放到 [0.0, 1.0] 范围，这是深度学习模型处理图像的常见预处理步骤。

  image = (image - mean) / std
  # 对图像进行标准化（Standardization）。
  # 图像的每个颜色通道（R, G, B）都会减去对应的均值 `mean`，然后除以对应的标准差 `std`。
  # 这种处理是为了使图像数据符合模型预训练时的数据分布，有助于模型更好地工作。
  # `mean` 和 `std` 是形状为 (3,) 的NumPy数组，NumPy会自动进行广播操作。

  image = np.transpose(image, (2, 0, 1))
  # 重新排列数组的维度。
  # 原始图像数组的形状通常是 (高, 宽, 颜色通道)，即 (H, W, C)。
  # 多数深度学习模型（如PyTorch、ONNX）期望的输入格式是 (颜色通道, 高, 宽)，即 (C, H, W)。
  # `np.transpose(image, (2, 0, 1))` 将维度从 (H, W, C) 变为 (C, H, W)。

  image = image.reshape((1,) + image.shape)
  # 增加一个批次维度（Batch Dimension）。
  # 深度学习模型通常期望输入是批次（Batch）形式的，即使只有一个图像，也需要在最前面添加一个维度来表示批次大小。
  # `image.shape` 此时是 (C, H, W)，所以 `(1,) + image.shape` 会得到 (1, C, H, W)。
  # `1` 表示批次大小为1，即一次只处理一张图片。

  return image
  # 返回处理好的图像NumPy数组。


# 模型加载 2分
session = ort.InferenceSession('resnet.onnx')
# 使用onnxruntime的`InferenceSession`加载预训练的ONNX模型文件 'resnet.onnx'。
# `session` 对象是用于执行推理（prediction）的核心接口。

# 加载类别标签
labels_path = 'labels.txt'  # 定义包含类别标签的文件路径。
with open(labels_path) as f: # 打开 `labels.txt` 文件。
  labels = [line.strip() for line in f.readlines()]
  # 逐行读取文件内容，每行一个标签。
  # `line.strip()` 会去除每行末尾的换行符和首尾空格。
  # `labels` 将是一个字符串列表，其中每个元素是一个类别名称。

# 获取模型输入和输出的名称
input_name = session.get_inputs()[0].name
# 从session中获取模型第一个输入节点的名称。深度学习模型通常只有一个主要输入（例如图像数据）。
output_name = session.get_outputs()[0].name
# 从session中获取模型第一个输出节点的名称。深度学习模型通常只有一个主要输出（例如分类概率或特征）。

# 加载图片 2分
image = Image.open('img_test.jpg').convert('RGB')
# 使用PIL的`Image.open()`函数打开名为 'img_test.jpg' 的图片文件。
# `.convert('RGB')` 确保图片被转换为RGB三通道格式，即使原始图片是灰度图或其他格式，也统一转换为彩色图。

# 预处理图片 2分
processed_image = preprocess_image(image)
# 调用之前定义的 `preprocess_image` 函数，对加载的 `image` 进行预处理，使其符合模型输入的要求。

# 确保输入数据是 float32 类型
processed_image = processed_image.astype(np.float32)
# 再次强制转换 `processed_image` 的数据类型为 `np.float32`。
# 尽管 `preprocess_image` 函数中已经做了一次转换，但为了确保万无一失，这里再次明确指定。
# ONNX Runtime通常对输入数据类型有严格要求，例如 `float32`。

# 进行图片识别 2分
output = session.run([output_name], {input_name: processed_image})[0]
# 使用 `session.run()` 方法执行模型的推理。
# `[output_name]`: 指定我们想要获取的模型输出节点的名称。
# `{input_name: processed_image}`: 提供模型的输入数据，是一个字典，键是输入节点的名称，值是预处理后的图像数据。
# `[0]`: `session.run()` 返回一个列表，即使只有一个输出，也需要通过 `[0]` 来获取实际的NumPy数组。
# `output` 将是模型原始的输出结果，通常是未经过Softmax处理的logits（对数几率）。

# 应用 softmax 函数获取概率 2分
probabilities = scipy.special.softmax(output, axis=-1)
# 对模型的原始输出 `output` 应用 `scipy.special.softmax` 函数。
# Softmax函数将模型的输出（logits）转换为概率分布，使得所有类别的概率之和为1。
# `axis=-1` 表示对最后一个维度（通常是类别维度）进行Softmax操作。
# `probabilities` 将是一个NumPy数组，其中包含每个类别的预测概率。

# 获取最高的5个概率和对应的类别索引 3分
top5_idx = np.argsort(probabilities[0])[-5:][::-1]
# `probabilities[0]`: 批次维度为1，所以取出第一个（也是唯一一个）样本的概率数组。
# `np.argsort()`: 返回将数组元素按升序排序后的索引数组。
# `[-5:]`: 选取最后5个索引，对应于原始概率数组中最大的5个值。
# `[::-1]`: 将这5个索引进行逆序排列，使其从最大概率对应的索引开始。
# `top5_idx` 将是一个NumPy数组，包含概率最高的5个类别的索引。
top5_prob = probabilities[0][top5_idx]
# 使用 `top5_idx` 作为索引，从 `probabilities[0]` 中直接取出对应的5个最高概率值。
# `top5_prob` 将是一个NumPy数组，包含最高的5个概率。

# 打印结果
print("Top 5 predicted classes:") # 打印标题。
for i in range(5):
  # 循环5次，打印预测结果。
  print(f"{i+1}: {labels[top5_idx[i]]} - Probability: {top5_prob[i]:.4f}")
  # 打印排名、类别名称和对应的概率。
  # `labels[top5_idx[i]]`: 通过索引 `top5_idx[i]` 从 `labels` 列表中获取类别名称。
  # `top5_prob[i]:.4f`: 格式化概率，保留4位小数。
