# Pytorch

----

In [None]:
# 安装 PyTorch 库，这是一个用于机器学习的开源库，包含了张量计算、自动微分和神经网络构建等功能。
!pip3 install torch 

# 安装 torchvision 库，它包含了预先训练好的模型、数据加载器和各种图像处理工具。
!pip3 install torchvision 

**解释：**

这段代码使用 `!pip3 install` 命令安装了两个 Python 库：`torch` 和 `torchvision`。这两个库都是用于深度学习的工具，它们提供了丰富的功能，可以帮助开发者轻松地构建、训练和部署神经网络模型。

* **`torch`** 是 PyTorch 的核心库，它提供了一个强大的张量计算引擎，支持自动微分和神经网络构建功能。PyTorch 尤其适合灵活的深度学习研究，它允许开发者在运行时修改模型的结构，并轻松地调试神经网络。
* **`torchvision`** 是一个与 `torch` 搭配使用的库，它包含了预先训练好的模型（如 ResNet、VGG 等），数据加载器，以及各种图像处理工具（如数据转换、图像增强等）。`torchvision` 简化了图像数据集的准备工作，并提供了可以立即使用的模型，方便开发者快速构建和测试深度学习应用。

这段代码的主要作用是安装 PyTorch 和 torchvision，为后续的深度学习开发做好准备。开发者可以利用 PyTorch 的张量计算能力和 torchvision 提供的预训练模型和工具来高效地进行图像处理、模型训练和部署等任务。


----

In [None]:
# 导入 NumPy 库，它提供了数组、矩阵和其他数学运算工具。
import numpy as np 

# 导入 Matplotlib 库，它提供了绘图工具，可以用来可视化数据。
import matplotlib.pyplot as plt 

# 导入 PyTorch 库，它提供了张量计算、自动微分和神经网络构建等功能。
import torch 

# 导入 torchvision 库，它包含了预先训练好的模型、数据加载器和各种图像处理工具。
from torchvision import datasets, transforms 

# 导入 PyTorch 的 nn 和 optim 模块，它们分别提供神经网络构建和优化器工具。
from torch import nn, optim 

# 定义数据预处理流程，包括将图像转换为张量，并进行归一化。
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,),)]) 

# 加载 MNIST 训练数据集，将其存储到 'pytorch_data/train/' 目录中，下载数据集，并使用定义的数据预处理流程。
trainset = datasets.MNIST('pytorch_data/train/', download=True, train=True, transform=transform) 

# 加载 MNIST 验证数据集，将其存储到 'pytorch_data/test/' 目录中，下载数据集，并使用定义的数据预处理流程。
valset = datasets.MNIST('pytorch_data/test/', download=True, train=False, transform=transform) 

# 创建一个数据加载器，用于将训练数据集以 batch 为单位加载到模型中，其中 batch_size 为 64，并启用数据随机打乱。
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True) 

**解释：**

这段代码主要完成了以下几件事：

1. **导入必要的库：** 导入 NumPy、Matplotlib、PyTorch 和 torchvision 库，并导入 PyTorch 的 nn 和 optim 模块。这些库提供了深度学习模型构建、数据预处理、模型训练、数据可视化等功能。
2. **定义数据变换：** 使用 `transforms.Compose` 定义了一个数据变换流程，包括将图像转换为张量，并进行归一化处理。这将使得后续的模型训练更高效。
3. **加载 MNIST 数据集：**  使用`datasets.MNIST` 加载 MNIST 手写数字数据集，并将数据集存储到指定的目录中。代码分别加载训练集和验证集，并使用之前定义的数据变换进行预处理。
4. **创建数据加载器：** 使用 `torch.utils.data.DataLoader` 创建一个数据加载器，它会以 batch 为单位将训练集加载到模型中，并使用 `shuffle=True` 随机打乱数据，以提高模型泛化能力。

这段代码完成了一些深度学习任务的预备工作，包括导入关键库、准备数据集、创建数据加载器等，并准备好了将数据喂给模型进行训练。


----

In [None]:
# 定义一个神经网络模型，使用 PyTorch 的 nn.Sequential 模块来构建一个多层感知机（MLP）模型。
model = nn.Sequential(
    # 第一个线性层，将 784 维的输入数据映射到 128 维的输出。
    nn.Linear(784, 128), 

    # ReLU 激活函数，将负值映射为 0，并将正值保持不变。
    nn.ReLU(), 

    # 第二个线性层，将 128 维的输入数据映射到 64 维的输出。
    nn.Linear(128, 64), 

    # 再次使用 ReLU 激活函数。
    nn.ReLU(), 

    # 第三个线性层，将 64 维的输入数据映射到 10 维的输出，对应 MNIST 数据集的 10 个类别。
    nn.Linear(64, 10)
) 

**解释：**

这段代码使用 `nn.Sequential` 模块定义了一个包含三个线性层和两个 ReLU 激活函数的多层感知器 (MLP) 模型，用于识别 MNIST 手写数字数据集中的 10 个类别。

* **`nn.Sequential` 模块：**  它是 PyTorch 中常用的模块，用于构建神经网络模型。它接收一个层列表作为参数，并按顺序将这些层连接起来，形成一个完整的网络结构。
* **`nn.Linear` 模块：** 用于定义线性层，它将输入数据与权重矩阵相乘并加上偏置项，实现线性变换。第一个线性层将 784 维的输入数据（MNIST 图像展开后的像素数据）映射到 128 维的输出，第二个线性层将 128 维的输出映射到 64 维的输出，第三个线性层将 64 维的输出映射到 10 维的输出，对应 10 个数字类别。
* **`nn.ReLU` 模块：** 用于定义 ReLU 激活函数，它将输入数据中的负值转换为 0，并将正值保持不变。激活函数的作用是引入非线性，增强模型对数据特征的表达能力。

通过定义这个 MLP 模型，代码准备好了用于处理 MNIST 数据集，并进行模型训练和预测。


----

In [None]:
# 从训练数据加载器中获取一个 batch 的数据，并将其存储在 images 和 labels 变量中。
images, labels = next(iter(trainloader)) 

# 从 images 中获取第一个图像的第一个通道的数据，并将其存储在 pixels 变量中。
pixels = images[0][0] 

# 使用 Matplotlib 绘制图像。
plt.imshow(pixels, cmap='gray') 

# 显示图像。
plt.show()

**解释：**

这段代码从训练数据加载器中获取一个 batch 的数据，并显示第一个图像。

* **`images, labels = next(iter(trainloader))`：** 这行代码从训练数据加载器 `trainloader` 中获取一个 batch 的数据，并将其存储在 `images` 和 `labels` 变量中。`images` 变量包含一个 batch 的图像数据（张量），`labels` 变量包含对应图像的标签数据（张量）。
* **`pixels = images[0][0]`：** 这行代码从 `images` 变量中获取第一个图像的第一个通道的数据，并将其存储在 `pixels` 变量中。由于 MNIST 手写数字图像是一个灰度图像，因此每个图像只有一个通道。
* **`plt.imshow(pixels, cmap='gray')`：** 这行代码使用 Matplotlib 的 `imshow` 函数显示从 `pixels` 变量中读取的图像数据，其中 `cmap='gray'` 指示使用灰度色板。
* **`plt.show()`：** 这行代码显示图像。

这段代码使用 Matplotlib 可视化了一个从 MNIST 数据集中读取的图像，帮助开发者理解数据格式，并为后续的模型训练提供直观参考。


----

In [None]:
# 定义损失函数，使用 PyTorch 的 nn.CrossEntropyLoss 模块，用于计算模型输出与真实标签之间的交叉熵损失。
criterion = nn.CrossEntropyLoss()

# 将图像数据重新整理为一个二维张量，其中第一维度为 batch 大小，第二维度为每个图像的像素个数。
images = images.view(images.shape[0], -1)

# 将整理后的图像数据输入模型，获取模型的输出结果。
output = model(images)

# 使用损失函数计算模型输出与真实标签之间的交叉熵损失。
loss = criterion(output, labels)

# 定义优化器，使用 PyTorch 的 optim.Adam 模块，并设置学习率为 0.003。
optimizer = optim.Adam(model.parameters(), lr=0.003) 

**解释：**

这段代码完成了模型训练中的一部分工作：计算损失并定义优化器。

* **`criterion = nn.CrossEntropyLoss()`：**  定义了损失函数，使用 PyTorch 的 `nn.CrossEntropyLoss` 模块，它是一种常用的分类任务损失函数。交叉熵损失用于衡量模型输出的概率分布与真实标签分布之间的差异，目标是使模型输出的概率分布尽可能接近真实标签的分布。
* **`images = images.view(images.shape[0], -1)`：**  将图像数据重新整理为一个二维张量，其中第一维度为 batch 大小，第二维度为每个图像的像素个数。这是为了将图像数据作为输入传递给模型。
* **`output = model(images)`：**  将图像数据 `images` 输入到模型 `model` 中进行前向传播，并将模型的输出结果存储在 `output` 变量中。
* **`loss = criterion(output, labels)`：** 使用交叉熵损失函数 `criterion` 计算模型输出 `output` 与真实标签 `labels` 之间的损失，并将其存储在 `loss` 变量中。
* **`optimizer = optim.Adam(model.parameters(), lr=0.003)`：**  定义了优化器，使用 PyTorch 的 `optim.Adam` 模块，并设置学习率为 0.003。优化器的作用是根据损失函数的梯度信息来更新模型的参数，使得损失函数值不断下降，最终达到模型收敛的目的。

这段代码完成了模型训练中的重要一步，计算了当前模型的损失，并定义了用于更新模型参数的优化器，为下一步的模型训练做准备。


----

In [None]:
# 设置训练的轮数为 15。
epochs = 15 

# 开始训练循环，循环执行 15 轮。
for e in range(epochs): 

    # 初始化本轮训练的累计损失为 0。
    running_loss = 0 

    # 遍历训练数据加载器中的每个 batch 的数据。
    for images, labels in trainloader: 

        # 将图像数据重新整理为二维张量，以便作为模型的输入。
        images = images.view(images.shape[0], -1) 

        # 清除模型参数的梯度信息。
        optimizer.zero_grad() 

        # 将图像数据输入模型，获取模型的输出。
        output = model(images) 

        # 计算模型输出与真实标签之间的损失。
        loss = criterion(output, labels) 

        # 反向传播计算损失函数对模型参数的梯度。
        loss.backward() 

        # 根据梯度信息更新模型参数，并进行一步优化。
        optimizer.step() 

        # 将当前 batch 的损失值累加到 running_loss 中。
        running_loss += loss.item() 

    # 当遍历完一个 epoch 的所有数据后，打印本轮训练的平均损失。
    else: 

        print("Epoch {} - 训练损失: {}".format(e, running_loss/len(trainloader))) 

**解释：**

这段代码执行了一个简单的训练循环，训练神经网络模型 15 个 epoch。

* **`epochs = 15`：**  设置训练的轮数为 15，表示模型将使用所有训练数据进行 15 轮训练。
* **`for e in range(epochs)`：**  开始训练循环，循环执行 15 轮。
* **`running_loss = 0`：** 初始化本轮训练的累计损失为 0。
* **`for images, labels in trainloader`：**  遍历训练数据加载器中的每个 batch 的数据。
* **`images = images.view(images.shape[0], -1)`：**  将图像数据重新整理为二维张量，以便作为模型的输入。
* **`optimizer.zero_grad()`：** 清除模型参数的梯度信息，因为每个 batch 进行梯度下降之前需要先清除上一步的梯度信息。
* **`output = model(images)`：**  将图像数据输入模型进行前向传播，获取模型的输出。
* **`loss = criterion(output, labels)`：**  计算模型输出与真实标签之间的损失。
* **`loss.backward()`：**  反向传播计算损失函数对模型参数的梯度。
* **`optimizer.step()`：**  根据梯度信息更新模型参数，并进行一步优化。
* **`running_loss += loss.item()`：** 将当前 batch 的损失值累加到 `running_loss` 中。
* **`else:  print("Epoch {} - 训练损失: {}".format(e, running_loss/len(trainloader)))`：**  当遍历完一个 epoch 的所有数据后，打印本轮训练的平均损失，以监控训练过程。

这段代码展示了 PyTorch 中一个典型的训练循环，它演示了如何通过反复迭代地进行参数更新，从而实现模型的收敛，最终完成模型训练过程。


----

In [None]:
# 创建一个验证数据加载器，将所有验证数据作为一个 batch 加载到模型中，并启用数据随机打乱。
valloader = torch.utils.data.DataLoader(valset, batch_size=valset.data.shape[0], shuffle=True) 

# 从验证数据加载器中获取一个 batch 的数据，并将其存储在 val_images 和 val_labels 变量中。
val_images, val_labels = next(iter(valloader)) 

# 将验证图像数据整理为一个二维张量，以便作为模型的输入。
val_images = val_images.view(val_images.shape[0], -1) 

# 将验证图像数据输入模型，获取模型的输出结果。
predictions = model (val_images) 

# 从模型输出结果中取出预测的标签，并将其存储在 predicted_labels 变量中。
predicted_labels = np.argmax(predictions.detach().numpy(), axis=1) 

# 导入 sklearn 库的 accuracy_score 函数，用来计算模型的准确率。
from sklearn.metrics import accuracy_score 

# 计算模型在验证集上的准确率，并打印结果。
accuracy_score(val_labels.detach().numpy(), predicted_labels) 

**解释：**

这段代码使用训练好的模型对验证集进行评估，并打印模型在验证集上的准确率。

* **`valloader = torch.utils.data.DataLoader(valset, batch_size=valset.data.shape[0], shuffle=True)`：**  创建了一个验证数据加载器，将所有验证数据作为一个 batch 加载到模型中，并启用数据随机打乱。
* **`val_images, val_labels = next(iter(valloader))`：**  从验证数据加载器中获取一个 batch 的数据，并将其存储在 `val_images` 和 `val_labels` 变量中。
* **`val_images = val_images.view(val_images.shape[0], -1)`：**  将验证图像数据整理为一个二维张量，以便作为模型的输入。
* **`predictions = model (val_images)`：**  将验证图像数据输入模型，获取模型的输出结果。
* **`predicted_labels = np.argmax(predictions.detach().numpy(), axis=1)`：**  从模型输出结果中取出预测的标签，并将其存储在 `predicted_labels` 变量中。这里使用 `np.argmax` 获取模型输出的概率分布中概率最大的类别，作为预测的标签。
* **`from sklearn.metrics import accuracy_score`：**  导入 `sklearn` 库的 `accuracy_score` 函数，用来计算模型的准确率。
* **`accuracy_score(val_labels.detach().numpy(), predicted_labels)`：**  计算模型在验证集上的准确率，并打印结果。

这段代码展示了如何使用验证集评估训练好的模型，并使用 `sklearn.metrics.accuracy_score` 函数计算模型在验证集上的准确率，以便评估模型的泛化能力。


----

In [None]:
# 使用 PyTorch 的 torch.save 函数将训练好的模型保存到指定路径，模型文件名为 'my_mnist_model.pt'。
torch.save(model, './model/my_mnist_model.pt')

**解释：**

这段代码使用 `torch.save` 函数将训练好的模型 `model` 保存到磁盘上，以便在未来需要使用时加载并使用。

* **`torch.save` 函数：**  PyTorch 的 `torch.save` 函数用于将模型、张量和其他 PyTorch 对象保存到磁盘。它提供了一个简单的方法来存储模型，以便在之后重新加载和使用。
* **`model`：**  指的是训练好的模型，它包含了模型的结构和参数信息。
* **`'./model/my_mnist_model.pt'`：**  是模型保存的路径和文件名。这里将模型保存到 `./model` 目录下，文件名叫做 `my_mnist_model.pt`。`pt` 是 PyTorch 模型的常用后缀名。

通过使用 `torch.save` 函数保存模型，开发者就可以在之后需要使用模型的时候，使用 `torch.load` 函数加载模型，并在新的任务中使用该模型进行预测或进一步的训练。


----