<a href="https://colab.research.google.com/github/God-Orcale/AI_Test/blob/main/NetWork.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import os
import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
# 构建一个神经网络来对FashionMNIST数据集中的图像进行分类

In [2]:
device = torch.accelerator.current_accelerator().type if torch.accelerator.is_available() else "cpu"
print(f"using {device}")
# 如果当前加速器可用，我们将使用它。否则，我们使用 CPU。

using cpu


In [16]:
class NeuralNetwork(nn.Module):
  def __init__(self):
    super().__init__()
    self.flatten = nn.Flatten()
    self.linear_relu_stack = nn.Sequential(
        nn.Linear(28*28,512),
        nn.ReLU(),
        nn.Linear(512,512),
        nn.ReLU(),
        nn.Linear(512,10),
    )
  def forward(self,x):
    x = self.flatten(x)
    logits = self.linear_relu_stack(x)
    return logits

# 通过子类化来定义我们的神经网络，并且在其中初始化神经网络层

In [17]:
model = NeuralNetwork().to(device)
print(model)
# 创建一个NeuralNetwork的实例，并将其移动到device中，然后打印它的结构。

NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512, bias=True)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512, bias=True)
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10, bias=True)
  )
)


In [18]:
X= torch.rand(1,28,28,device = device)
logits = model(X)
pred_probab = nn.Softmax(dim=1)(logits)
y_pred = pred_probab.argmax(1)
print(f"Predicted class:{y_pred}")
# 在输入上调用模型将返回一个二维张量，其中dim=0对应于每个类的10个原始预测值的每个输出，dim=1对应于每个输出的单个值。
# 我们通过模块nn.Softmax的一个实例传递预测概率来获得预测概率。

Predicted class:tensor([3])


In [19]:
input_image = torch.rand(3,28,28)
print(input_image.size())

torch.Size([3, 28, 28])


In [21]:
flatten = nn.Flatten()
flat_image = flatten(input_image)
print(flat_image.size())
# 我们初始化nn.拼合图层，将每个2D 28x28图像转换为包含784个像素值的连续数组

torch.Size([3, 784])


In [22]:
layer1 = nn.Linear(in_features= 28*28,out_features=20)
hidden1 = layer1(flat_image)
print(hidden1.size())
# 线性层是一个模块，它使用其存储的权重和偏差对输入应用线性变换。

torch.Size([3, 20])


In [23]:
print(f"Before ReLU{hidden1}\n\n")
hidden1 = nn.ReLU()(hidden1)
print(f"After ReLU{hidden1}")
# 非线性激活是在模型的输入和输出之间创建复杂的映射。
# 它们在线性变换后应用，以引入非线性，从而帮助神经网络学习各种各样的现象。

Before ReLUtensor([[-7.3235e-02,  2.2883e-02, -2.6995e-01, -1.4059e-01, -4.7971e-01,
          2.0971e-02, -6.9681e-03, -1.1611e-01,  2.9156e-01,  3.0626e-01,
         -5.0002e-01,  4.5415e-01,  2.1606e-01, -4.6669e-04,  8.5264e-02,
          2.7805e-01,  4.2091e-01,  4.8029e-01, -4.9900e-01, -7.0524e-01],
        [-1.3606e-01, -1.5751e-01, -3.2267e-01, -1.7436e-01, -4.3722e-01,
         -1.3772e-01,  3.0266e-01,  1.4383e-01, -3.7931e-02,  1.0903e-01,
         -5.6980e-01,  4.4693e-01,  1.0970e-01,  1.4063e-01,  1.8348e-01,
         -7.0629e-02,  2.2586e-01,  3.1600e-01, -1.7524e-01, -1.8432e-01],
        [-2.4502e-01,  2.7281e-01, -1.1779e-01, -3.4298e-01, -4.2495e-02,
         -2.7655e-02,  6.6275e-02,  1.4935e-02, -1.3335e-02,  4.6180e-01,
         -4.2545e-01,  5.2105e-01, -1.1341e-01,  2.1428e-01,  3.5837e-02,
          4.8735e-01,  2.1930e-01,  1.8346e-01,  1.0707e-02,  3.9566e-02]],
       grad_fn=<AddmmBackward0>)


After ReLUtensor([[0.0000, 0.0229, 0.0000, 0.0000, 0.0000, 0.0

In [24]:
softmax = nn.Softmax(dim=1)
pred_probab = softmax(logits)
# 神经网络的最后一个线性层返回logits（原始值），这些值将传递给nn.Softmax模块。
# logit 将缩放为值 [0， 1] 表示模型对每个类的预测概率。

In [25]:
print(f"Model structure{model}\n\n")
for name,param in model.named_parameters():
  print(f"Layer:{name}|size:{param.size()}|Values:{param[:2]}\n")
# 神经网络中的许多层都是参数化的，即具有相关的权重以及在训练期间优化的偏差。
# 自动子类化跟踪模型对象中定义的所有字段，并生成所有参数可使用您的模型或方法访问
# nn.Module parameters() named_parameters()

Model structureNeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512, bias=True)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512, bias=True)
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10, bias=True)
  )
)


Layer:linear_relu_stack.0.weight|size:torch.Size([512, 784])|Values:tensor([[ 0.0285,  0.0292,  0.0062,  ..., -0.0097, -0.0247, -0.0325],
        [ 0.0130, -0.0048, -0.0289,  ...,  0.0343,  0.0008,  0.0102]],
       grad_fn=<SliceBackward0>)

Layer:linear_relu_stack.0.bias|size:torch.Size([512])|Values:tensor([-0.0155, -0.0253], grad_fn=<SliceBackward0>)

Layer:linear_relu_stack.2.weight|size:torch.Size([512, 512])|Values:tensor([[ 0.0438,  0.0409, -0.0031,  ..., -0.0074,  0.0001,  0.0227],
        [ 0.0203, -0.0249,  0.0312,  ...,  0.0276,  0.0158,  0.0203]],
       grad_fn=<SliceBackward0>)

Layer:linear_relu_stack.2.bias|size:torch.Size([512])|Values:te