In [1]:
import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l

true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)

In [2]:
def load_array(data_arrays, batch_size, is_train=True):  #@save
    """构造一个PyTorch数据迭代器"""
    dataset = data.TensorDataset(*data_arrays)
    return data.DataLoader(dataset, batch_size, shuffle=is_train)

batch_size = 10
data_iter = load_array((features, labels), batch_size)

In [3]:
next(iter(data_iter))

[tensor([[ 0.0424, -0.3804],
         [ 1.6127, -0.1629],
         [ 0.4307, -0.8335],
         [ 0.8947, -0.2610],
         [-0.8985, -0.1640],
         [-0.7958,  1.6937],
         [ 0.3877, -0.2677],
         [ 1.2838, -0.5099],
         [-0.6206, -1.0721],
         [ 0.9120,  0.9245]]),
 tensor([[ 5.5858],
         [ 7.9795],
         [ 7.8801],
         [ 6.8842],
         [ 2.9559],
         [-3.1468],
         [ 5.8954],
         [ 8.4909],
         [ 6.6129],
         [ 2.8869]])]

In [4]:
# nn是神经网络的缩写
from torch import nn

net = nn.Sequential(nn.Linear(2, 1))

In [7]:
# normal_是一个就地操作，意味着它会直接修改权重的值，而不是创建一个新的副本。

In [10]:
# 初始化参数

In [11]:
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

tensor([0.])

In [12]:
# 优化器设置

In [13]:
trainer = torch.optim.SGD(net.parameters(), lr=0.03)

In [14]:
# 损失函数的设置

In [16]:
loss = nn.MSELoss()

In [17]:
# 训练

In [18]:
num_epochs = 3
for epoch in range(num_epochs):
    for X, y in data_iter:
        l = loss(net(X) ,y)
        trainer.zero_grad()
        l.backward()
        trainer.step()
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')

epoch 1, loss 0.000256
epoch 2, loss 0.000093
epoch 3, loss 0.000094


In [19]:
w = net[0].weight.data
print('w的估计误差：', true_w - w.reshape(true_w.shape))
b = net[0].bias.data
print('b的估计误差：', true_b - b)

w的估计误差： tensor([-0.0005,  0.0008])
b的估计误差： tensor([9.0599e-05])


在深度学习和线性代数中，标量、向量和张量分别是不同维度的数据结构，具体来说：

### 1. 标量（Scalar）

- **定义**：标量是只有一个数值的量，即单一的数，没有方向。
- **维度**：标量是 0 维的。
- **表示**：通常用单个数值表示，例如 `5`、`-3.2`。
- **示例**：温度、时间、质量等可以用一个数值表示的量。

### 2. 向量（Vector）

- **定义**：向量是一组按顺序排列的数值，可以看作是具有大小和方向的量。
- **维度**：向量是 1 维的。
- **表示**：用一组数值组成的数组来表示，如 `[1, 2, 3]` 或 `[-0.5, 2.3]`。
- **示例**：一个二维向量 `[3, 4]` 表示了 x 和 y 方向上的分量；也可以用于描述特征数据，如一个人的身高和体重 `[180, 75]`。

### 3. 张量（Tensor）

- **定义**：张量是一个多维数组，可以包含标量、向量或更高维的结构。广义上，张量是 n 维的扩展。
- **维度**：张量的维度可以是 0 维（标量）、1 维（向量）、2 维（矩阵）或更高维。
- **表示**：可以用 n 维数组表示。
  - **2 维张量**：如矩阵 `[[1, 2, 3], [4, 5, 6]]`，有行和列。
  - **3 维张量**：如 `[[[1, 2], [3, 4]], [[5, 6], [7, 8]]]`，常用于图像数据等。
  - **n 维张量**：更高维的张量可以表示复杂的数据结构。
- **示例**：在深度学习中，图像数据通常表示为 3D 张量（高、宽、通道），视频数据可以表示为 4D 张量（帧数、高、宽、通道）。

### 区别总结

- **标量**是单个数（0 维），**向量**是一维数组（1 维），**张量**是 n 维数组，可以是标量、向量、矩阵的推广。