# 线性回归的简洁实现
利用torch的一些已经成熟的库，如损失函数，优化函数，模型等的，就不用自己定义了。创建数据环节都是一样的。

In [1]:
import torch
import matplotlib.pyplot as plt

In [2]:
# 创建数据生成函数
# 人造数据集
def synthetic_data(weight, bias, num_samples):
    x = torch.normal(0, 1, (num_samples, len(weight)))  # normal函数 均值为0，方差为1的正态分布
    # 矩阵乘以向量
    y = torch.matmul(x, weight) + bias
    y += torch.normal(0, 0.01, y.shape) # 添加噪声
    return x, y
weights = torch.tensor([4.0, -1.2], dtype=torch.float32).T
bias = torch.tensor(4.2, dtype=torch.float32)
features, labels = synthetic_data(weights, bias, 1000)
print(features.shape, labels.shape)
print(features[0], labels[0])

torch.Size([1000, 2]) torch.Size([1000])
tensor([ 0.4351, -0.5598]) tensor(6.6048)


## 1. 使用torch的API创建数据迭代器

In [6]:
from torch.utils import data  # 数据预加载的包在这里
def data_loader(data_array, batch_size, is_train=True):
    """
    return:
        返回值是一个dataloader对象，包含所有的数据，然后dataloader每次按批量返回数据
    """
    # 将数据集转化成tensor张量格式
    data_array = data.TensorDataset(*data_array)
    # 将其转化成迭代API
    return data.DataLoader(data_array, batch_size, shuffle=is_train)

batch_size = 10
data_iter = data_loader((features, labels), batch_size)
next(iter(data_iter)) # iter是迭代器，使用next方法来遍历可迭代对象的每一个对象

[tensor([[-0.9687, -2.3360],
         [-0.9965,  1.0692],
         [ 0.1149,  0.3633],
         [ 1.9829,  1.4258],
         [-0.7503,  1.1261],
         [ 0.3197, -0.4763],
         [-0.4295,  1.3899],
         [ 0.1062, -0.3621],
         [ 0.2056,  0.3589],
         [ 1.4316, -1.0219]]),
 tensor([ 3.1419, -1.0648,  4.2317, 10.4315, -0.1586,  6.0617,  0.8066,  5.0571,
          4.5952, 11.1447])]