# 线性回归

In [1]:
import torch
import random
from matplotlib import pyplot as plt

## 任务一：生成数据集

In [2]:
# 生成带有噪声的线性模型数据集
def gen_data(w, b, num_examples):
    X = torch.normal(0, 1, (num_examples, len(w)))
    y = torch.matmul(X, w) + b
    y += torch.normal(0, 0.01, y.shape)
    return X, y.reshape((-1, 1))

w_real = torch.tensor([3.7, -2.0])
b_real = 0.5
features, labels = gen_data(w_real, b_real, 1000)

请尝试使用`matplotlib`包，画出生成数据第一个特征的散点图，代码请在下方代码块完成。（提示：第一个特征为`features[:, 0]`）

In [3]:
# ----------使用Matplotlib画散点图----------


# -----------------------------------------

## 任务二：手工实现梯度下降算法
### 定义一个数据集迭代器

In [4]:
# 使用python的generator，构造一个生成数据集的迭代器
def data_iter(batch_size, features, labels):
    num_examples = len(features)
    indices = list(range(num_examples))
    random.shuffle(indices)
    for i in range(0, num_examples, batch_size):
        batch_indices = torch.tensor(
            indices[i: min(i + batch_size, num_examples)])
        yield features[batch_indices], labels[batch_indices]

### 定义损失函数

损失函数使用均方误差，即：$\frac{1}{N}\sum_{i=1}^N\frac{1}{2}(\hat{y}^{(i)}-y^{(i)})^2$。

请根据上述损失函数的定义，写出对应的Python代码，在下方的代码块中完成。

In [5]:
def square_loss(y_hat, y):
    # ---------计算均方损失---------

    pass

    # ---------计算均方损失---------

### 定义一个线性模型

In [4]:
def linearModel(X, w, b):
    return torch.matmul(X, w) + b

### 定义优化算法

采用小批量随机梯度下降算法。

In [5]:
def sgd(params, lr):
    with torch.no_grad():
        for p in params:
            p -= lr * p.grad
            p.grad.zero_()

## 训练

- 随机初始化模型参数，重复以下步骤：
- 计算梯度 $\bm g$；
- 更新参数 $(\bm w,b) \leftarrow (\bm w, b) - \alpha \bm g$，其中 $\alpha$ 为学习率。

In [None]:
# 定义超参数
lr = 0.003
num_epochs = 3
batch_size = 10

# 初始化模型参数
w = torch.normal(0, 0.01, (2,1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)

# 开始迭代
iteration = 0
for epoch in range(num_epochs):
    for X, y in data_iter(batch_size, features, labels):
        loss = square_loss(linearModel(X, w, b), y)
        loss.backward()
        sgd([w,b], lr)
        iteration += 1
        print(f'epoch {epoch+1}, iteraion {iteration}, loss {loss}')

print(f'估计的w={w.detach().numpy()}')
print(f'估计的b={b.detach().numpy()}')