线性回归

In [None]:
# 我们把试图预测的目标（比如预测房屋价格）称为标签（label）或目标（target）
# 预测所依据的自变量（面积和房龄）称为特征（feature）或协变量（covariate）

In [None]:
# 我们通常会在每次需要计算更新的时候随机抽取一小批样本，
# 这种变体叫做小批量随机梯度下降

In [None]:
# 算法的步骤如下： 
# （1）初始化模型参数的值，如随机初始化； 
# （2）从数据集中随机抽取小批量样本且在负梯度的方向上更新参数，并不断迭代这一步骤

In [None]:
# 深度学习实践者很少会去花费大力气寻找这样一组参数，使得在训练集上的损失达到最小。 
# 事实上，更难做到的是找到一组参数，这组参数能够在我们从未见过的数据上实现较低的损失， 
# 这一挑战被称为泛化（generalization）

In [1]:
%matplotlib inline
import math
import time
import numpy as np
import torch
from d2l import torch as d2l

In [9]:
n = 10000
a = np.ones([n])
b = np.ones([n])

In [10]:
class Timer:  #@save
    """记录多次运行时间"""
    def __init__(self):
        self.times = []
        self.start()

    def start(self):
        """启动计时器"""
        self.tik = time.time()

    def stop(self):
        """停止计时器并将时间记录在列表中"""
        self.times.append(time.time() - self.tik)
        return self.times[-1]

    def avg(self):
        """返回平均时间"""
        return sum(self.times) / len(self.times)

    def sum(self):
        """返回时间总和"""
        return sum(self.times)

    def cumsum(self):
        """返回累计时间"""
        return np.array(self.times).cumsum().tolist()

In [11]:
c = torch.zeros(n)
timer = Timer()
for i in range(n):
    c[i] = a[i] + b[i]
f'{timer.stop():.5f} sec'

'0.03668 sec'

In [None]:
# 矢量化代码通常会带来数量级的加速
timer.start()
d = a + b
f'{timer.stop():.5f} sec'

'0.00094 sec'

In [None]:
# 通常我们在计算层数时不考虑输入层
# 输入层中的输入数称为特征维度