## 随机梯度下降法

In [1]:
import numpy as np
from sklearn import datasets

### 1. 模拟数据

In [2]:
m = 100000 # 样本数

x = np.random.normal(size=m)
X = x.reshape(-1, 1) # 特征数只有一个
y = 4.* x + 3. + np.random.normal(0, 3, size=m)

In [7]:
def J(theta, X_b, y):
    try:
        return np.sum((y - X_b.dot(theta)) ** 2) / len(X_b)
    except:
        return float('inf')
def dJ(theta, X_b, y):
    return X_b.T.dot(X_b.dot(theta) - y) * 2. / len(X_b)
def gradient_descent(X_b, y, initial_theta, eta, n_iters=1e4, epsilon=1e-8):
    theta = initial_theta
    i_iters = 0
    
    while i_iters < n_iters:
        gradient = dJ(theta, X_b, y)
        last_theta = theta
        theta = theta - eta * gradient
        
        if(abs(J(theta, X_b, y) - J(last_theta, X_b, y)) < epsilon):
            break
        i_iters += 1
    return theta

In [8]:
%%time
X_b = np.hstack([np.ones((len(X), 1)), X])
initial_theta = np.zeros(X_b.shape[1])
eta = 0.01
theta = gradient_descent(X_b, y, initial_theta, eta)

Wall time: 442 ms


In [9]:
theta

array([3.00933084, 3.99019421])

从结果可以看出，斜率大致为 4，截距大致为 3，和我们设计的数据是拟合的

### 使用随机梯度下降法

In [10]:
# X_b_i：传入的是 X_b 的第 i 行
# y_i：传入的是 y 的第 i 个数值
def dJ_sgd(theta, X_b_i, y_i):
    return X_b_i.T.dot(X_b_i.dot(theta) - y_i) * 2.

In [11]:
def sgd(X_b, y, initial_theta, n_iters):
    t0 = 5
    t1= 50
     # 学习率函数
    def learning_rate(t):
        return t0 / (t + t1)
    theta = initial_theta
    for i_iter in range(n_iters):
        rand_i = np.random.randint(len(X_b)) # 随机生成一个下标
        gradient = dJ_sgd(theta, X_b[rand_i], y[rand_i])
        theta = theta - learning_rate(i_iter) * gradient
    return theta

In [12]:
%%time
X_b = np.hstack([np.ones((len(X), 1)), X])
initial_theta = np.zeros(X_b.shape[1])
theta = sgd(X_b, y, initial_theta, n_iters=len(X_b)//3)

Wall time: 187 ms


In [13]:
theta

array([2.9904752 , 3.95833456])

&emsp;&emsp;我们从结果可以发现，使用随机梯度下降法得到的也差不多是3和4，但是时间却比梯度下降的442ms快很多，而且我们只循环了1/3次样本数就得到了比较准确的结果，比梯度下降法一次循环的次数还要少。

&emsp;&emsp;但是，我们在实际对高维的样本应用随机梯度下降法的时候可能不能这么随意的只是用三分之一的样本数，在这里只是一个例子展示它的强大之处。