# 深度学习 实验1

本节课我们尝试实现简单的模型——线性回归，线性回归是最简单的模型

$$
\hat y=w\cdot x+b
$$

其中 $w,b$ 是需要训练的参数，在训练前，请以分布 $U(-0.1,0.1)$ 进行随机初始化

损失函数取

$$
L=\frac{1}{2}(\hat y-y)^2
$$

使用随机梯度下降法，在每次迭代中随机取样本 $x,y$，按照下式进行迭代：

$$
w\leftarrow w-\eta\frac{\partial L}{\partial w}
$$
$$
b\leftarrow b-\eta\frac{\partial L}{\partial b}
$$

其中学习率 $\eta$ 请自行调节。

## Task 1

用代码实现线性回归模型，请不要调用 `sklearn` 等机器学习库。

In [1]:
import numpy as np
import pandas as pd
def liner(w, b, x):
    return np.dot(w,x) + b
def loss(y, y_hat):
    return 0.5*((y_hat-y)**2)
def optimize(w, b, eta, y_hat,y):
    dw = (y_hat-y)*x*eta
    db = (y_hat-y)*eta
    return w-dw, b-db

## Task 2

读取数据文件 `train_data.csv` 和 `test_data.csv`，文件中列为 `label` 的表示标签，1 表示正例，0 表示负例，其余列为 $x$，取值均为 0 或 1。使用 `train_data.csv` 训练你的模型，并用 `test_data.csv` 进行测试，计算模型的准确率。

In [2]:
eta = 0.0025
w = (-1 + 2*np.random.random(100))/10
b = (-1 + 2*np.random.random())/10
i = 0
train_data = pd.read_csv("train_data.csv")
for i in range(1000):
    x = train_data.sample().values
    y = x[0][100]
    x = x[0][:100]
    y_hat = liner(w, b, x.T)
    w, b = optimize(w, b, eta, y_hat, y)
test_data = pd.read_csv("test_data.csv")
cnt = 0
for i in range(258):
    x = test_data.loc[i].values[:100]
    y = test_data.loc[i].values[100]
    y_hat = liner(w, b, x)
    if(y_hat>0.5 and y==1):
        cnt = cnt + 1
    elif(y_hat<0.5 and y==0):
        cnt = cnt + 1
p = cnt/258
print(p)

0.7364341085271318


## Task 3

请尝试使用不同的学习率 $\eta$ 进行测试，比较模型的效果，试分析 $\eta$ 的大小对模型效果的影响。

In [9]:
etas = [0.25, 0.075, 0.065, 0.06, 0.05, 0.045, 0.04, 0.025, 0.0075, 0.0025, 0.00025]
for eta in etas:
    w = (-1 + 2*np.random.random(100))/10
    b = (-1 + 2*np.random.random())/10
    i = 0
    train_data = pd.read_csv("train_data.csv")
    for i in range(10000):
        x = train_data.sample().values
        y = x[0][100]
        x = x[0][:100]
        y_hat = liner(w, b, x.T)
        w, b = optimize(w, b, eta, y_hat, y)
    test_data = pd.read_csv("test_data.csv")
    cnt = 0
    for i in range(258):
        x = test_data.loc[i].values[:100]
        y = test_data.loc[i].values[100]
        y_hat = liner(w, b, x)
        if(y_hat>0.5 and y==1):
            cnt = cnt + 1
        elif(y_hat<0.5 and y==0):
            cnt = cnt + 1
    p = cnt/258
    print("when eta = {}, p = {}".format(eta, p))

  after removing the cwd from sys.path.
  


when eta = 0.25, p = 0.0
when eta = 0.075, p = 0.9883720930232558
when eta = 0.065, p = 0.9922480620155039
when eta = 0.06, p = 0.9844961240310077
when eta = 0.05, p = 0.9728682170542635
when eta = 0.045, p = 0.9806201550387597
when eta = 0.04, p = 0.9883720930232558
when eta = 0.025, p = 0.9883720930232558
when eta = 0.0075, p = 0.9806201550387597
when eta = 0.0025, p = 0.9457364341085271
when eta = 0.00025, p = 0.7441860465116279
