# 深度学习 实验1

本节课我们尝试实现简单的模型——线性回归，线性回归是最简单的模型

$$
\hat y=w\cdot x+b
$$

其中 $w,b$ 是需要训练的参数，在训练前，请以分布 $U(-0.1,0.1)$ 进行随机初始化

损失函数取

$$
L=\frac{1}{2}(\hat y-y)^2
$$

使用随机梯度下降法，在每次迭代中随机取样本 $x,y$，按照下式进行迭代：

$$
w\leftarrow w-\eta\frac{\partial L}{\partial w}
$$
$$
b\leftarrow b-\eta\frac{\partial L}{\partial b}
$$

其中学习率 $\eta$ 请自行调节。

## Task 1

用代码实现线性回归模型，请不要调用 `sklearn` 等机器学习库。

In [181]:
#用来训练w，b
#x,y代表自变量和因变量
#xdim，ydim分别代表x和y的维度
#dim代表训练数据量
#eta为机器学习步长
def train(x,y,xdim,ydim,dim,eta):
    w=np.zeros(xdim)
    b=np.zeros(ydim)
    #迭代更新w，b
    for i in range(dim):
        y_hat=np.dot(x[i],w)+b
        error=y_hat-y[i]
        delta_w=error*x[i]
        delta_b=error
        w=w-delta_w*eta
        b=b-delta_b*eta
    return w,b

#用来测试模型准确率
def test(x,y,dim,w,b):
    right=0
    wrong=0
    for i in range(dim):
        y_hat=np.dot(x[i],w)+b
        y_hat=round(y_hat[0])
        if(y_hat==y[i]):
            right+=1
        else:
            wrong+=1
    return right,wrong

## Task 2

读取数据文件 `train_data.csv` 和 `test_data.csv`，文件中列为 `label` 的表示标签，1 表示正例，0 表示负例，其余列为 $x$，取值均为 0 或 1。使用 `train_data.csv` 训练你的模型，并用 `test_data.csv` 进行测试，计算模型的准确率。

In [182]:
import numpy as np
import pandas as pd
import math

#读数
train_data = pd.read_csv('train_data.csv')
train_data=train_data.values[0:604,:]
x=np.array(train_data[:,0:100])
y=np.array(train_data[:,100])

#初始化参数
eta=0.01
dim1=603
xdim=100
ydim=1
w,b=train(x,y,xdim,ydim,dim1,eta)

#读数
test_data = pd.read_csv('test_data.csv')
test_data=test_data.values[0:259,:]
x_test=np.array(test_data[:,0:100])
y_test=np.array(test_data[:,100])

dim2=258
right,wrong=test(x_test,y_test,dim2,w,b)
print("总共有",dim2,"条测试数,其中正确条数为",right,"错误个数为",wrong,"。")

总共有 258 条测试数,其中正确条数为 257 错误个数为 1 。


## Task 3

请尝试使用不同的学习率 $\eta$ 进行测试，比较模型的效果，试分析 $\eta$ 的大小对模型效果的影响。

In [183]:

for eta in range(0,1000,25):
    eta=eta/10000
    w,b=train(x,y,xdim,ydim,dim1,eta)
    right,wrong=test(x_test,y_test,dim2,w,b)
    print("eta=",eta,"准确率=",right/dim2)

eta= 0.0 准确率= 0.49612403100775193
eta= 0.0025 准确率= 0.9767441860465116
eta= 0.005 准确率= 0.9883720930232558
eta= 0.0075 准确率= 0.9922480620155039
eta= 0.01 准确率= 0.9961240310077519
eta= 0.0125 准确率= 0.9961240310077519
eta= 0.015 准确率= 0.9961240310077519
eta= 0.0175 准确率= 0.9961240310077519
eta= 0.02 准确率= 0.9961240310077519
eta= 0.0225 准确率= 0.9961240310077519
eta= 0.025 准确率= 0.9961240310077519
eta= 0.0275 准确率= 0.9961240310077519
eta= 0.03 准确率= 0.9961240310077519
eta= 0.0325 准确率= 0.9961240310077519
eta= 0.035 准确率= 0.9961240310077519
eta= 0.0375 准确率= 0.9961240310077519
eta= 0.04 准确率= 0.9961240310077519
eta= 0.0425 准确率= 0.9961240310077519
eta= 0.045 准确率= 0.9922480620155039
eta= 0.0475 准确率= 0.9922480620155039
eta= 0.05 准确率= 0.9922480620155039
eta= 0.0525 准确率= 0.9922480620155039
eta= 0.055 准确率= 0.9883720930232558
eta= 0.0575 准确率= 0.9883720930232558
eta= 0.06 准确率= 0.9883720930232558
eta= 0.0625 准确率= 0.9883720930232558
eta= 0.065 准确率= 0.9883720930232558
eta= 0.0675 准确率= 0.9883720930232558
eta= 0.07 准确率

由分析结果可以看出，学习率$\eta$过大或者过小都会影响模型的准确率，eta在0.01~0.0425之间，模型效果越好。