# 机器学习笔记2

----------------
本次任务的主要学习知识点是线性回归。该笔记将着重从以下方面对线性回归内容进行说明和整理：

* 线性回归的原理

* 线性回归损失函数、代价函数、目标函数

* 优化方法（梯度下降法、牛顿法、拟牛顿法等）

* 线性回归的评估指标

* SKlearn参数详解

### 线性模型回顾

线性回归来自于线性模型，所谓的线性模型就是：某变量X通过d个属性来描述，要求生成一个通过属性的线性组合来进行预测的函数法f(x)。其表达书如下：

$$X=(x_1,x_2,...,x_d)$$

$$f(X)=w_1x_1+w_2x_2+...+w_dx_d+b$$

一般地，通过向量可表示为：

$$f(X)=w^TX+b$$

其中$w=(w_1,w_2,...,w_d)$，当w和b学习到之后，模型就确定下来了

线性模型有很多种，包含常见的线性回归、对数几率回归、线性判别分析、多分类学习等。这里只记录线性回归的知识点。

### 1.线性回归的原理

------------
线性回归的推导过程可以在周志华老师的机器学习一书中具体看到，这里就做简要的总结，其基本的公式如下：

在一般的情况下，给定数据集$D={(x_1,y_1),(x_2,y_2),...,(x_m,y_m)}$，其中$x_i=(x_i1,x_i2,...,x_id)，y_i∈R$。

此时需要学习的函数可以表示为：$f(x_i)=w^Tx_i+b$，使得$f(x_i)≈y_i$

相应地，这里需要估计出w和b的值，才能确定出回归函数的值。为了讨论方便，将b吸收到w中，组成增广矩阵的形式，即$w^*=(w,b)$，相应的就把数据集D变为了$m*(d+1)$的矩阵X，可表示为：

$$\mathbf{X}=\left(\begin{array}{ccccc}
{x_{11}} & {x_{12}} & {\dots} & {x_{1 d}} & {1} \\
{x_{21}} & {x_{22}} & {\dots} & {x_{2 d}} & {1} \\
{\vdots} & {\vdots} & {\ddots} & {\vdots} & {\vdots} \\
{x_{m 1}} & {x_{m 2}} & {\dots} & {x_{m d}} & {1}
\end{array}\right)=\left(\begin{array}{cc}
{x_{1}^{\mathrm{T}}} & {1} \\
{x_{2}^{\mathrm{T}}} & {1} \\
{\vdots} & {\vdots} \\
{x_{m}^{\mathrm{T}}} & {1}
\end{array}\right)$$

相应地，把标记也写为向量形式，即：$y=(y_1,y_2,...,y_m)$，于是有：$\hat{\boldsymbol{w}}^{*}=\underset{\hat{w}}{\arg \min }(\boldsymbol{y}-\mathbf{X} \hat{\boldsymbol{w}})^{\mathrm{T}}(\boldsymbol{y}-\mathbf{X} \hat{\boldsymbol{w}})$

通过矩阵求解，最终学习到的线性回归模型为：$f\left(\hat{\boldsymbol{x}}_{i}\right)=\hat{\boldsymbol{x}}_{i}^{\mathrm{T}}\left(\mathbf{X}^{\mathrm{T}} \mathbf{X}\right)^{-1} \mathbf{X}^{\mathrm{T}} \boldsymbol{y}$

这其中需要注意的知识点是：矩阵$X^TX$是满秩矩阵，但是实际生活中，并不都是满足这一条件，因此会存在多个解满足上述条件，使得均方误差最小。这时候究竟是选择哪个解作为输出，就需要做一些处理，比如正则化。

In [7]:
#生成数据
import numpy as np
#生成随机数
np.random.seed(1234)
x = np.random.rand(500,3)
# 构建映射关系，模拟真实的数据待预测值,映射关系为y = 4.2 + 5.7*x1 + 10.8*x2，可自行设置值进行尝试
y = x.dot(np.array([4.2,5.7,10.8]))

In [4]:
import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
%matplotlib inline

# 调用模型
lr = LinearRegression(fit_intercept=True)
# 训练模型
lr.fit(x,y)
print("估计的参数值为：%s" %(lr.coef_))
# 计算R平方
print('R2:%s' %(lr.score(x,y)))
# 任意设定变量，预测目标值
x_test = np.array([2,4,5]).reshape(1,-1)
y_hat = lr.predict(x_test)
print("预测值为: %s" %(y_hat))

估计的参数值为：[ 4.2  5.7 10.8]
R2:1.0
预测值为: [85.2]


In [6]:
class LR_LS():
    def __init__(self):
        self.w = None      
    def fit(self, X, y):
        # 最小二乘法矩阵求解
        #============================= show me your code =======================
        self.w = 
        #============================= show me your code =======================
    def predict(self, X):
        # 用已经拟合的参数值预测新自变量
        #============================= show me your code =======================
        y_pred = 
        #============================= show me your code =======================
        return y_pred

if __name__ == "__main__":
    lr_ls = LR_LS()
    lr_ls.fit(x,y)
    print("估计的参数值：%s" %(lr_ls.w))
    x_test = np.array([2,4,5]).reshape(1,-1)
    print("预测值为: %s" %(lr_ls.predict(x_test)))

SyntaxError: invalid syntax (<ipython-input-6-9626c835e784>, line 7)