# LinearRegression线性回归

### 代价函数

$$J(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x^i)-y^i)^2$$

* 其中，$h(\theta)=\theta_0+\theta_1x_1+\theta_2x_2+...$。现在我们就是要求出$\theta$，使得代价函数最小，即代表我们拟合出来的数据离真实值最近。

* 共有m个样本，$(h_\theta(x^i-y^i)^2$代表拟合出的值到真实值的差的平方，平方的原因是可能有负值，正负值会抵消。前面的系数2在求梯度下降求偏导的时候会约去。

* 实现代码

In [9]:
# 计算代价函数
def loss(X,y,theta):#这里的X是真实数据前面加了一列，因为有theta0
    m = len(y)
    loss = 0
    
    loss = np.sum((np.dot(X,theta) - y)**2) / (2 * m)
    return loss

### 梯度下降算法

* 代价函数对$\theta_j$求偏导，可以得到

$$\frac{\partial J(\theta)}{\partial \theta_j}=\frac{1}{m}\sum_{i=1}^{m}[(h_\theta(x^i) - y^i)x_j^i]$$

* 所以对$\theta$的更新可以写为：

$$\theta_j = \theta_j-\alpha \frac{1}{m}\sum_{i=1}^{m}[(h_\theta(x^i) - y^i)x_j^i]$$

* 其中，$\alpha $是学习率，代表每次梯度下降的速度，一般为0.01,0.03,0.1，...

* 梯度下降算法是机器学习中常用的算法，计算参数的方法。

* 实现代码

In [10]:
#梯度下降
def grandientDescent(X,y,theta,alpha,num_iters):
    m = len(y)
    
    J_history = np.zeros(num_iters)#存放每次迭代的loss的值，[num_iters x 1]
    
    for i in range(num_iters):
        Z = X.T.dot(X.dot(theta) - y) * alpha / m#更新参数
        theta = theta - Z
        J_history[i] = loss(X,y,theta)#计算损失
    return theta,J_hiistory

### 均值归一化

* 目的是使数据缩放到一个范围内，便于使用梯度下降法。比如房子的面积是1200平方米，房间数是5，2个特征值差别较大，需要对其进行归一化。

* 归一化公式

$$x_i=\frac{x_i-\mu _i}{s_i}$$

$x_i$是每一个样本数据，$\mu _i$是平均值，$s_i$可以是标准差，也可以是最大值-最小值。

* 实现代码

In [11]:
#归一化feature
def featureNormaliza(X):
    X_norm = np.array(X)#将X转化为numpy数组，进行矩阵运算
    #定义变量
    mu = np.zeros((1,X.shape[1]))#(1 x X.shape[1]) 
    sigma = np.zeros((1,X.shape[1]))
    
    mu = np.mean(X_norm,0)#计算每一列的平均值，0代表列
    sigma = np.std(X_norm,0)#求每一列的标准差
    
    for i in range(X.shape[1]):#遍历列
        X_norm[:,i] = (X_norm[:,i] - mu[i]) / sigma[i]#归一化
        
    return X_norm,mu,sigma

* 不仅要对训练数据进行归一化，而且要对测试数据归一化。

### 使用scikit-learn库中的线性模型实现

* 导入包

In [12]:
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler#特征缩放

* 归一化

In [13]:
scaler = StandardScaler()
scaler.fit(X)
x_train = scaler.transform(X)
x_tets = scaler.transform(np.array([1650,3]))

* 线性模型拟合

In [14]:
model = linear_model.LinearRegression()
model.fit(x_train,y)

* 预测

In [15]:
result = model.predict(x_test)