In [6]:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File    : LinearRegression.py

"""
线性回归模型
2、使用逆矩阵计算得到最小二乘法的参数
"""
import numpy as np
import matplotlib.pyplot as plt


class LinearRegression:
    def __init__(self):
        self.w = None

    def _ols(self, x, y):
        """
        利用逆矩阵解得最小二乘法的参数
        :param x: 样本数据，大小为m * (d + 1)，其中m为样本数，d为属性数
        :param y: 样本对应的标签，大小为m * 1
        :return: 求解的 w* =（XTX）-1 XT y
        """
        tmp = np.linalg.inv(np.matmul(x.T, x))    # np.linalg.inv()：矩阵求逆
        tmp = np.matmul(tmp, x.T)
        w = np.matmul(tmp, y)
        return w
        # return np.linalg.inv(X.T @ X) @ X.T @ y

    def _preprocess_data_x(self, x):
        """
        数据预处理，转换为方便计算形式
        :param x: 原始样本数据, 大小为m * d, 其中m为样本数，d为属性数
        :return: 结合后的数据，大小为m * (d + 1)在最后一列加入1，方便参数w, b的计算。
        """
        # 数据预处理
        m, n = x.shape
        x_ = np.empty((m, n + 1))
        x_[:, 0: n] = x
        x_[:, -1] = 1
        return x_

    def train(self, x_train, y_train):
        """
        训练模型，求的参数
        :param x_train: 训练集输入，矩阵/二维数组
        :param y_train: 训练集输入对应标签，矩阵/二维数组
        """
        x_new = self._preprocess_data_x(x_train)
        self.w = self._ols(x_new, y_train)

    # predict()方法：预测，实现函数 hw(x)=wTw，对x中每个实例进行预测
    def predict(self, x_test):
        """
        预测结果，实现函数 f(x)=xTw
        :param x_test: 新的数据
        :return: 返回预测值
        """
        x = self._preprocess_data_x(x_test)
        y_predict = np.matmul(x, self.w)
        return y_predict

    def evaluate(self, y_test, y_predict):
        # 使用均方根误差评估模型
        n = len(y_test)
        error = (y_test - y_predict)**2
        rmse = ((1.0 / n) * sum(error))**0.5
        return rmse

    def draw(self, x_train, y_train, x_test, y_test):
        f = x_train.dot(self.w[0: -1]) + self.w[-1]
        plt.scatter(x_train, y_train, color='black')
        plt.scatter(x_test, y_test, color='blue')
        plt.plot(x_train, f, color='red')
        plt.xlabel('X')
        plt.ylabel('y')
        plt.show()


