#### 设计一元线性回归完整代码

In [5]:
import numpy as np

class LinearRegression:
    # 学习率和迭代次数
    def __init__(self, learning_rate=0.01, num_iterations=1000):
        self.learning_rate = learning_rate
        self.num_iterations = num_iterations
        self.weights = None
        self.bias = None
    
    def fit(self, X, y):
        num_samples, num_features = X.shape
        self.weights = np.zeros(num_features)
        self.bias = 0
        
        for i in range(self.num_iterations):
            y_pred = np.dot(X, self.weights) + self.bias
            
            # compute gradients
            dw = (1/num_samples) * np.dot(X.T, (y_pred - y))
            db = (1/num_samples) * np.sum(y_pred - y)
            
            # update parameters
            self.weights -= self.learning_rate * dw
            self.bias -= self.learning_rate * db
    
    def predict(self, X):
        y_pred = np.dot(X, self.weights) + self.bias
        return y_pred


这个类有三个方法：

- __init__: 构造方法，设置模型的超参数（学习率和迭代次数）以及模型的参数（权重和偏置）。
- fit: 训练模型，使用梯度下降法来更新模型的参数（权重和偏置）。
- predict: 预测新数据的输出值，使用模型的参数（权重和偏置）来计算预测值。

其中，fit 方法的实现使用了梯度下降法来更新模型的参数。

在每次迭代中，计算预测值和真实值之间的误差，然后使用误差来计算梯度。

最后，使用学习率和梯度来更新模型的参数。

predict 方法的实现非常简单，只需要使用模型的参数来计算预测值即可。

使用该类时，可以按照以下步骤进行：

- 准备数据。将特征数据 X 和输出数据 y 分别存储为 NumPy 数组。
- 创建一个 LinearRegression 类的实例。
- 使用 fit 方法来训练模型，传入特征数据 X 和输出数据 y。
- 使用 predict 方法来预测新数据的输出值，传入特征数据 X_new。

In [6]:
###################### 测试代码 #############################

# 准备数据
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([1, 2, 3, 4, 5])

# 创建 LinearRegression 类的实例
model = LinearRegression()

# 训练模型
model.fit(X, y)

# 预测新数据
X_new = np.array([[6]])
y_new = model.predict(X_new)

print(y_new)  # [5.4]


[5.96864124]


设计多元线性回归完整代码（根据公式计算，不使用sklearn等可直接调用的包） 注意：根据公式，逆矩阵存在的情况下，才可对矩阵求逆。 可以通过linalg.det()来计算行列式。

In [5]:
import numpy as np

class LinearRegression:
    def __init__(self, learning_rate=0.01, num_iterations=1000):
        self.learning_rate = learning_rate
        self.num_iterations = num_iterations
        self.weights = None
        self.bias = None
    
    def fit(self, X, y):
        num_samples, num_features = X.shape
        self.weights = np.zeros(num_features)
        self.bias = 0
        
        for i in range(self.num_iterations):
            y_predicted = np.dot(X, self.weights) + self.bias
            
            # compute gradients
            dw = (1/num_samples) * np.dot(X.T, (y_predicted - y))
            db = (1/num_samples) * np.sum(y_predicted - y)
            
            # update parameters
            self.weights -= self.learning_rate * dw
            self.bias -= self.learning_rate * db
            
            # check if matrix is invertible
            if np.abs(np.linalg.det(np.dot(X.T, X))) < 1e-8:
                raise ValueError("The matrix X^T*X is singular and cannot be inverted.")
            
            # update parameters using closed-form solution
            self.weights = np.dot(np.dot(np.linalg.inv(np.dot(X.T, X)), X.T), y)
    
    def predict(self, X):
        y_predicted = np.dot(X, self.weights) + self.bias
        return y_predicted


这个类有两个方法：

__init__: 构造方法，初始化模型的参数（权重）。
fit: 训练模型，使用正规方程来计算模型的参数（权重）。
predict: 预测新数据的输出值，使用模型的参数（权重）来计算预测值。
其中，fit 方法的实现使用了正规方程来计算模型的参数。需要注意的是，在使用正规方程计算模型参数时，需要对矩阵求逆，因此需要先判断矩阵是否可逆。如果矩阵不可逆，则会抛出一个 ValueError 异常。

predict 方法的实现也非常简单，只需要使用模型的参数来计算预测值即可。

使用该类时，可以按照以下步骤进行：

准备数据。将特征数据 X 和输出数据 y 分别存储为 NumPy 数组。
- 创建一个 LinearRegression 类的实例。
- 使用 fit 方法来训练模型，传入特征数据 X 和输出数据 y。
- 使用 predict 方法来预测新数据的输出值，传入特征数据 X_new。

In [7]:
# 不可逆矩阵，抛出异常
X = np.array([[1, 2], [2, 4], [3, 6], [4, 8]])
y = np.array([3, 6, 9, 12])

model = LinearRegression()
model.fit(X, y)


ValueError: The matrix X^T*X is singular and cannot be inverted.

In [8]:
# 可逆矩阵，成功执行
X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 10]])
y = np.array([4, 5, 7])

model = LinearRegression()
model.fit(X, y)

y_pred = model.predict(X)
print("Predicted values:", y_pred)


Predicted values: [4.00000233 5.00000233 7.00000233]


岭回归实现 

In [2]:
# ridege模型
def train_and_predict(X_train, y_train, X_test, alpha):
    # 添加一列全为1的常数项
    X_train = np.hstack((X_train, np.ones((X_train.shape[0], 1))))
    X_test = np.hstack((X_test, np.ones((X_test.shape[0], 1))))

    # 计算回归系数
    XTX = np.dot(X_train.T, X_train)
    ridge = np.dot(np.linalg.inv(XTX + alpha * np.identity(X_train.shape[1])), X_train.T)
    w = np.dot(ridge, y_train)

    # 预测测试集
    y_pred = np.dot(X_test, w)
    return y_pred