# 基础练习1：从零实现线性回归

## 练习目标

不使用任何机器学习库（如scikit-learn），从零实现线性回归算法，包括：
1. 梯度下降优化
2. 预测功能
3. 评估指标计算

## 练习要求

### 1. 实现LinearRegression类

创建一个`LinearRegression`类，包含以下方法：
- `__init__(self, learning_rate=0.01, max_iter=1000, tol=1e-6)`
- `fit(self, X, y)` - 训练模型，使用梯度下降优化参数
- `predict(self, X)` - 预测新数据的目标值
- `score(self, X, y)` - 计算R²分数

### 2. 核心算法

**梯度下降更新规则**：
- 计算预测值：$h = Xw + b$
- 计算损失：$J = \frac{1}{2m}\sum(h - y)^2$
- 计算梯度：
  - $\frac{\partial J}{\partial w} = \frac{1}{m}X^T(h - y)$
  - $\frac{\partial J}{\partial b} = \frac{1}{m}\sum(h - y)$
- 更新参数：
  - $w := w - \alpha \frac{\partial J}{\partial w}$
  - $b := b - \alpha \frac{\partial J}{\partial b}$


## 第一步：导入库


In [None]:
# 导入必要的库
import numpy as np
import matplotlib.pyplot as plt

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei', 'Arial Unicode MS', 'DejaVu Sans']
plt.rcParams['axes.unicode_minus'] = False

# 设置随机种子
np.random.seed(42)

# 设置matplotlib在notebook中内联显示
%matplotlib inline

print("环境准备完成！")


## 第二步：实现LinearRegression类

**你的任务**：实现LinearRegression类，使用梯度下降优化参数。

**提示**：
1. 初始化参数：权重w初始化为小的随机值，偏置b初始化为0
2. 在fit方法中实现梯度下降迭代
3. 记录损失函数历史，用于可视化
4. 实现predict和score方法


In [None]:
class LinearRegression:
    """从零实现的线性回归类"""
    
    def __init__(self, learning_rate=0.01, max_iter=1000, tol=1e-6):
        """
        初始化模型
        
        参数:
        - learning_rate: 学习率，控制每次更新的步长
        - max_iter: 最大迭代次数
        - tol: 收敛容差，当损失变化小于此值时停止
        """
        # TODO: 初始化参数
        # 提示：保存learning_rate、max_iter、tol
        # 初始化w、b、cost_history
        
        # 你的代码：
        pass
    
    def fit(self, X, y):
        """
        训练模型，使用梯度下降优化参数
        
        参数:
        - X: 特征矩阵 (m, n)，m是样本数，n是特征数
        - y: 目标向量 (m,)
        """
        # TODO: 实现梯度下降
        # 提示：
        # 1. 获取数据维度：m, n = X.shape
        # 2. 初始化参数：self.w = np.random.randn(n) * 0.01, self.b = 0
        # 3. 迭代更新：
        #    - 计算预测值：y_pred = X @ self.w + self.b
        #    - 计算损失：cost = (1/(2*m)) * np.sum((y_pred - y)**2)
        #    - 计算梯度：dw = (1/m) * X.T @ (y_pred - y), db = (1/m) * np.sum(y_pred - y)
        #    - 更新参数：self.w -= self.learning_rate * dw, self.b -= self.learning_rate * db
        #    - 检查收敛：如果损失变化小于tol，提前停止
        
        # 你的代码：
        pass
    
    def predict(self, X):
        """
        预测新数据的目标值
        
        参数:
        - X: 特征矩阵
        
        返回:
        - y_pred: 预测值
        """
        # TODO: 实现预测
        # 提示：y_pred = X @ self.w + self.b
        
        # 你的代码：
        pass
    
    def score(self, X, y):
        """
        计算R²分数
        
        参数:
        - X: 特征矩阵
        - y: 真实值
        
        返回:
        - r2: R²分数
        """
        # TODO: 实现R²计算
        # 提示：
        # R² = 1 - (SS_res / SS_tot)
        # SS_res = sum((y - y_pred)^2)
        # SS_tot = sum((y - y_mean)^2)
        
        # 你的代码：
        pass


## 第三步：测试你的实现

使用以下代码测试你的实现。


In [None]:
# 生成测试数据
# 真实关系：y = 2*x + 1 + 噪声
np.random.seed(42)
X = np.random.randn(100, 1) * 10
y = 2 * X.flatten() + 1 + np.random.randn(100) * 2

# 创建模型并训练
model = LinearRegression(learning_rate=0.01, max_iter=1000)
model.fit(X, y)

# 预测
y_pred = model.predict(X)

# 评估
r2 = model.score(X, y)
print(f"R²分数: {r2:.4f}")
print(f"学习到的参数: w={model.w[0]:.4f}, b={model.b:.4f}")
print(f"真实参数: w=2.0, b=1.0")

# 可视化结果
plt.figure(figsize=(12, 5))

# 左图：数据点和拟合直线
plt.subplot(1, 2, 1)
plt.scatter(X, y, alpha=0.5, label='数据点')
X_line = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)
y_line = model.predict(X_line)
plt.plot(X_line, y_line, 'r-', linewidth=2, 
         label=f'拟合直线: y={model.w[0]:.4f}x+{model.b:.4f}')
plt.xlabel('X')
plt.ylabel('y')
plt.title('线性回归结果')
plt.legend()
plt.grid(True, alpha=0.3)

# 右图：损失函数收敛过程
if hasattr(model, 'cost_history') and len(model.cost_history) > 0:
    plt.subplot(1, 2, 2)
    plt.plot(model.cost_history)
    plt.xlabel('迭代次数')
    plt.ylabel('损失')
    plt.title('损失函数收敛过程')
    plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# 预期结果检查
print("\n预期结果检查:")
print(f"  R²分数应该 > 0.9: {'✅' if r2 > 0.9 else '❌'}")
print(f"  学习到的w应该接近2.0: {'✅' if abs(model.w[0] - 2.0) < 0.5 else '❌'}")
print(f"  学习到的b应该接近1.0: {'✅' if abs(model.b - 1.0) < 0.5 else '❌'}")
