# 向量化实现

本笔记本展示了向量化实现与非向量化实现的性能对比，以及向量化在梯度下降中的应用。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import time
%matplotlib inline

## 1. 非向量化实现

In [None]:
def non_vectorized_implementation(X, theta):
    """
    非向量化实现的预测函数
    
    参数:
    X: 特征矩阵 (m, n)
    theta: 参数向量 (n, 1)
    
    返回:
    predictions: 预测值向量 (m, 1)
    """
    m = X.shape[0]  # 样本数量
    predictions = np.zeros((m, 1))  # 初始化预测值
    
    # 使用嵌套循环计算预测值
    for i in range(m):
        prediction = 0
        for j in range(X.shape[1]):
            prediction += X[i, j] * theta[j, 0]
        predictions[i, 0] = prediction
    
    return predictions

## 2. 向量化实现

In [None]:
def vectorized_implementation(X, theta):
    """
    向量化实现的预测函数
    
    参数:
    X: 特征矩阵 (m, n)
    theta: 参数向量 (n, 1)
    
    返回:
    predictions: 预测值向量 (m, 1)
    """
    # 使用矩阵乘法计算预测值
    return X.dot(theta)

## 3. 性能对比测试

In [None]:
def compare_performance():
    """
    比较向量化与非向量化实现的性能
    """
    # 生成大规模数据
    m = 10000  # 10000个样本
    n = 100    # 100个特征
    X = np.random.rand(m, n)
    theta = np.random.rand(n, 1)
    
    # 测试非向量化实现
    start_time = time.time()
    non_vectorized_result = non_vectorized_implementation(X, theta)
    non_vectorized_time = time.time() - start_time
    
    # 测试向量化实现
    start_time = time.time()
    vectorized_result = vectorized_implementation(X, theta)
    vectorized_time = time.time() - start_time
    
    # 计算速度提升
    speed_up = non_vectorized_time / vectorized_time
    
    # 验证结果一致性
    max_difference = np.max(np.abs(non_vectorized_result - vectorized_result))
    
    print(f"非向量化实现时间: {non_vectorized_time:.6f} 秒")
    print(f"向量化实现时间: {vectorized_time:.6f} 秒")
    print(f"向量化速度提升: {speed_up:.2f} 倍")
    print(f"结果最大差异: {max_difference:.10f}")

# 运行性能对比
compare_performance()

## 4. 向量化梯度下降实现

In [None]:
def vectorized_gradient_descent(X, y, theta, learning_rate, n_iterations):
    """
    向量化实现的梯度下降算法
    
    参数:
    X: 特征矩阵 (m, n+1)，包含偏置项
    y: 目标值向量 (m, 1)
    theta: 初始参数向量 (n+1, 1)
    learning_rate: 学习率
    n_iterations: 迭代次数
    
    返回:
    theta: 学习后的参数向量
    cost_history: 每次迭代的代价函数值
    """
    m = len(y)  # 样本数量
    cost_history = np.zeros(n_iterations)  # 记录代价函数历史
    
    for i in range(n_iterations):
        # 向量化计算梯度
        gradients = (1/m) * X.T.dot(X.dot(theta) - y)
        # 更新参数
        theta = theta - learning_rate * gradients
        # 计算并记录代价函数值
        cost_history[i] = (1/(2*m)) * np.sum(np.square(X.dot(theta) - y))
    
    return theta, cost_history

## 5. 向量化梯度下降示例

In [None]:
# 生成模拟数据
n_samples = 1000
n_features = 5
X = 2 * np.random.rand(n_samples, n_features)
true_theta = np.array([[5], [10], [15], [20], [25]])
y = X.dot(true_theta) + np.random.randn(n_samples, 1) * 0.1

# 添加偏置项
X_b = np.c_[np.ones((n_samples, 1)), X]

# 初始化参数
theta_initial = np.random.randn(n_features + 1, 1)

# 设置超参数
learning_rate = 0.01
n_iterations = 1000

# 使用向量化梯度下降训练模型
theta, cost_history = vectorized_gradient_descent(X_b, y, theta_initial, learning_rate, n_iterations)

# 打印结果
print("真实参数:")
print(true_theta.ravel())

print("\n学习到的参数:")
print(theta.ravel())

## 6. 可视化训练过程

In [None]:
plt.figure(figsize=(10, 6))
plt.plot(range(n_iterations), cost_history)
plt.xlabel('迭代次数')
plt.ylabel('代价函数值')
plt.title('向量化梯度下降训练过程')
plt.grid(True)
plt.show()

## 7. 向量化的优势总结

In [None]:
print("向量化实现的优势:")
print("1. 代码更简洁易读")
print("2. 执行速度显著提升（尤其是大规模数据）")
print("3. 减少了手动循环，降低了出错概率")
print("4. 充分利用了硬件加速（如GPU）")
print("5. 与数学公式的表达更加一致")