In [3]:
import numpy as np
from sklearn.metrics import mean_squared_error

In [4]:
# 训练数据的三元特征（房屋面积，房间数量，房屋年龄）
X_train = np.array([
    [50, 2, 10],   # 面积50平米，2个房间，10年房龄
    [80, 3, 8],    # 面积80平米，3个房间，8年房龄
    [100, 3, 15],  # 面积100平米，3个房间，15年房龄
    [120, 4, 15],  # 面积120平米，4个房间，15年房龄
    [150, 4, 20],  # 面积150平米，4个房间，20年房龄
    [90, 3, 12],   # 面积90平米，3个房间，12年房龄
    [110, 4, 7],   # 面积110平米，4个房间，7年房龄
    [130, 5, 3]    # 面积130平米，5个房间，3年房龄
])

# 对应的房价（单位：万元）
y_train = np.array([180, 240, 260, 300, 350, 280, 320, 360])

# 测试数据的三元特征（房屋面积，房间数量，房屋年龄）
X_test = np.array([
    [100, 3, 10],  # 100平米，3个房间，10年房龄
    [140, 4, 5]    # 140平米，4个房间，5年房龄
])

# 测试数据的房价（单位：万元）
y_test = np.array([290 , 395])

### 直接求导法

In [19]:
from sklearn.linear_model import LinearRegression

# 创建线性回归模型
model_direct = LinearRegression()

# 训练模型
model_direct.fit(X_train, y_train)

# 使用训练好的模型进行预测
y_pred = model_direct.predict(X_test)

# 输出预测的房价
print(y_pred)
# 查看斜率（系数）
print("斜率（特征的权重）：", model_direct.coef_)
# 查看截距
print("截距：", model_direct.intercept_)

mse = mean_squared_error(y_test, y_pred)
print(f"均方误差: {mse}")

[289.98331479 393.72080089]
斜率（特征的权重）： [  2.41156841 -14.61067853  -4.37708565]
截距： 136.4293659621803
均方误差: 0.8183143797149522


### 梯度下降法

In [6]:
from sklearn.linear_model import SGDRegressor
from sklearn.preprocessing import StandardScaler

# 归一化数据
scaler_X = StandardScaler()
scaler_y = StandardScaler()
X_normalized = scaler_X.fit_transform(X_train)
y_normalized = scaler_y.fit_transform(y_train.reshape(-1, 1)).reshape(-1)

# 创建线性回归模型
model = SGDRegressor(eta0=0.1, learning_rate='constant', penalty=None, max_iter=1000, tol=None, shuffle=False, power_t=0.5)

# 训练模型
model.fit(X_normalized, y_normalized, coef_init=[0,0,0], intercept_init=[0])

# 使用训练好的模型进行预测
y_pred = model.predict(scaler_X.transform(X_test))
y_pred = scaler_y.inverse_transform(y_pred.reshape(-1, 1)).reshape(-1)

# 输出预测的房价
print(y_pred)
# 查看斜率（系数）
print("斜率（特征的权重）：", model.coef_)
# 查看截距
print("截距：", model.intercept_)

mse = mean_squared_error(y_test, y_pred)
print(f"均方误差: {mse}")

[291.28199103 392.86700797]
斜率（特征的权重）： [ 1.25238738 -0.25284252 -0.39317288]
截距： [0.00784979]
均方误差: 3.096578010715778
