In [87]:
from Linear_regression import MatrixLinearRegression, LinearRegressionGD
from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression
import numpy as np

In [88]:
np.random.seed(42)
X = np.random.rand(100, 3)
true_weights = np.array([1.5, -2.0, 0.5, 4.0])
X_with_bias = np.insert(X, 0, 1, axis=1)
y = X_with_bias.dot(true_weights) + np.random.normal(0, 0.1, size=100)

# Разделение на обучающую и тестовую выборки
split_idx = int(0.8 * len(X))
X_train, X_test = X[:split_idx], X[split_idx:]
y_train, y_test = y[:split_idx], y[split_idx:]

Линейная регрессия матричным способом

In [89]:
model_matrix = MatrixLinearRegression()
model_matrix.fit(X_train, y_train)

print("Веса (Matrix):", model_matrix.weights)
print("Истинные веса:", true_weights)
y_pred = model_matrix.predict(X_test)
print("Среднеквадратичная ошибка (Matrix):", np.mean((y_pred - y_test) ** 2))


Веса (Matrix): [ 1.45332089 -1.95671185  0.49695144  4.06293814]
Истинные веса: [ 1.5 -2.   0.5  4. ]
Среднеквадратичная ошибка (Matrix): 0.007558370569461852


Линейная регрессия с градиентным спусокм

In [90]:
model_gd = LinearRegressionGD(lr=0.01, max_iter=10000)
model_gd.fit(X_train, y_train)

print("Веса (GD):", model_gd.weights)
print("Истинные веса:", true_weights)
y_pred_gd = model_gd.predict(X_test)
print("Среднеквадратичная ошибка (GD):", np.mean((y_pred_gd - y_test) ** 2))

Веса (GD): [ 1.45339131 -1.95677093  0.49692392  4.06288248]
Истинные веса: [ 1.5 -2.   0.5  4. ]
Среднеквадратичная ошибка (GD): 0.007557053912213974


Линейная регрессия scikit_learn

In [108]:
model_scikit = LinearRegression()
model_scikit.fit(X_train, y_train)

print("Веса (Scikit):", np.concatenate([model_scikit.intercept_.reshape(1,), model_scikit.coef_], axis=0))
print("Истинные веса:", true_weights)
y_pred_scikit = model_scikit.predict(X_test)
print("Среднеквадратичная ошибка (Scikit):", np.mean((y_pred_scikit - y_test) ** 2))

Веса (Scikit): [ 1.45332089 -1.95671185  0.49695144  4.06293814]
Истинные веса: [ 1.5 -2.   0.5  4. ]
Среднеквадратичная ошибка (Scikit): 0.007558370569461721


In [111]:
mse_matrix = np.mean((model_matrix.predict(X_test) - y_test) ** 2)
mse_gd = np.mean((model_gd.predict(X_test) - y_test) ** 2)
mse_scikit = np.mean((model_scikit.predict(X_test) - y_test) ** 2)
print(f"MSE (Matrix): {mse_matrix:.4f}, MSE (GD): {mse_gd:.4f}, MSE (Scikit): {mse_scikit:.4f}")

MSE (Matrix): 0.0076, MSE (GD): 0.0076, MSE (Scikit): 0.0076
