In [None]:
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler

data = pd.read_csv('/content/Housing.csv')
X = data[['area', 'bathrooms', 'bedrooms']].values
y = data['price'].values


In [None]:
def gipotesa(X, w):
    return X @ w

In [None]:
def loss_func(X, y, w):
    m = len(y)
    predictions = gipotesa(X, w)
    return (1 / (2 * m)) * np.sum((predictions - y) ** 2)

In [None]:
def gradient_descent_step(X, y, w, learning_rate):
    m = len(y)
    predictions = gipotesa(X, w)
    gradient = (1 / m) * X.T @ (predictions - y)
    w = w - learning_rate * gradient
    return w

In [None]:
def train_linear_regression(X, y, learning_rate=0.01, num_iterations=1000):
    w = np.zeros(X.shape[1])
    for _ in range(num_iterations):
        w = gradient_descent_step(X, y, w, learning_rate)
    return w

In [None]:
def analytical_solution(X, y):
    return np.linalg.inv(X.T @ X) @ X.T @ y

In [None]:
def sklearn_solution(X, y):
    model = LinearRegression().fit(X, y)
    return model.coef_, model.intercept_

In [None]:
scaler = StandardScaler()
X = scaler.fit_transform(X)

X = np.hstack([np.ones((X.shape[0], 1)), X])

In [None]:
"""
обучение
"""
w_gradient_descent = train_linear_regression(X, y)
w_analytical = analytical_solution(X, y)
coef_sklearn, intercept_sklearn = sklearn_solution(X[:, 1:], y)  # убираю столбик единиц

"""
прогнозирвание для сравнения
"""
y_pred_gradient_descent = gipotesa(X, w_gradient_descent)
y_pred_analytical = gipotesa(X, w_analytical)

"""
делаем коэфициенты удобными для X
"""
coef_sklearn_full = np.hstack(([intercept_sklearn], coef_sklearn))

y_pred_sklearn = gipotesa(X, coef_sklearn_full)

"""
результаты
"""
print("Градієнтний спуск:", w_gradient_descent)
print("Аналітичне рішення:", w_analytical)
print("Sklearn:", coef_sklearn, intercept_sklearn)

"""
среднеквадратическая ошибка для каждого метода
"""
mse_gradient_descent = loss_func(X, y, w_gradient_descent)
mse_analytical = loss_func(X, y, w_analytical)
mse_sklearn = np.mean((y - y_pred_sklearn) ** 2) / 2

print("MSE Градієнтний спуск:", mse_gradient_descent)
print("MSE Аналітичне рішення:", mse_analytical)
print("MSE Sklearn:", mse_sklearn)

Градієнтний спуск: [4766523.46205873  821199.26709864  695515.99623791  300296.28560637]
Аналітичне рішення: [4766729.24770642  821214.14349519  695808.52272538  299983.57107963]
Sklearn: [821214.14349519 695808.52272537 299983.57107963] 4766729.247706422
MSE Градієнтний спуск: 895585103885.1151
MSE Аналітичне рішення: 895585024988.6597
MSE Sklearn: 895585024988.6597
