In [38]:
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler

In [39]:
# Завантажуемо наш CSV-файл з даними
data = pd.read_csv('Housing.csv')

In [48]:
# Виділяемо ознаки та цільову змінну
X = data[['area', 'bedrooms', 'bathrooms']]
y = data['price']

In [None]:
# Додаемо звільнену ознаку (intercept) до матриці ознак X
X.loc[:, 'intercept'] = 1

In [50]:
# Конвертуємо X та y в NumPy масиви
X = X.to_numpy()
y = y.to_numpy()

In [51]:
# Створюваем об'єкт нормалізатора
scaler = StandardScaler()

# Нормалізуемо ознаки, крім звільненої ознаки (intercept)
X[:, :-1] = scaler.fit_transform(X[:, :-1])

In [52]:
# Функція гіпотези лінійної регресії у векторному вигляді
def hypothesis(X, w):
    return np.dot(X, w)

In [53]:
# Функція для обчислення функції втрат у векторному вигляді (середньої квадратичної помилки)
def compute_cost(X, y, w):
    m = len(y)
    y_pred = hypothesis(X, w)
    cost = (1 / (2 * m)) * np.sum((y_pred - y) ** 2)
    return cost

In [54]:
# Реалізуемо один крок градієнтного спуску
def gradient_descent_step(X, y, w, learning_rate):
    m = len(y)
    y_pred = hypothesis(X, w)
    gradient = (1 / m) * np.dot(X.T, (y_pred - y))
    w -= learning_rate * gradient
    return w

In [59]:
# Гіперпараметри градієнтного спуску
learning_rate = 0.001
num_iterations = 1000

# Початкові значення параметрів w
w = np.zeros(X.shape[1])

# Градієнтний спуск
for i in range(num_iterations):
    w = gradient_descent_step(X, y, w, learning_rate)
    cost = compute_cost(X, y, w)
    print(f"Iteration {i+1}/{num_iterations}, Cost: {cost}")

Iteration 1/1000, Cost: 13078974890183.088
Iteration 2/1000, Cost: 13051098612209.09
Iteration 3/1000, Cost: 13023287378477.371
Iteration 4/1000, Cost: 12995541037083.7
Iteration 5/1000, Cost: 12967859436478.684
Iteration 6/1000, Cost: 12940242425466.932
Iteration 7/1000, Cost: 12912689853206.238
Iteration 8/1000, Cost: 12885201569206.75
Iteration 9/1000, Cost: 12857777423330.148
Iteration 10/1000, Cost: 12830417265788.816
Iteration 11/1000, Cost: 12803120947145.049
Iteration 12/1000, Cost: 12775888318310.191
Iteration 13/1000, Cost: 12748719230543.865
Iteration 14/1000, Cost: 12721613535453.129
Iteration 15/1000, Cost: 12694571084991.678
Iteration 16/1000, Cost: 12667591731459.027
Iteration 17/1000, Cost: 12640675327499.713
Iteration 18/1000, Cost: 12613821726102.48
Iteration 19/1000, Cost: 12587030780599.475
Iteration 20/1000, Cost: 12560302344665.451
Iteration 21/1000, Cost: 12533636272316.969
Iteration 22/1000, Cost: 12507032417911.584
Iteration 23/1000, Cost: 12480490636147.074
It

In [60]:
# Результати градієнтного спуску - оптимальні параметри w
optimal_w_gradient = w

# Пошук параметра w за допомогою аналітичного рішення
X_transpose = X.T
w_analytical = np.linalg.inv(X_transpose.dot(X)).dot(X_transpose).dot(y)

# Порівняння результатів
print("Optimal w (Gradient Descent):", optimal_w_gradient)
print("Optimal w (Analytical Solution):", w_analytical)

Optimal w (Gradient Descent): [ 581769.76786229  219903.3766946  1145193.19019102 2837055.98370502]
Optimal w (Analytical Solution): [ 839082.7656552   491180.49283573 1210983.66933953 4316380.34126579]
