In [3]:
import numpy as np
import pandas as pd

def hypothesis(X, theta):

    return np.dot(X, theta)
def compute_loss(X, y, theta):
    m = len(y)
    return (1 / (2 * m)) * np.sum((hypothesis(X, theta) - y) ** 2)
def gradient_descent_step(X, y, theta, learning_rate):
    m = len(y)
    gradients = (1 / m) * np.dot(X.T, hypothesis(X, theta) - y)
    theta = theta - learning_rate * gradients
    return theta


data = pd.read_csv('housing.csv')
X = data[['area', 'bathrooms', 'bedrooms']].values
y = data['price'].values

X = (X - X.mean(axis=0)) / X.std(axis=0)
X = np.hstack((np.ones((X.shape[0], 1)), X))

theta = np.zeros(X.shape[1])
learning_rate = 0.01
num_iterations = 1000

for _ in range(num_iterations):
    theta = gradient_descent_step(X, y, theta, learning_rate)

print("Найкращі параметри (вектор w) за допомогою градієнтного спуску:", theta)
theta_analytical = np.linalg.inv(X.T @ X) @ X.T @ y
print("Найкращі параметри (вектор w) за допомогою аналітичного рішення:", theta_analytical)
comparison = pd.DataFrame({
    'Gradient Descent': theta,
    'Analytical Solution': theta_analytical
})
print(comparison)


Найкращі параметри (вектор w) за допомогою градієнтного спуску: [4766523.46205873  821199.26709864  695515.99623791  300296.28560637]
Найкращі параметри (вектор w) за допомогою аналітичного рішення: [4766729.24770642  821214.14349519  695808.52272537  299983.57107963]
   Gradient Descent  Analytical Solution
0      4.766523e+06         4.766729e+06
1      8.211993e+05         8.212141e+05
2      6.955160e+05         6.958085e+05
3      3.002963e+05         2.999836e+05
