In [109]:
import pandas as pd
import numpy as np

In [110]:
def h(X, w):
    return np.dot(X, w)    # Матричне множення Х на вектор ваг

In [111]:
def loss_function(X, y, w):
    return np.square(h(X, w) - y).sum() / (2 * len(X))    # квадрат рiзницi мiж пронозами та фактичними значеннями

In [112]:
def gradient_step(X, y, w, learning_rate):
    m = len(y)    # розмiр вибiрки
    grad = (X.T @ (h(X, w) - y)) / m   #  формула градiєнта для лiнiйної регресiї
    w -= learning_rate * grad    # оновлення ваг
    return w

In [113]:
def gradient(X, y, learning_rate, num_iter, eps):
    ones = np.ones((X.shape[0], 1))
    X = np.hstack((ones, X))

    w = np.zeros(X.shape[1])    # вектор нульових ваг

    loss = loss_function(X, y, w)
    loss_history = [loss]    # icторiя втрат

    for _ in range(num_iter):
        w = gradient_step(X, y, w, learning_rate)

        loss = loss_function(X, y, w)
        if abs(loss - loss_history[-1]) < eps:
            loss_history.append(loss)
            break

        loss_history.append(loss)

    return w, loss_history

In [114]:
df = pd.read_csv("Housing.csv")
norm = df.copy()    # датафрейм для нормалiзацiї
columns = ['price', 'area', 'bedrooms', 'bathrooms']
for column in columns[1:]:
    norm[column] = (df[column] - df[column].mean()) / df[column].std()    # нормалiзацiя(значення - середнє / стандартне вiдхилення) 


X = norm[['area', 'bedrooms', 'bathrooms']].values    # матриця нормалiзованних факторiв
y = norm['price'].values

learning_rate = 0.001
num_iter = 100000    # максимум в iтерацiях 
eps = 1e-12    # рiзниця в значеннях 

# формула градiєнту
w_gradient, loss_history = gradient(X, y, learning_rate, num_iter, eps)
print('Gradient Descent - w:', w_gradient)

# аналiтична формула
ones = np.ones((X.shape[0], 1))
X = np.hstack((ones, X))
w_analytical = np.linalg.pinv(X.T @ X) @ X.T @ y   
print('Analytical Solution - Optimal w:', w_analytical)

Gradient Descent - w: [4766729.23596627  821968.67551979  300259.83239246  696447.05416246]
Analytical Solution - Optimal w: [4766729.24770642  821968.58935343  300259.16468032  696447.75898579]
