In [19]:
import numpy as np

In [20]:
# Функція гіпотези лінійної регресії у векторному вигляді
def h(w_0, w_1, x):
    theta = np.array([w_0, w_1])
    x_vector = np.array([1, x])
    return np.dot(theta, x_vector)

In [21]:
# Функція для обчислення функції втрат у векторному вигляді
def compute_cost(theta, X, y):
    m = len(y)
    predictions = np.dot(X, theta)
    cost = np.sum((predictions - y)**2) / (2 * m)
    return cost

In [22]:
# Oдин крок градієнтного спуску
def gradient_descent_step(theta, X, y, learning_rate):
    m = len(y)
    predictions = np.dot(X, theta)
    errors = predictions - y
    gradient = (1 / m) * np.dot(X.T, errors)
    new_theta = theta - learning_rate * gradient
    return new_theta
     


In [23]:
# Hайкращі параметри для датасету прогнозуючу ціну на будинок залежно від площі, кількості ванних кімнат та кількості спалень:
import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler

data = pd.read_csv('Housing.csv')

X = data[['area', 'bedrooms', 'bathrooms']]
y = data['price']

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

X_normalized = np.column_stack((np.ones(len(X_scaled)), X_scaled))

learning_rate = 0.001
num_iterations = 10000

def gradient_descent(X, y, learning_rate, num_iterations):
    m, n = X.shape
    w = np.random.rand(n)

    for _ in range(num_iterations):
        predictions = np.dot(X, w)
        errors = predictions - y
        gradient = (1 / m) * np.dot(X.T, errors)
        w -= learning_rate * gradient

    return w

optimal_w = gradient_descent(X_normalized, y, learning_rate, num_iterations)

In [24]:
# Аналітичне рішення
def analytical_solution(X, y):
    theta = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y)
    return theta

In [25]:
# Порівняння отриманих результатів
optimal_w_gradient = gradient_descent(X_normalized, y, learning_rate, num_iterations)
optimal_w_analytical = analytical_solution(X_normalized, y)

print("Optimal_w_gradient:", optimal_w_gradient)
print("Optimal_w_analytical:", optimal_w_analytical)

Optimal_w_gradient: [4766513.91863758  821197.96105075  300302.25304292  695511.07835548]
Optimal_w_analytical: [4766729.24770642  821214.14349519  299983.57107963  695808.52272538]
