In [1]:
import numpy as np
from sklearn.model_selection import train_test_split

# Функція гіпотези лінійної регресії
def hypothesis(X, w):
    return np.dot(X, w)

# Функція обчислення функції втрат
def compute_cost(X, y, w):
    m = len(y)
    h = hypothesis(X, w)
    return (1/(2*m)) * np.dot((h - y).T, (h - y))

# Один крок градієнтного спуску
def gradient_descent_step(X, y, w, learning_rate):
    m = len(y)
    h = hypothesis(X, w)
    gradient = (1/m) * np.dot(X.T, (h - y))
    w = w - learning_rate * gradient
    return w

# Знайдення параметрів за допомогою градієнтного спуску
def train_linear_regression(X, y, learning_rate=0.01, num_iterations=1000):
    m, n = X.shape
    w = np.zeros(n)
    for i in range(num_iterations):
        w = gradient_descent_step(X, y, w, learning_rate)
        if i % 100 == 0:
            cost = compute_cost(X, y, w)
            print(f"Iteration {i}: Cost {cost}")
    return w

# Знайдення параметрів за допомогою аналітичного рішення
def normal_equation(X, y):
    return np.linalg.inv(X.T @ X) @ X.T @ y

# Генеруємо дані для прикладу
np.random.seed(42)
X = 2 * np.random.rand(100, 3)  # Площа, кількість ванних кімнат, кількість спалень
y = 4 + 3 * X[:, 0] + 2 * X[:, 1] + X[:, 2] + np.random.randn(100)

# Додаємо стовпець одиниць для перехоплення
X_b = np.c_[np.ones((100, 1)), X]

# Розділяємо дані на тренувальні та тестові набори
X_train, X_test, y_train, y_test = train_test_split(X_b, y, test_size=0.2, random_state=42)

# Навчання за допомогою градієнтного спуску
w_gd = train_linear_regression(X_train, y_train)

# Навчання за допомогою аналітичного рішення
w_ne = normal_equation(X_train, y_train)

print("Parameters from Gradient Descent:", w_gd)
print("Parameters from Normal Equation:", w_ne)

Iteration 0: Cost 48.70712873683291
Iteration 100: Cost 0.6009339361253098
Iteration 200: Cost 0.500666346041834
Iteration 300: Cost 0.4526432359651629
Iteration 400: Cost 0.4247779957164337
Iteration 500: Cost 0.40750186633800756
Iteration 600: Cost 0.39598520903126966
Iteration 700: Cost 0.387756874857662
Iteration 800: Cost 0.3815264917468388
Iteration 900: Cost 0.3765993580975837
Parameters from Gradient Descent: [3.25409614 3.24235198 2.15102683 1.59783892]
Parameters from Normal Equation: [3.91498956 3.05294884 1.962303   1.34302962]
