In [None]:
import numpy as np

def hypothesis(theta, X):
    """
    Функція гіпотези лінійної регресії у векторному вигляді
    
    Параметри:
    theta -- вектор параметрів моделі [θ₀, θ₁]
    X -- вхідний вектор або матриця, де кожен рядок є точкою даних
    
    Повертає:
    вектор прогнозованих значень
    """
    return np.dot(X, theta)

def cost_function(theta, X, y):
    """
    Функція втрат у векторному вигляді
    
    Параметри:
    theta -- вектор параметрів моделі [θ₀, θ₁]
    X -- вхідний вектор або матриця, де кожен рядок є точкою даних
    y -- вектор фактичних значень
    
    Повертає:
    значення функції втрат
    """
    m = len(y)  # кількість точок даних
    predictions = np.dot(X, theta)  # прогнозування
    sq_errors = (predictions - y) ** 2  # квадратичні помилки
    return 1 / (2 * m) * np.sum(sq_errors)  # середнє значення квадратичних помилок

def gradient_descent_step(theta, X, y, alpha):
    """
    Один крок градієнтного спуску
    
    Параметри:
    theta -- вектор параметрів моделі [θ₀, θ₁]
    X -- вхідний вектор або матриця, де кожен рядок є точкою даних
    y -- вектор фактичних значень
    alpha -- швидкість навчання (learning rate)
    
    Повертає:
    оновлений вектор параметрів моделі
    """
    m = len(y)  # кількість точок даних
    predictions = np.dot(X, theta)  # прогнозування
    error = predictions - y  # помилки прогнозування
    gradient = np.dot(X.T, error)  # градієнт функції втрат
    theta -= alpha * (1 / m) * gradient  # оновлення параметрів
    return theta



In [73]:
import numpy as np
import pandas as pd

# Завантаження датасету
df = pd.read_csv('C:\\Users\\IJHEA\\Documents\\Python\\HWDS-Rizun\\Housing.csv')

# Підготовка даних
X = df[['area', 'bathrooms', 'bedrooms']].values
y = df['price'].values

# Додавання одиниці для параметру w0 (константа)
X = np.hstack((np.ones((X.shape[0], 1)), X))

# Ініціалізація параметрів моделі
theta = np.zeros(X.shape[1])

# Функція втрат
def cost_function(X, y, theta):
    m = len(y)
    predictions = np.dot(X, theta)
    sq_errors = (predictions - y) ** 2
    return 1 / (2 * m) * np.sum(sq_errors)

# Градиєнтний спуск
def gradient_descent(X, y, theta, alpha, iterations):
    m = len(y)
    costs = []
    for _ in range(iterations):
        predictions = np.dot(X, theta)
        error = predictions - y
        gradient = np.dot(X.T, error)
        theta -= alpha * (1 / m) * gradient
        cost = cost_function(X, y, theta)
        costs.append(cost)
    return theta, costs

# Запуск градієнтного спуску
alpha = 0.01  # Швидкість навчання
iterations = 1500  # Кількість ітерацій
theta, costs = gradient_descent(X, y, theta, alpha, iterations)

# Виведення знайдених параметрів
print('Найкращі знайдені параметри:', theta)

Найкращі знайдені параметри: [nan nan nan nan]


  sq_errors = (predictions - y) ** 2
  theta -= alpha * (1 / m) * gradient


In [71]:
import numpy as np
import pandas as pd

# Завантаження датасету
df = pd.read_csv('C:\\Users\\IJHEA\\Documents\\Python\\HWDS-Rizun\\Housing.csv')

# Підготовка даних
X = df[['area', 'bathrooms', 'bedrooms']].values
y = df['price'].values

# Додавання одиниці для параметру w0 (константа)
X = np.hstack((np.ones((X.shape[0], 1)), X))

# Знаходження параметрів за допомогою МНК
XT_X = np.dot(X.T, X)
XT_X_inv = np.linalg.inv(XT_X)
XT_y = np.dot(X.T, y)
w = np.dot(XT_X_inv, XT_y)

# Виведення знайдених параметрів
print('Найкращі знайдені параметри МНК:', w)

Найкращі знайдені параметри МНК: [-1.73171608e+05  3.78762754e+02  1.38604950e+06  4.06820034e+05]


In [72]:
import numpy as np
import pandas as pd

# Завантаження датасету
df = pd.read_csv('C:\\Users\\IJHEA\\Documents\\Python\\HWDS-Rizun\\Housing.csv')

# Підготовка даних
X = df[['area', 'bathrooms', 'bedrooms']].values
y = df['price'].values

# Додавання одиниці для параметру w0 (константа)
X = np.hstack((np.ones((X.shape[0], 1)), X))

# Ініціалізація параметрів моделі
theta = np.zeros(X.shape[1])

# Функція втрат
def cost_function(X, y, theta):
    m = len(y)
    predictions = np.dot(X, theta)
    sq_errors = (predictions - y) ** 2
    return 1 / (2 * m) * np.sum(sq_errors)

# Градиєнтний спуск
def gradient_descent(X, y, theta, alpha, iterations):
    m = len(y)
    for _ in range(iterations):
        predictions = np.dot(X, theta)
        error = predictions - y
        gradient = np.dot(X.T, error)
        theta -= alpha * (1 / m) * gradient
    return theta

# Запуск градієнтного спуску
alpha = 0.01  # Швидкість навчання
iterations = 1500  # Кількість ітерацій
theta_gd = gradient_descent(X, y, theta, alpha, iterations)

# Виведення знайдених параметрів градієнтного спуску
print('Найкращі знайдені параметри градієнтного спуску:', theta_gd)

# Знаходження параметрів за допомогою МНК
XT_X = np.dot(X.T, X)
XT_X_inv = np.linalg.inv(XT_X)
XT_y = np.dot(X.T, y)
w_mnk = np.dot(XT_X_inv, XT_y)

# Виведення знайдених параметрів МНК
print('Найкращі знайдені параметри МНК:', w_mnk)

# Порівняння результатів
print('\nРізниця між параметрами градієнтного спуску та МНК:', theta_gd - w_mnk)

Найкращі знайдені параметри градієнтного спуску: [nan nan nan nan]
Найкращі знайдені параметри МНК: [-1.73171608e+05  3.78762754e+02  1.38604950e+06  4.06820034e+05]

Різниця між параметрами градієнтного спуску та МНК: [nan nan nan nan]


  theta -= alpha * (1 / m) * gradient
