In [29]:
import numpy as np

def hypothesis(w, X):
    """
    Compute the hypothesis function for linear regression.

    Parameters:
        w (numpy.array): Parameters vector of shape (n_features,).
        X (numpy.array): Input features matrix of shape (n_samples, n_features).

    Returns:
        numpy.array: Predictions vector of shape (n_samples,).
    """
    return np.dot(X, w)

In [30]:
def compute_cost(w, X, y):
    """
    Compute the cost function for linear regression.

    Parameters:
        w (numpy.array): Parameters vector of shape (n_features,).
        X (numpy.array): Input features matrix of shape (n_samples, n_features).
        y (numpy.array): Target values vector of shape (n_samples,).

    Returns:
        float: Value of the cost function.
    """
    m = len(y)
    predictions = hypothesis(w, X)
    squared_errors = (predictions - y) ** 2
    cost = (1 / (2 * m)) * np.sum(squared_errors)
    return cost

In [31]:
def gradient_descent_step(w, X, y, learning_rate):
    """
    Perform one step of gradient descent for linear regression.

    Parameters:
        w (numpy.array): Parameters vector of shape (n_features,).
        X (numpy.array): Input features matrix of shape (n_samples, n_features).
        y (numpy.array): Target values vector of shape (n_samples,).
        learning_rate (float): Learning rate or step size.

    Returns:
        numpy.array: Updated parameters vector.
    """
    m = len(y)
    predictions = hypothesis(w, X)
    errors = predictions - y
    gradient = (1 / m) * np.dot(X.T, errors)
    w -= learning_rate * gradient
    return w

In [33]:
import pandas as pd

data = pd.read_csv("Housing.csv")

X = data[['area', 'bedrooms', 'bathrooms']].values
y = data['price'].values

X = (X - X.mean(axis=0)) / X.std(axis=0)

X = np.c_[np.ones(X.shape[0]), X]

initial_w = np.zeros(X.shape[1])

num_iterations = 1000
learning_rate = 0.01

w = initial_w
for _ in range(num_iterations):
    w = gradient_descent_step(w, X, y, learning_rate)

print("Найкращі параметри, отримані за допомогою градієнтного спуску:")
print(w)

Найкращі параметри, отримані за допомогою градієнтного спуску:
[4766523.46205873  821199.26709864  300296.28560637  695515.99623791]


In [34]:
def normal_equation(X, y):
    """
    Compute the parameters using the normal equation.

    Parameters:
        X (numpy.array): Input features matrix of shape (n_samples, n_features).
        y (numpy.array): Target values vector of shape (n_samples,).

    Returns:
        numpy.array: Parameters vector.
    """
    return np.linalg.inv(X.T @ X) @ X.T @ y

w_analytical = normal_equation(X, y)

print("Найкращі параметри, отримані за допомогою аналітичного рішення:")
print(w_analytical)

Найкращі параметри, отримані за допомогою аналітичного рішення:
[4766729.24770642  821214.14349519  299983.57107963  695808.52272538]


In [35]:
print("Порівняння результатів:")
print("Градієнтний спуск:", w)
print("Аналітичний розв'язок:", w_analytical)

Порівняння результатів:
Градієнтний спуск: [4766523.46205873  821199.26709864  300296.28560637  695515.99623791]
Аналітичний розв'язок: [4766729.24770642  821214.14349519  299983.57107963  695808.52272538]
