# Дамошнє завдання №3

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

## Функція гіпотези лінійної регресії у векторному вигляді

In [2]:
def hypothesis(X, w):
    return np.dot(X, w)

## Функція для обчислення функції втрат у векторному вигляді (Mean Squared Error)

In [3]:
def compute_loss(X, y, w):
    m = len(y)
    predictions = hypothesis(X, w)
    loss = np.sum((predictions - y)**2) / (2 * m)
    return loss

## Реалізація одного кроку градієнтного спуску

In [4]:
def gradient_descent_step(X, y, w, learning_rate):
    m = len(y)
    predictions = hypothesis(X, w)
    errors = predictions - y
    gradient = np.dot(X.T, errors) / m
    w = w - learning_rate * gradient
    return w

## Знаходження найкращих параметрів w за допомогою градієнтного спуску

In [5]:
def gradient_descent(X, y, w, learning_rate, num_iterations):
    for i in range(num_iterations):
        w = gradient_descent_step(X, y, w, learning_rate)
        if i % 100 == 0:
            print(f'Iteration {i}, Loss: {compute_loss(X, y, w)}')
    return w

## Знаходження параметрів w за допомогою аналітичного рішення

In [6]:
def analytical_solution(X, y):
    w = np.linalg.inv(X.T @ X) @ X.T @ y
    return w

## Порівняння результатів

In [7]:
def compare_results(X, y, learning_rate, num_iterations):
    
    num_features = X.shape[1]
    w_initial = np.zeros((num_features, 1))

    w_gradient_descent = gradient_descent(X, y, w_initial, learning_rate, num_iterations)
    w_analytical_solution = analytical_solution(X, y)

    print(f'Parameters found by Gradient Descent: {w_gradient_descent}')
    print(f'Parameters found by Analytical Solution: {w_analytical_solution}')

    loss_gradient_descent = compute_loss(X, y, w_gradient_descent)
    loss_analytical_solution = compute_loss(X, y, w_analytical_solution)

    print(f'Loss (Gradient Descent): {loss_gradient_descent}')
    print(f'Loss (Analytical Solution): {loss_analytical_solution}')

## Реалізація задачі

In [8]:
from sklearn.preprocessing import StandardScaler

df = pd.read_csv('housing.csv')

print(df.head())

X = df[['area', 'bedrooms', 'bathrooms']].copy()  

scaler = StandardScaler()

# Виконання стандартизації для вибраних ознак
X_scaled = X[['area', 'bedrooms', 'bathrooms']].values
X_scaled = scaler.fit_transform(X_scaled)

# Додавання стовбця з одиницями для ваги w0
X_scaled = np.hstack((X_scaled, np.ones((X_scaled.shape[0], 1))))

y = df['price'].values.reshape(-1, 1)

num_iterations = 1
learning_rate = 0.01

compare_results(X_scaled, y, learning_rate, num_iterations)

      price  area  bedrooms  bathrooms  stories mainroad guestroom basement  \
0  13300000  7420         4          2        3      yes        no       no   
1  12250000  8960         4          4        4      yes        no       no   
2  12250000  9960         3          2        2      yes        no      yes   
3  12215000  7500         4          2        2      yes        no      yes   
4  11410000  7420         4          1        2      yes       yes      yes   

  hotwaterheating airconditioning  parking prefarea furnishingstatus  
0              no             yes        2      yes        furnished  
1              no             yes        3       no        furnished  
2              no              no        2      yes   semi-furnished  
3              no             yes        3      yes        furnished  
4              no             yes        2       no        furnished  
Iteration 0, Loss: 12856932767146.533
Parameters found by Gradient Descent: [[10016.30475873]
 [ 68

### Висновки:
З результатів видно, що градієнтний спуск має велику початкову втрату (Loss), і параметри, знайдені цим методом, значно відрізняються від параметрів, знайдених аналітичним розв'язком. Це може вказувати на те, що градієнтний спуск має труднощі у збіжності або може потребувати більше ітерацій для досягнення оптимальних параметрів.

У порівнянні із стандартним методом аналітичного розв'язку, де використовується матричний підхід, градієнтний спуск може бути менш ефективним, особливо для цього конкретного датасету та параметрів.