Напишіть функцію гіпотези лінійної регресії у векторному вигляді

In [1]:
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression

In [2]:
def hypothesis(w, X):
    """
    w: вектор параметрів регресії (w0, w1, w2, ...)
    X: матриця ознак з розмірністю (m, n), де m - кількість прикладів, n - кількість ознак
    Повертає вектор прогнозованих значень
    """
    return np.dot(X, w)

Створіть функцію для обчислення функції втрат у векторному вигляді

In [3]:
def cost_func(w, X, y):
    """
    w: вектор параметрів регресії (w0, w1, w2, ...)
    X: матриця ознак з розмірністю (m, n), де m - кількість прикладів, n - кількість ознак
    y: вектор цільових значень розмірністю (m, 1), де m - кількість прикладів
    Повертає значення функції втрат (середньоквадратична помилка)
    """
    m = len(y)
    h = hypothesis(w, X)
    error = h - y
    return np.sum(error ** 2) / (2 * m)

Реалізуйте один крок градієнтного спуску

In [4]:
def gradient_descent_step(w, X, y, learning_rate):
    """
    w: вектор параметрів регресії (w0, w1, w2, ...)
    X: матриця ознак з розмірністю (m, n), де m - кількість прикладів, n - кількість ознак
    y: вектор цільових значень розмірністю (m, 1), де m - кількість прикладів
    learning_rate: коефіцієнт навчання (learning rate)
    Повертає оновлений вектор параметрів регресії після одного кроку градієнтного спуску
    """
    m = len(y)
    h = hypothesis(w, X)
    error = h - y
    gradient = np.dot(X.T, error) / m
    w = w - learning_rate * gradient
    return w

Знайдіть найкращі параметри $\vec{w}$ для датасету прогнозуючу ціну на будинок залежно від площі, кількості ванних кімнат та кількості спалень

In [5]:
url = "https://drive.google.com/file/d/1-rAa4XT4_fI0dOBlMNuE6a7jB0wln_Qo/view"
url = "https://drive.google.com/uc?id=" + url.split("/")[-2]
df = pd.read_csv(url)
df.info()
df.head()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 545 entries, 0 to 544
Data columns (total 13 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   price             545 non-null    int64 
 1   area              545 non-null    int64 
 2   bedrooms          545 non-null    int64 
 3   bathrooms         545 non-null    int64 
 4   stories           545 non-null    int64 
 5   mainroad          545 non-null    object
 6   guestroom         545 non-null    object
 7   basement          545 non-null    object
 8   hotwaterheating   545 non-null    object
 9   airconditioning   545 non-null    object
 10  parking           545 non-null    int64 
 11  prefarea          545 non-null    object
 12  furnishingstatus  545 non-null    object
dtypes: int64(6), object(7)
memory usage: 55.5+ KB


Unnamed: 0,price,area,bedrooms,bathrooms,stories,mainroad,guestroom,basement,hotwaterheating,airconditioning,parking,prefarea,furnishingstatus
0,13300000,7420,4,2,3,yes,no,no,no,yes,2,yes,furnished
1,12250000,8960,4,4,4,yes,no,no,no,yes,3,no,furnished
2,12250000,9960,3,2,2,yes,no,yes,no,no,2,yes,semi-furnished
3,12215000,7500,4,2,2,yes,no,yes,no,yes,3,yes,furnished
4,11410000,7420,4,1,2,yes,yes,yes,no,yes,2,no,furnished


In [6]:
features = ['area', 'bathrooms', 'bedrooms',]
target = 'price'
X = df[features]
y = df[target]

model = LinearRegression()
model.fit(X, y)

print(f'Intercept from scikit-learn: {model.intercept_}')
print(f'Coefficients from scikit-learn: {model.coef_}')

Intercept from scikit-learn: -173171.60763263796
Coefficients from scikit-learn: [3.78762754e+02 1.38604950e+06 4.06820034e+05]


Знайдіть ці ж параметри за допомогою аналітичного рішення

In [7]:
X = np.hstack((np.ones((X.shape[0], 1)), X))

w = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y)

print(f'Intercept from normal equation: {w[0]}')
print(f'Coefficients from normal equation: {w[1:]}')

Intercept from normal equation: -173171.60763262442
Coefficients from normal equation: [3.78762754e+02 1.38604950e+06 4.06820034e+05]


Порівняйте отримані результати

Як можна побачити з результатів вищенаведених розрахунків, значення параметрів $\vec{w}$ отримані за допомогою scikit-learn повністю співпадають зі значеннями цих же параметрів отриманих в результаті аналітичного рішення.