Функція гіпотези лінійної регресії у векторному вигляді:   $h(\vec{x}) = \vec{w}\vec{x}$

Градієнт функції втрат:   $∇J(\vec{w}) = \frac{1}{m}X^T(X\vec{w} - \vec{y})$

Ітерація градієнтного спуску:   $\vec{w} = \vec{w}^{prew} - \frac{\alpha}{m}X^T(X\vec{w} - \vec{y})$

In [24]:
import pandas as pd

housing = pd.read_csv('Housing.csv')
housing.head()

Unnamed: 0,price,area,bedrooms,bathrooms,stories,mainroad,guestroom,basement,hotwaterheating,airconditioning,parking,prefarea,furnishingstatus
0,13300000,7420,4,2,3,yes,no,no,no,yes,2,yes,furnished
1,12250000,8960,4,4,4,yes,no,no,no,yes,3,no,furnished
2,12250000,9960,3,2,2,yes,no,yes,no,no,2,yes,semi-furnished
3,12215000,7500,4,2,2,yes,no,yes,no,yes,3,yes,furnished
4,11410000,7420,4,1,2,yes,yes,yes,no,yes,2,no,furnished


In [25]:
import numpy as np
import sklearn
from sklearn.linear_model import LinearRegression

house = housing.loc[:, ['area', 'bedrooms', 'bathrooms']]
regressor = LinearRegression().fit(house.values, housing['price'])
price = regressor.predict(np.array([[7420, 4, 2]]))
print(f"Прогнозована ціна: {price[0]:.2f} dollars.")

Прогнозована ціна: 7036627.15 dollars.


In [26]:
#Номалізація даних
houseN = house.loc[:, ["area", "bedrooms", "bathrooms"]]
houseN["area"]=(house["area"]-house["area"].mean())/house["area"].std()
houseN["bedrooms"]=(house["bedrooms"]-house["bedrooms"].mean())/house["bedrooms"].std()
houseN["bathrooms"]=(house["bathrooms"]-house["bathrooms"].mean())/house["bathrooms"].std()
ones = np.ones((545), dtype=int)
houseN["ones"] = ones
print(houseN)

         area  bedrooms  bathrooms  ones
0    1.045766  1.402131   1.420507     1
1    1.755397  1.402131   5.400847     1
2    2.216196  0.047235   1.420507     1
3    1.082630  1.402131   1.420507     1
4    1.045766  1.402131  -0.569663     1
..        ...       ...        ...   ...
540 -0.990968 -1.307661  -0.569663     1
541 -1.267448  0.047235  -0.569663     1
542 -0.705273 -1.307661  -0.569663     1
543 -1.032440  0.047235  -0.569663     1
544 -0.599289  0.047235  -0.569663     1

[545 rows x 4 columns]


In [27]:
def regression(data, weights, lmd):
    for i in range(25):
        weights = weights - lmd*np.dot(houseN.T, np.dot(houseN, weights) - housing['price'])/545
        
    area = (data[0]-house["area"].mean())/house["area"].std()
    bedrooms = (data[1]-house["bedrooms"].mean())/house["bedrooms"].std()
    bathrooms = (data[2]-house["bathrooms"].mean())/house["bathrooms"].std()

    h = area*weights[0]+bedrooms*weights[1]+bathrooms*weights[2]+weights[3]
    print(f"Прогнозована ціна: {h:.2f} dollars.")
    print(f'Найкращі параметри w для нормованих даних: {weights}')

    
house_data = [7420, 4, 2]   
initial_weights = [10, 10, 10, 10]
learning_speed = 1

regression(house_data, initial_weights, learning_speed)

Прогнозована ціна: 7036627.20 dollars.
Найкращі параметри w для нормованих даних: [ 821968.59826035  300259.17719431  696447.77192144 4766729.24770642]


Таким чином можна побачити, що розрахунок прогнозованої ціни будинку з однаковим набором параметрів після 25 ітерацій збігається з розрахованою ціною за допомогою пакету sklearn.

Аналітичне рішення:   $\vec{w}^* = (X^TX)^{-1}X^T\vec{y}$

In [28]:
w = np.dot(np.dot(np.linalg.inv(np.dot(houseN.T, houseN)), houseN.T), housing['price'])
print(w)

[ 821968.58935343  300259.16468032  696447.7589858  4766729.24770642]


Отже, з цього розрахунку видно, що вагові коефіцієнти, знайдені за допомогою ітераційного методу, є рівними ваговим коефіцієнтам, знайденим за допомогою аналітичного рішення.