### 1. Функція гіпотези лінійної регресії у векторному вигляді

In [1]:
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression


def h(w, x):
    return w[0] + w[1] * x

w = np.array([6, 2]) 
x = np.array([4, 7]) 
result = h(w, x)
print("Результат гіпотези:", result)

Результат гіпотези: [14 20]


### 2. Функція втрат у векторному вигляді (середньоквадратична функція)

In [2]:
def mean_squared_error(w, x, y):
    m = len(x)  
    predictions = h(w, x)  
    mse = np.sum((predictions - y)**2) / m
    return mse

x = np.array([4, 2, 7, 4, 15]) 
y = np.array([4, 2, 7, 4, 15]) 

w = np.array([0.0, 0.0])

loss = mean_squared_error(w, x, y)

print("Функція втрат MSE:", loss)

Функція втрат MSE: 62.0


### 3. Один крок градієнтного спуску

In [3]:
def gradient_descent_step(w, x, y, learning_rate):
    m = len(x)
    
    gradient_w0 = (1/m) * np.sum(h(w, x) - y)
    gradient_w1 = (1/m) * np.sum((h(w, x) - y) * x)
    
    w[0] -= learning_rate * gradient_w0
    w[1] -= learning_rate * gradient_w1

    return w


x = np.array([4, 2, 7, 4, 15]) 
y = np.array([4, 2, 7, 4, 15]) 

w = np.array([0.0, 0.0])

learning_rate = 0.08
w = gradient_descent_step(w, x, y, learning_rate)

print("Оновлені ваги:", w)

Оновлені ваги: [0.512 4.96 ]


### 4. Знаходження найкращих параметрів $\vec{w}$ для датасету прогнозуючу ціну на будинок залежно від площі, кількості ванних кімнат та кількості спалень за допомогою градієнтного спуску


In [4]:
data = pd.read_csv('Housing.csv')
data.head()

Unnamed: 0,price,area,bedrooms,bathrooms,stories,mainroad,guestroom,basement,hotwaterheating,airconditioning,parking,prefarea,furnishingstatus
0,13300000,7420,4,2,3,yes,no,no,no,yes,2,yes,furnished
1,12250000,8960,4,4,4,yes,no,no,no,yes,3,no,furnished
2,12250000,9960,3,2,2,yes,no,yes,no,no,2,yes,semi-furnished
3,12215000,7500,4,2,2,yes,no,yes,no,yes,3,yes,furnished
4,11410000,7420,4,1,2,yes,yes,yes,no,yes,2,no,furnished


In [5]:
X = data[['area', 'bedrooms', 'bathrooms']]
y = data['price']

model = LinearRegression()
model.fit(X, y)

w = model.coef_
w

array([3.78762754e+02, 4.06820034e+05, 1.38604950e+06])

### 5. Знаходження параметрів за допомогою аналітичного рішення

In [6]:
X = data[['area', 'bedrooms', 'bathrooms']]
y = data['price']

X = X.copy()
X['bias'] = 1

w1 = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y)
w1 = w1[:-1] 

w1

array([3.78762754e+02, 4.06820034e+05, 1.38604950e+06])