In [2]:
import random

import pandas as pd
import numpy as np

In [3]:
df = pd.read_csv("Housing.csv")

In [4]:
def cost(y: np.array, h: np.array) -> float:
    return np.mean((h - y) ** 2) / 2

In [5]:
class LinearRegressionM:
    def __init__(
        self, lr: float = 0.001, thr: float = 0.00001, n_epochs: int = 1000
    ) -> None:
        self.lr = lr
        self.thr = thr
        self.n_epochs = n_epochs
        self.w = np.array(
            [random.uniform(-5, 5), random.uniform(-5, 5), random.uniform(-5, 5)]
        )
        print(f"Init w: {self.w}")

    def predict(self, X: list) -> list:
        return self.w @ X.T

    def update_w(self, X: np.array, y: np.array):
        m = len(y)
        h = self.predict(X)
        self.w -= self.lr / m * X.T @ (h - y)

    def fit(self, X: np.array, y: np.array):
        last_cost = 1000000
        for i in range(self.n_epochs):
            self.update_w(X, y)
            new_cost = cost(y, self.predict(X))
            if last_cost - new_cost < self.thr:
                print(
                    f"Ітерація # {i}, ваги: {self.w}, мінімальне значення cost функції: {new_cost}"
                )
                break
            last_cost = new_cost

In [6]:
def normalization(data):
    mean = np.mean(data)
    value_range = np.max(data) - np.min(data)
    result = []
    for x in data:
        norm_x = (x - mean) / value_range
        result.append(norm_x)
    return result

In [7]:
norm_df = pd.DataFrame()
norm_df["price"] = normalization(df.price)
norm_df["area"] = normalization(df.area)
norm_df["bedrooms"] = normalization(df.bedrooms)
norm_df["bathrooms"] = normalization(df.bathrooms)

In [8]:
X = np.array([norm_df.area, norm_df.bedrooms, norm_df.bathrooms]).T
y = np.array(norm_df.price)

In [9]:
linear_regression = LinearRegressionM(lr=0.05, thr=0.0001, n_epochs=10000)
linear_regression.fit(X, y)

Init w: [ 2.21884474 -0.70960542  4.89096109]
Ітерація # 740, ваги: [ 1.0063584  -0.93275064  2.09957842], мінімальне значення cost функції: 0.05025227552715438


In [10]:
# Аналітичне рішення
def h(X, W):
    return np.dot(X, W)

In [11]:
def loss_function(X, Y, W):
    m = X.shape[0]
    return np.square(h(X, W) - Y).sum() / (2 * m)

In [12]:
weights = linear_regression.w
analytical = loss_function(X, y, weights)
print(f"Значення cost/loss функції при аналітичному рішенні: {analytical}")


Значення cost/loss функції при аналітичному рішенні: 0.05025227552715438
