<a href="https://colab.research.google.com/github/Todmount/DICT_ML_Basics_Andrii_Lesniak/blob/PR7/Task_7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [61]:
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

In [155]:
x = np.array([4, 4.5, 5, 5.5, 6, 6.5, 7])
w = np.array([1, -3, 2, 5, 0, 3, 6])
z = np.array([11, 15, 12, 9, 18, 13, 16])
y = np.array([33, 42, 45, 51, 53, 61, 62])

# Власна реалізація лінійної регресії
class CustomLinearRegression:
    def __init__(self, *,fit_intercept=True):
        self.fit_intercept = fit_intercept
        self.coefficient = None
        self.intercept = None

    def fit(self, X, y):
        if self.fit_intercept:
            X = np.column_stack((np.ones(len(X)), X))

        X_transpose = np.transpose(X)
        self.coefficient = np.linalg.inv(X_transpose.dot(X)) @ X_transpose @ y

        if self.fit_intercept:
            self.intercept = self.coefficient[0]
            self.coefficient = self.coefficient[1:]

    def predict(self, X):
        if self.fit_intercept:
            X = np.column_stack((np.ones(len(X)), X))
        return X @ self.coefficient + self.intercept if self.fit_intercept else X @ self.coefficient



    def r2_score(self, y, yhat):
        mean_y = np.mean(y)
        total_sum_of_squares = np.sum((y - mean_y)**2)
        residual_sum_of_squares = np.sum((y - yhat)**2)
        r2 = 1 - residual_sum_of_squares / total_sum_of_squares
        return r2

    def rmse(self, y, yhat):
        return np.sqrt(np.mean((y - yhat)**2))

# Створення та навчання моделі
custom_model = CustomLinearRegression(fit_intercept=False)
X = np.column_stack((x, w, z))
custom_model.fit(X, y)

custom_y_pred = custom_model.predict(X)
custom_r2 = custom_model.r2_score(y, custom_y_pred)
custom_rmse = custom_model.rmse(y, custom_y_pred)

# Модель з sklearn
model = LinearRegression(fit_intercept=False)
model.fit(X, y)

y_pred = model.predict(X)
r2 = r2_score(y, y_pred)
rmse = np.sqrt(mean_squared_error(y, y_pred))

Вивід

In [156]:
np.set_printoptions(formatter={'float': '{: 0.5f}'.format})

# Власна реалізація
print("\n\033[1mВласна реалізація\033[0m")
print("Вагові коефіцієнти:".ljust(30), custom_model.coefficient)
print("Прогнозовані значення:".ljust(30), custom_y_pred)
print("R\u00B2:".ljust(30), custom_r2)
print("RMSE:".ljust(30), custom_rmse)

# sklearn
print("\n\033[1msklearn\033[0m")
print("Вагові коефіцієнти:".ljust(30), model.coef_)
print("Прогнозовані значення:".ljust(30), y_pred)
print("R\u00B2:".ljust(30), r2)
print("RMSE:".ljust(30), rmse)

# Порівняння
print('-' * 103)  # лінія-роздільник
percentage_match_coef = 100 * np.sum(np.isclose(custom_model.coefficient, model.coef_)) / len(y)
percentage_match_pred = 100 * np.sum(np.isclose(custom_y_pred, y_pred)) / len(y)
percentage_match_r2 = 100 * np.isclose(custom_r2, r2)
percentage_match_rmse = 100 * np.isclose(custom_rmse, rmse)
print(f"Співпадіння вагових коефіціентів : {percentage_match_coef:.2f}%")
print(f"Співпадіння прогнозованих значень: {percentage_match_pred:.2f}%")
print(f"Співпадіння R\u00B2: {percentage_match_r2:.2f}%")
print(f"Співпадіння RMSE: {percentage_match_rmse:.2f}%")


[1mВласна реалізація[0m
Вагові коефіцієнти:            [ 11.76588 -0.95080 -0.97753]
Прогнозовані значення:         [ 35.35993  41.13595  45.19749  51.16063  52.99981  60.91799  61.01597]
R²:                            0.9887132667167061
RMSE:                          1.0250940946197193

[1msklearn[0m
Вагові коефіцієнти:            [ 11.76588 -0.95080 -0.97753]
Прогнозовані значення:         [ 35.35993  41.13595  45.19749  51.16063  52.99981  60.91799  61.01597]
R²:                            0.9887132667167061
RMSE:                          1.0250940946197167
-------------------------------------------------------------------------------------------------------
Співпадіння вагових коефіціентів : 42.86%
Співпадіння прогнозованих значень: 100.00%
Співпадіння R²: 100.00%
Співпадіння RMSE: 100.00%
