***ЛИНЕЙНАЯ РЕГРЕССИЯ***

**Создание класса модели**

In [103]:
class LinearCustomRegression:
    def __init__(self, learning_rate=0.005, iterations=1000, tolerance=0.0001):
        self.learning_rate = learning_rate
        self.iterations = iterations
        self.coef = None
        self.intercept = 1
        self.tolerance = tolerance
        
    def fit(self, X, y):
        
        num_objects = X.shape[0]
        num_features = X.shape[1]
        self.coef = np.zeros(num_features)
        

        MSE_start = 0
        for iter in range(self.iterations):
            y_pred = X@self.coef + self.intercept
            #SGD, тут берем производные по сути, чтобы найти минимум,  
            #tolerance - это минимальный шаг на итерации, когда поиск прекращается (обучение считается завершенным)
            dc = -2/num_objects * X.T@(y - y_pred)
            di = -2/num_objects * np.sum(y - y_pred)
            self.coef -= self.learning_rate * dc
            self.intercept -= self.learning_rate * di
            MSE_new = np.mean((y-y_pred) ** 2)
            if abs(MSE_start - MSE_new) <= self.tolerance:
                break
            MSE_start = MSE_new
        
    def predict(self, X):
        
        return X@self.coef + self.intercept

    def metrics(self, X, y):
        y_pred = self.predict(X)
        RMSE = np.sqrt(np.mean((y-y_pred) ** 2))
        return RMSE
        

    

**Тестируем кастомную модель на рандомном массиве**

In [106]:
import numpy as np

np.random.seed(100)
X = np.random.rand(1000, 10)  # 1000 объектов, 10 признаков
y = np.random.rand(1000, )

model = LinearCustomRegression()
model.fit(X, y)

y_pred = model.predict(X)

RMSE = model.metrics(X, y)

print(f"RMSE: {RMSE}")


print(f"Coef: {model.coef}")
print(f"Intercept: {model.intercept}")

RMSE: 0.3004711239191234
Coef: [-0.06308777 -0.06400307 -0.06521246 -0.06707375 -0.06783112 -0.06347508
 -0.06101139 -0.06697858 -0.06619375 -0.07008668]
Intercept: 0.865202723348752


**Тестируем модель из sklearn на том же массиве**

In [109]:
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
lin_reg_model = LinearRegression()
lin_reg_model.fit(X, y)
y_pred1 = lin_reg_model.predict(X)

print(f"RMSE: {np.sqrt(mean_squared_error(y, y_pred1))}")

print(f"Coef: {lin_reg_model.coef_}")
print(f"Intercept: {lin_reg_model.intercept_}")


RMSE: 0.2929759340971125
Coef: [-0.04304652  0.00479076 -0.00382972  0.00102137 -0.05827354  0.0217721
  0.04604553 -0.0333535  -0.05701304 -0.083764  ]
Intercept: 0.6000885339151881


***ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ***