In [1]:
from sklearn.datasets import make_regression
import pandas as pd 
import numpy as np 

In [2]:
a = np.array([[3, 2, 1, 4],
              [4, 1, 3, 1]])
b = np.array([[2, 3],
             [4, 2],
             [1, 8],
             [8, 21]])

In [3]:
a.T.shape

(4, 2)

In [4]:
b.T.shape

(2, 4)

In [5]:
np.dot(a.T, b.T)

array([[ 18,  20,  35, 108],
       [  7,  10,  10,  37],
       [ 11,  10,  25,  71],
       [ 11,  18,  12,  53]])

In [6]:
a @ b

array([[ 47, 105],
       [ 23,  59]])

In [11]:
X, y = make_regression(n_samples=200, n_features=3, n_informative=2, noise=15, random_state=42)
X = pd.DataFrame(X, columns=['f_1', 'f_2', 'f_3'])
y = pd.Series(y)

In [17]:
X_cop = X.copy()

In [19]:
X_cop.insert(0, 'base', 1)

In [21]:
X_cop

Unnamed: 0,base,f_1,f_2,f_3
0,1,0.328751,-0.529760,0.513267
1,1,0.307300,0.812862,0.629629
2,1,-0.269407,0.717542,1.502357
3,1,0.821903,0.087047,-0.299007
4,1,1.167782,0.254421,0.337603
...,...,...,...,...
195,1,0.595157,-0.818221,2.092387
196,1,0.504047,-0.530258,-0.792873
197,1,1.644968,-0.249036,0.576557
198,1,0.196861,0.738467,0.171368


# Тут нужно написать класс MyLineReg:
    - реализоать в нем метод .fit()
    - метод .get_coef(), который вернет веса начина c 1го элемента

In [61]:
class MyLineReg():
    def __init__(self, n_iter=100, learning_rate=0.1, weights=None):
        self.n_iter = n_iter
        self.learning_rate = learning_rate
        self.weights = weights

    def __str__(self):
        return f'MyLineReg class: n_iter={self.n_iter}, learning_rate={self.learning_rate}'

    def fit(self, X: pd.DataFrame, y:pd.Series, verbose=False):
        X_copy = X.copy()               # создадим копию нашей матрицы фичей, что бы не изменить изначальный
        X_copy.insert(0, 'base', 1)     # допишем слева столбик из 1 для свободного члела
        w = np.ones(X_copy.shape[1])    # составим вектор весов, заполненный из 1

        if verbose:                   # Напишем подсчет ошибки до начала обучения
            initial_MSE = np.mean((np.dot(X_copy, w) - y)**2)
            print(f'start | loss: {initial_MSE}')
            
        for i in range(self.n_iter): # Напишем цикл обучения
            pred = np.dot(X_copy, w) # cчитаем предасказания модели 
            error = pred - y         # вычисляем ошибку (предсказания - реальные значения)
            grad = (2/len(X_copy)) * np.dot(error, X_copy) # вычисляем градиенты по весам
            w -= self.learning_rate * grad  # обновляем веса 

            if verbose and i % 10 == 0:     # выводим логи 
                loss = np.mean(error)
                print(f'Iteration {i}| loss: {loss}')
        # сохроняем веса
        self.weights = w 
    
    def get_coef(self):
        return self.weights[1:] # метод для вывода весов начиная с 1го заначения
    

In [43]:
model = MyLineReg()

In [45]:
print(model)

MyLineReg class: n_iter=100, learning_rate=0.1


In [47]:
model.fit(X, y, verbose=True)

start | loss: 5868.04603582669
Iteration 0| loss: 9.958602820782085
Iteration 10| loss: -1.3254208148640236
Iteration 20| loss: -0.3621184292335951
Iteration 30| loss: -0.06203692566133995
Iteration 40| loss: -0.009367129238470256
Iteration 50| loss: -0.001339690684719912
Iteration 60| loss: -0.0001854160559516771
Iteration 70| loss: -2.491243532077192e-05
Iteration 80| loss: -3.2234734417357915e-06
Iteration 90| loss: -3.9296822066603456e-07


In [49]:
model

<__main__.MyLineReg at 0x1836a25f890>

In [51]:
model.get_coef()

array([23.14698577, 71.75896172, -1.2073461 ])

In [59]:
model.weights

array([ 0.14916853, 23.14698577, 71.75896172, -1.2073461 ])

In [None]:
print(f'MSE {np.mean((X)**2)}')