In [10]:
import pandas as pd
import numpy as np

# Реализация линейной регрессии

In [18]:
def stochastic_gradient_descent(X, y, W_init, eta=1e-2, 
                                max_iter=1e4, min_weight_dist=1e-8,
                                seed=42, verbose=False):
    # Расстояние между векторами весов на соседних итерациях
    # инициализируется максимально большим числом
    weight_dist = np.inf
    
    W = W_init
    errors = []
    iter_num = 0
    
    np.random.seed(seed)
    while weight_dist > min_weight_dist and iter_num < max_iter:
        # Псевдослучайный индекс объекта обучающей выборки
        random_index = np.random.randint(X.shape[0])
        
        W_next = 2 * eta * X[random_index].dot(X[random_index].dot(W) - y[random_index]) / X.shape[0]
        cur_error = np.mean((y - np.dot(X, W_next))**2)
        
        # Пересчет расстояния между векторами
        weight_dist = np.sqrt(np.sum((W - W_next)**2))
        
        W = W_next
        errors.append(cur_error)
        iter_num += 1
    
    return W, errors

In [16]:
class LinearRegression:
    def __init__(self):
        pass
    
    def fit(self, X_train, y_train, n_iter=10**5):
        W_init = np.zeros(X_train.shape[1])
        self.w_, self.errors = stochastic_gradient_descent(X_train, y_train, W_init, max_iter = n_iter)
        
    def predict(self, X_test):
        return np.dot(X_test, self.w_)