In [3]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

In [8]:
import numpy as np

class LinearRegression:
    def __init__(self, learning_rate, iterations):
        """
        Конструктор класса линейной регрессии.

        Параметры:
        ----------
        learning_rate : float
            Скорость обучения.
        iterations : int
            Количество итераций.
        """
        self.learning_rate = learning_rate
        self.iterations = iterations
        self.weights = None
        self.bias = None
        self.X = None
        self.Y = None
        self.n_samples = None
        self.n_features = None

    def fit(self, X, Y):
        """
        Обучение модели линейной регрессии с использованием градиентного спуска.

        Параметры:
        ----------
        X : numpy.ndarray
            Матрица признаков (размерность: [n_samples, n_features]).
        Y : numpy.ndarray
            Вектор целевых значений (размерность: [n_samples,]).
        """
        # Проверка на соответствие размеров входных данных
        if X.shape[0] != Y.shape[0]:
            raise ValueError("Количество примеров в X и Y должно совпадать.")

        self.X = X
        self.Y = Y
        self.n_samples = X.shape[0]
        self.n_features = X.shape[1]

        # Инициализация весов и смещения нулями
        self.weights = np.zeros(self.n_features)
        self.bias = 0

        # Основной цикл градиентного спуска
        for _ in range(self.iterations):
            self.update_weights()

        return self.weights, self.bias

    def update_weights(self):
        """
        Обновление весов и смещения на одной итерации градиентного спуска.
        """
        # Расчет предсказанных значений
        Y_pred = np.dot(self.X, self.weights) + self.bias

        # Расчет градиентов
        dw = (1 / self.n_samples) * np.dot(self.X.T, (Y_pred - self.Y))
        db = (1 / self.n_samples) * np.sum(Y_pred - self.Y)

        # Обновление весов и смещения
        self.weights -= self.learning_rate * dw
        self.bias -= self.learning_rate * db

    def predict(self, X):
        """
        Предсказание целевых значений для новых входных данных.

        Параметры:
        ----------
        X : numpy.ndarray
            Матрица признаков.

        Возвращает:
        ----------
        numpy.ndarray
            Вектор предсказанных значений.
        """
        return np.dot(X, self.weights) + self.bias


In [9]:
df = pd.read_csv( "salary_data.csv" )

X = df.iloc[:,:-1].values
Y = df.iloc[:,1].values

model = LinearRegression(iterations = 1000, learning_rate = 0.01)
model.fit(X, Y)

Y_pred = model.predict(X)

print(*np.round(model.weights, 2))
print(np.round(model.bias, 2))


9876.11
22920.49
