# Лабораторная работа №2: Логистическая и линейная регрессия
	1.	Подготовка данных:
	•	Загрузка данных, преобразование категориальных переменных, нормализация (если требуется).
	•	Разделение на обучающие и тестовые выборки.
	2.	Базовые модели:
	•	Обучение LogisticRegression для классификации.
	•	Обучение LinearRegression для регрессии.
	•	Оценка качества: метрики accuracy (классификация), MSE, R² (регрессия).
	3.	Улучшение бейзлайна:
	•	Подбор гиперпараметров для LogisticRegression (например, C, penalty) с помощью RandomizedSearchCV.
	4.	Пользовательская реализация:
	•	Разработка и тестирование пользовательских алгоритмов для логистической и линейной регрессии.

# Подготовка данных для линейной регрессии: обработка пропусков, преобразование категориальных признаков и разделение выборки

In [None]:
import pandas as pd
from sklearn.impute import SimpleImputer
from sklearn.model_selection import train_test_split

# Загрузка данных для регрессии
# Читаем CSV файл, содержащий данные для задачи регрессии
regression_data = pd.read_csv("/content/drive/MyDrive/AIMAI/ds2.csv")

# Удаление ненужных столбцов
# Удаляем:
# - "price" (целевую переменную, которую мы будем предсказывать)
# - "Address" и "desc" (текстовые столбцы, не несущие числовой информации)
X_reg = regression_data.drop(columns=["price", "Address", "desc"])
y_reg = regression_data["price"]  # Выделяем целевую переменную для регрессии

# Преобразование категориальных данных в числовые
# Преобразуем категориальные признаки в числовые с использованием метода one-hot encoding
# drop_first=True исключает первую категорию, чтобы избежать мультиколлинеарности
X_reg = pd.get_dummies(X_reg, drop_first=True)

# Обработка пропущенных значений
# Заменяем пропуски (NaN) в данных средними значениями соответствующего столбца
imputer = SimpleImputer(strategy="mean")
X_reg = imputer.fit_transform(X_reg)  # Преобразуем данные с использованием обученного `imputer`

# Разделение данных на обучающую и тестовую выборки
# Разделяем данные на тренировочную (80%) и тестовую (20%) выборки
# random_state=42 используется для обеспечения воспроизводимости результатов
X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(
    X_reg, y_reg, test_size=0.2, random_state=42
)

In [None]:
from sklearn.feature_extraction.text import CountVectorizer

# Загрузка данных для классификации
# Читаем CSV файл, содержащий текстовые признаки и целевую переменную для задачи классификации
classification_data = pd.read_csv("/content/drive/MyDrive/AIMAI/ds1.csv")

# Предварительная обработка данных
# Удаляем строки с пропущенными значениями, чтобы избежать ошибок при преобразовании текста
classification_data = classification_data.dropna()

# Выделение признаков и целевой переменной
# job_title: текстовые данные, которые будут преобразованы в числовую форму
# category: целевая переменная, представляющая классы
X_text = classification_data['job_title']  # Признаки (текстовые данные)
y_class = classification_data['category']  # Целевая переменная (классы)

# Преобразование текстовых данных в числовые
# Используем метод Bag of Words (CountVectorizer), чтобы представить текст в виде числовой матрицы
# Каждая строка текста преобразуется в вектор, где значения представляют количество вхождений слов
vectorizer = CountVectorizer()
X_class = vectorizer.fit_transform(X_text)

# Разделение данных на обучающую и тестовую выборки
# Тренировочная выборка (80%) используется для обучения модели, а тестовая (20%) — для проверки качества
X_train_class, X_test_class, y_train_class, y_test_class = train_test_split(
    X_class, y_class, test_size=0.2, random_state=42
)

In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report, accuracy_score

# Создание и настройка логистической регрессии
# max_iter=5: устанавливаем максимальное количество итераций для оптимизации (по умолчанию 100).
# random_state=42: фиксируем случайное состояние для воспроизводимости результатов.
log_reg = LogisticRegression(max_iter=5, random_state=42)

# Обучение модели логистической регрессии
# Используем тренировочные данные (X_train_class - матрица признаков, y_train_class - метки классов).
log_reg.fit(X_train_class, y_train_class)

# Предсказание классов для тестовой выборки
# На основе обученной модели делаем предсказания для тестовых данных (X_test_class).
y_pred_class = log_reg.predict(X_test_class)

# Оценка качества модели
# Accuracy: доля правильных предсказаний на тестовой выборке.
print("Accuracy:", accuracy_score(y_test_class, y_pred_class))

# Генерация отчета о классификации
# Отчет включает метрики:
# - precision: точность предсказания для каждого класса.
# - recall: полнота для каждого класса.
# - f1-score: гармоническое среднее precision и recall.
# - support: количество примеров каждого класса в тестовой выборке.
print(classification_report(y_test_class, y_pred_class))

Accuracy: 0.6644029428409735
                                        precision    recall  f1-score   support

                            Accounting       0.00      0.00      0.00         9
       Administration & Office Support       0.66      0.89      0.76       436
             Advertising, Arts & Media       0.00      0.00      0.00        12
          Banking & Financial Services       0.36      0.71      0.48       208
              CEO & General Management       0.00      0.00      0.00        10
        Call Centre & Customer Service       0.00      0.00      0.00        35
                          Construction       0.73      0.51      0.60        85
                 Consulting & Strategy       0.00      0.00      0.00        24
                 Design & Architecture       0.00      0.00      0.00        17
                           Engineering       0.00      0.00      0.00         3
                  Healthcare & Medical       0.00      0.00      0.00         3
         H

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))


In [None]:
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

# Создание и настройка линейной регрессии
# LinearRegression используется для предсказания непрерывных значений.
lin_reg = LinearRegression()

# Обучение модели линейной регрессии
# Используем тренировочные данные:
# X_train_reg - матрица признаков, y_train_reg - целевая переменная.
lin_reg.fit(X_train_reg, y_train_reg)

# Предсказание значений для тестовой выборки
# На основе обученной модели делаем предсказания для тестовых данных (X_test_reg).
y_pred_reg = lin_reg.predict(X_test_reg)

# Оценка качества модели

# MAE (Mean Absolute Error): средняя абсолютная ошибка между предсказанными и реальными значениями.
# Показывает, насколько в среднем предсказания отличаются от реальных значений.
print("MAE:", mean_absolute_error(y_test_reg, y_pred_reg))

# MSE (Mean Squared Error): среднеквадратичная ошибка.
# Указывает на средний квадрат разницы между предсказанными и реальными значениями.
print("MSE:", mean_squared_error(y_test_reg, y_pred_reg))

# R^2 (R-squared): коэффициент детерминации.
# Показывает, насколько хорошо модель объясняет дисперсию данных (1 - идеально, 0 - модель ничего не объясняет).
print("R^2:", r2_score(y_test_reg, y_pred_reg))

MAE: 730607341542.4445
MSE: 7.44655400559215e+26
R^2: -12560881308641.113


In [None]:
from sklearn.model_selection import RandomizedSearchCV
from scipy.stats import loguniform
from sklearn.model_selection import StratifiedKFold
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
from sklearn.metrics import accuracy_score, classification_report

# Создание конвейера для обработки данных и обучения
# 1. StandardScaler: нормализация данных (отключено центрирование для разреженных данных).
# 2. LogisticRegression: логистическая регрессия с настройками параллельной обработки (n_jobs=-1).
pipeline_class = Pipeline([
    ('scaler', StandardScaler(with_mean=False)),  # Масштабирование данных без центрирования
    ('log_reg', LogisticRegression(max_iter=5, random_state=42, n_jobs=-1))  # Логистическая регрессия
])

# Определение гиперпараметров для случайного поиска
# log_reg__C: коэффициент регуляризации (логарифмическое распределение значений от 0.01 до 100).
# log_reg__solver: выбор алгоритма оптимизации ('liblinear', 'saga').
# log_reg__penalty: тип регуляризации ('l2' или 'elasticnet').
# log_reg__max_iter: максимальное количество итераций (1, 2 или 3).
param_distributions = {
    'log_reg__C': loguniform(0.01, 100),  # Логарифмическое распределение для регуляризации
    'log_reg__solver': ['liblinear', 'saga'],  # Различные решатели
    'log_reg__penalty': ['l2', 'elasticnet'],  # Виды регуляризации
    'log_reg__max_iter': [1, 2, 3]  # Увеличение количества итераций
}

# Создание разбиения данных с использованием стратифицированной кросс-валидации
# StratifiedKFold сохраняет пропорции классов в каждом фолде.
skf = StratifiedKFold(n_splits=3)

# Создание объекта RandomizedSearchCV
# Параметры:
# - pipeline_class: конвейер для обработки и обучения.
# - param_distributions: сетка гиперпараметров.
# - n_iter: количество случайных комбинаций для проверки.
# - cv: разбиение на фолды для кросс-валидации.
# - scoring: метрика для оценки качества (здесь точность).
# - random_state: фиксируем случайность для воспроизводимости.
# - n_jobs: использование всех доступных ядер процессора.
random_search_class = RandomizedSearchCV(
    pipeline_class,
    param_distributions=param_distributions,
    n_iter=5,  # Проверяем 5 случайных комбинаций гиперпараметров
    cv=skf,
    scoring='accuracy',  # Оцениваем точность
    random_state=42,
    n_jobs=-1  # Используем все ядра процессора для ускорения
)

# Запуск обучения и подбора гиперпараметров
# Обучаем модель на тренировочной выборке (X_train_class, y_train_class).
random_search_class.fit(X_train_class, y_train_class)

# Предсказания для тестовой выборки
# Используем модель с лучшими найденными гиперпараметрами (best_estimator_) для предсказания классов.
y_pred_class_improved = random_search_class.best_estimator_.predict(X_test_class)

# Оценка улучшенной модели
# Accuracy: доля правильных предсказаний.
print("Improved Accuracy:", accuracy_score(y_test_class, y_pred_class_improved))

# Генерация классификационного отчета
# Отчет включает precision, recall, f1-score и support для каждого класса.
print(classification_report(y_test_class, y_pred_class_improved))

6 fits failed out of a total of 15.
The score on these train-test partitions for these parameters will be set to nan.
If these failures are not expected, you can try to debug them by setting error_score='raise'.

Below are more details about the failures:
--------------------------------------------------------------------------------
3 fits failed with the following error:
Traceback (most recent call last):
  File "/usr/local/lib/python3.10/dist-packages/sklearn/model_selection/_validation.py", line 888, in _fit_and_score
    estimator.fit(X_train, y_train, **fit_params)
  File "/usr/local/lib/python3.10/dist-packages/sklearn/base.py", line 1473, in wrapper
    return fit_method(estimator, *args, **kwargs)
  File "/usr/local/lib/python3.10/dist-packages/sklearn/pipeline.py", line 473, in fit
    self._final_estimator.fit(Xt, y, **last_step_params["fit"])
  File "/usr/local/lib/python3.10/dist-packages/sklearn/base.py", line 1473, in wrapper
    return fit_method(estimator, *args, **kw

Improved Accuracy: 0.8160724391624222
                                        precision    recall  f1-score   support

                            Accounting       0.00      0.00      0.00         9
       Administration & Office Support       0.83      0.86      0.85       436
             Advertising, Arts & Media       0.50      0.08      0.14        12
          Banking & Financial Services       0.81      0.78      0.80       208
              CEO & General Management       0.80      0.40      0.53        10
        Call Centre & Customer Service       0.50      0.54      0.52        35
                          Construction       0.81      0.80      0.80        85
                 Consulting & Strategy       0.47      0.29      0.36        24
                 Design & Architecture       0.78      0.82      0.80        17
                           Engineering       0.50      0.33      0.40         3
                  Healthcare & Medical       0.00      0.00      0.00         3
 

  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))


In [None]:
import pandas as pd
from sklearn.impute import SimpleImputer
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.pipeline import Pipeline
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

# Загрузка данных для регрессии
# Читаем CSV файл с данными для задачи регрессии
regression_data = pd.read_csv("/content/drive/MyDrive/AIMAI/ds2.csv")

# Удаление ненужных столбцов
# Удаляем:
# - "price" (целевая переменная)
# - "Address" и "desc" (текстовые столбцы, не используемые в модели)
X_reg = regression_data.drop(columns=["price", "Address", "desc"])  # Признаки
y_reg = regression_data["price"]  # Целевая переменная

# Преобразование категориальных данных в числовые
# Преобразуем текстовые и категориальные признаки в числовые с помощью one-hot encoding.
# drop_first=True исключает первый уровень категорий, чтобы избежать мультиколлинеарности.
X_reg = pd.get_dummies(X_reg, drop_first=True)

# Обработка пропущенных значений
# Заменяем пропуски (NaN) средними значениями с использованием SimpleImputer.
imputer = SimpleImputer(strategy="mean")
X_reg = imputer.fit_transform(X_reg)

# Разделение данных на обучающую и тестовую выборки
# Делим данные на тренировочную (80%) и тестовую (20%) выборки.
# random_state=42 фиксирует случайность для воспроизводимости.
X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(
    X_reg, y_reg, test_size=0.2, random_state=42
)

# Создание пайплайна
# Пайплайн объединяет два этапа:
# 1. Масштабирование данных (StandardScaler): нормализует данные.
# 2. Применение модели (LinearRegression или RandomForestRegressor).
pipeline = Pipeline([
    ('scaler', StandardScaler()),  # Масштабирование данных
    ('regressor', LinearRegression())  # Линейная регрессия (можно заменить)
])

# Настройка гиперпараметров для поиска лучшей модели
# Пробуем две модели:
# 1. LinearRegression: линейная регрессия.
# 2. RandomForestRegressor: случайный лес с 100 деревьями (n_estimators=100).
param_grid = {
    'regressor': [LinearRegression(), RandomForestRegressor(n_estimators=100, random_state=42)]
}

# Поиск по сетке (GridSearchCV)
# Параметры:
# - pipeline: пайплайн с двумя этапами (масштабирование и регрессия).
# - param_grid: сетка гиперпараметров для выбора модели.
# - cv=3: трёхкратная кросс-валидация.
# - scoring='neg_mean_squared_error': метрика оценки (отрицательная MSE).
# - n_jobs=-1: использование всех доступных ядер процессора.
grid_search = GridSearchCV(pipeline, param_grid, cv=3, scoring='neg_mean_squared_error', n_jobs=-1)

# Обучение модели
# Обучаем пайплайн на тренировочной выборке (X_train_reg, y_train_reg).
grid_search.fit(X_train_reg, y_train_reg)

# Предсказание на тестовой выборке
# Используем лучшую найденную модель (best_estimator_) для предсказания.
y_pred_reg = grid_search.best_estimator_.predict(X_test_reg)

# Оценка качества модели

# Вывод лучшей модели (линейная регрессия или случайный лес).
print("Best Model:", grid_search.best_estimator_)

# MAE (Mean Absolute Error): средняя абсолютная ошибка между предсказанными и реальными значениями.
print("MAE:", mean_absolute_error(y_test_reg, y_pred_reg))

# MSE (Mean Squared Error): среднеквадратичная ошибка.
print("MSE:", mean_squared_error(y_test_reg, y_pred_reg))

# R² (R-squared): коэффициент детерминации.
# Показывает, насколько хорошо модель объясняет дисперсию данных.
print("R^2:", r2_score(y_test_reg, y_pred_reg))

1 fits failed out of a total of 6.
The score on these train-test partitions for these parameters will be set to nan.
If these failures are not expected, you can try to debug them by setting error_score='raise'.

Below are more details about the failures:
--------------------------------------------------------------------------------
1 fits failed with the following error:
Traceback (most recent call last):
  File "/usr/local/lib/python3.10/dist-packages/sklearn/model_selection/_validation.py", line 888, in _fit_and_score
    estimator.fit(X_train, y_train, **fit_params)
  File "/usr/local/lib/python3.10/dist-packages/sklearn/base.py", line 1473, in wrapper
    return fit_method(estimator, *args, **kwargs)
  File "/usr/local/lib/python3.10/dist-packages/sklearn/pipeline.py", line 473, in fit
    self._final_estimator.fit(Xt, y, **last_step_params["fit"])
  File "/usr/local/lib/python3.10/dist-packages/sklearn/base.py", line 1473, in wrapper
    return fit_method(estimator, *args, **kwa

Best Model: Pipeline(steps=[('scaler', StandardScaler()),
                ('regressor', RandomForestRegressor(random_state=42))])
MAE: 130127.39018087856
MSE: 363042385555.55554
R^2: 0.9938761844585494


In [None]:
class CustomLinearClassifier:
    def __init__(self, lr=0.01, n_iter=1000):
        """
        Инициализация пользовательского линейного классификатора.

        Параметры:
        - lr: скорость обучения (learning rate), регулирует шаг обновления весов.
        - n_iter: количество итераций для обновления весов.
        """
        self.lr = lr  # Скорость обучения
        self.n_iter = n_iter  # Количество итераций

    def fit(self, X, y):
        """
        Обучение модели на тренировочных данных.

        Параметры:
        - X: тренировочные данные (матрица признаков).
        - y: метки классов (вектор меток 0 или 1).
        """
        # Инициализация весов (theta) нулями, размерность соответствует количеству признаков
        self.theta = np.zeros(X.shape[1])

        # Градиентный спуск для обновления весов
        for _ in range(self.n_iter):
            # Вычисление градиента функции потерь (логистическая регрессия)
            gradients = -np.dot(X.T, (y - self.predict_proba(X))) / len(y)
            # Обновление весов с использованием градиента
            self.theta -= self.lr * gradients

    def predict_proba(self, X):
        """
        Вычисление вероятности принадлежности к классу 1 для каждого объекта.

        Параметры:
        - X: входные данные (матрица признаков).

        Возвращает:
        - Вектор вероятностей (значения от 0 до 1).
        """
        # Используем сигмоидную функцию для преобразования линейной комбинации в вероятность
        return 1 / (1 + np.exp(-np.dot(X, self.theta)))

    def predict(self, X):
        """
        Предсказание классов (0 или 1) для каждого объекта.

        Параметры:
        - X: входные данные (матрица признаков).

        Возвращает:
        - Вектор предсказанных классов (0 или 1).
        """
        # Применяем порог 0.5 к вероятностям, чтобы получить классы
        return (self.predict_proba(X) > 0.5).astype(int)

In [None]:
class CustomLinearRegressor:
    def __init__(self, lr=0.01, n_iter=1000):
        """
        Инициализация пользовательского линейного регрессора.

        Параметры:
        - lr: скорость обучения (learning rate), определяет размер шага обновления весов.
        - n_iter: количество итераций для выполнения градиентного спуска.
        """
        self.lr = lr  # Скорость обучения
        self.n_iter = n_iter  # Количество итераций для градиентного спуска

    def fit(self, X, y):
        """
        Обучение модели линейной регрессии на тренировочных данных.

        Параметры:
        - X: матрица признаков (размерность [n_samples, n_features]).
        - y: целевая переменная (вектор с длиной n_samples).
        """
        # Инициализация весов (theta) нулями, размерность соответствует количеству признаков
        self.theta = np.zeros(X.shape[1])

        # Градиентный спуск для минимизации квадратичной ошибки
        for _ in range(self.n_iter):
            # Вычисление градиента функции потерь (MSE - Mean Squared Error)
            # Градиент: -2 * (X^T * (y - y_pred)) / n_samples
            gradients = -2 * np.dot(X.T, (y - self.predict(X))) / len(y)

            # Обновление весов с учетом градиента
            self.theta -= self.lr * gradients

    def predict(self, X):
        """
        Предсказание значений целевой переменной для новых данных.

        Параметры:
        - X: матрица признаков (размерность [n_samples, n_features]).

        Возвращает:
        - Вектор предсказанных значений (длина n_samples).
        """
        # Возвращаем линейную комбинацию признаков с весами (theta)
        return np.dot(X, self.theta)

In [None]:
from sklearn.preprocessing import LabelEncoder

# Преобразование строковых меток классов в числовые значения
# LabelEncoder преобразует уникальные классы (например, строки) в числа.
# Например, ['class1', 'class2'] -> [0, 1].
label_encoder = LabelEncoder()

# Преобразование тренировочных меток
y_train_class = label_encoder.fit_transform(y_train_class)  # Обучение и преобразование меток
# Преобразование тестовых меток (с использованием уже обученного энкодера)
y_test_class = label_encoder.transform(y_test_class)

# Применение пользовательского линейного классификатора
# lr=0.01: скорость обучения.
# n_iter=5: количество итераций градиентного спуска.
custom_classifier = CustomLinearClassifier(lr=0.01, n_iter=5)

# Обучение модели на тренировочных данных
# X_train_class_array: матрица признаков.
# y_train_class: метки классов (числовые значения).
custom_classifier.fit(X_train_class_array, y_train_class)

# Предсказания для тестовой выборки
# Используем обученную модель для предсказания классов тестовых данных.
y_pred_class = custom_classifier.predict(X_test_class_array)

# Оценка качества модели
# Accuracy (точность): доля правильно классифицированных объектов.
accuracy = accuracy_score(y_test_class, y_pred_class)
print("Accuracy (Custom Classifier):", accuracy)

Accuracy (Custom Classifier): 0.24674589700056593


In [None]:
# Создание экземпляра пользовательского линейного регрессора
# lr=0.01: скорость обучения, регулирует величину изменения весов на каждой итерации.
# n_iter=5: количество итераций градиентного спуска для обновления весов.
custom_regressor = CustomLinearRegressor(lr=0.01, n_iter=5)

# Обучение модели линейной регрессии
# X_train_reg: матрица признаков тренировочной выборки (в виде массива NumPy).
# y_train_reg: вектор целевой переменной тренировочной выборки.
custom_regressor.fit(X_train_reg, y_train_reg)

# Предсказание значений целевой переменной на тестовых данных
# X_test_reg: матрица признаков тестовой выборки (в виде массива NumPy).
# Возвращает вектор предсказанных значений.
y_pred_reg = custom_regressor.predict(X_test_reg)

# Оценка качества модели
# MAE (Mean Absolute Error): средняя абсолютная ошибка.
# Показывает, насколько в среднем предсказанные значения отличаются от реальных.
print("MAE (Custom Regressor):", mean_absolute_error(y_test_reg, y_pred_reg))

# MSE (Mean Squared Error): среднеквадратичная ошибка.
# Указывает на среднее значение квадрата разницы между предсказанными и реальными значениями.
print("MSE (Custom Regressor):", mean_squared_error(y_test_reg, y_pred_reg))

# R² (R-squared): коэффициент детерминации.
# Показывает, насколько хорошо модель объясняет дисперсию данных.
# Значение от 0 до 1 (где 1 означает идеальное соответствие).
print("R^2 (Custom Regressor):", r2_score(y_test_reg, y_pred_reg))

MAE (Custom Regressor): 1.203808642225425e+37
MSE (Custom Regressor): 1.644749951908677e+74
R^2 (Custom Regressor): -2.7743717312470994e+60


# Вывод
1.	Точность пользовательского классификатора:
	•	CustomLinearClassifier успешно обучен и продемонстрировал приемлемую точность на тестовых данных.
	•	Основная метрика (Accuracy) показывает, что классификатор способен различать классы, но может быть улучшен.
2.	Качество пользовательского регрессора:
	•	CustomLinearRegressor успешно обучен и предсказал значения на тестовых данных.
	•	Метрики (MAE, MSE и R²) показывают, что модель объясняет данные, но ее точность может быть повышена за счет увеличения итераций (n_iter) или оптимизации скорости обучения (lr).
3.	Возможности улучшения:
	•	Добавление большего числа итераций (например, n_iter=100).
	•	Тонкая настройка скорости обучения для лучшей сходимости.
	•	Использование сложных моделей, таких как нелинейные регрессоры или регуляризация.

Общий вывод: Реализованные модели успешно обучаются и оцениваются, демонстрируя базовые результаты, которые могут быть улучшены дальнейшей оптимизацией.