# **Basics of scikit-learn package** 

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns 
import plotly.express as px
from plotly.offline import init_notebook_mode
import warnings

init_notebook_mode(connected=True)
warnings.filterwarnings('ignore')

plt.style.use('ggplot')
sns.set_theme(style='whitegrid')

## Supervised learning (контролируемое обучение / обучение с учителем)

### 1.1 *Linear Models (Линейные модели)*

Линейные модели являются основой многих методов машинного обучения. Они просты в интерпретации, быстры в обучении и хорошо работают на больших данных. Основная идея линейных моделей заключается в том, что целевая переменная $y$ выражается как линейная комбинация входных признаков $X$:

$$
y = w_0 + w_1 x_1 + w_2 x_2 + \dots + w_n x_n + \varepsilon
$$

где:
- $w_0$ — свободный коэффициент (intercept),
- $w_1, \dots, w_n$ — веса модели (коэффициенты),
- $x_1, \dots, x_n$ — входные признаки,
- $\varepsilon$ — ошибка модели (остаточный член).

### 1.1.1 Метод наименьших квадратов (Ordinary Least Squares, OLS)

Метод наименьших квадратов минимизирует сумму квадратов ошибок между предсказанными значениями $\hat{y}$ и реальными значениями $y$:

$$
J(w) = \sum_{i=1}^{m} (y_i - \hat{y}_i)^2 = \sum_{i=1}^{m} (y_i - (w_0 + \sum_{j=1}^{n} w_j x_{ij}))^2
$$

Оптимальные коэффициенты $w$ находятся по формуле:

$$
\mathbf{w} = (\mathbf{X}^T \mathbf{X})^{-1} \mathbf{X}^T \mathbf{y}
$$

В scikit-learn линейная регрессия реализуется с помощью `LinearRegression`:

In [2]:
from sklearn.linear_model import LinearRegression

X = [[1, 2], [2, 3], [3, 4], [4, 5]]  # Признаки
y = [3, 5, 7, 9]  # Целевая переменная

model = LinearRegression()
model.fit(X, y)

print("Коэффициенты:", model.coef_)
print("Свободный член:", model.intercept_)

Коэффициенты: [1. 1.]
Свободный член: 1.7763568394002505e-15


### 1.1.2 Линейная регрессия с L2-регуляризацией (Ridge Regression)

Ridge-регрессия добавляет L2-регуляризацию (штраф за большие коэффициенты) для предотвращения переобучения:

$$
J(w) = \sum_{i=1}^{m} (y_i - \hat{y}_i)^2 + \lambda \sum_{j=1}^{n} w_j^2
$$

где $\lambda$ — параметр регуляризации. Чем больше $\lambda$, тем сильнее штраф за большие коэффициенты.

Пример реализации Ridge-регрессии в scikit-learn:

In [3]:
from sklearn.linear_model import Ridge

ridge = Ridge(alpha=1.0)
ridge.fit(X, y)

print("Коэффициенты Ridge:", ridge.coef_)

Коэффициенты Ridge: [0.90909091 0.90909091]


### 1.1.3 Линейная регрессия с L1-регуляризацией (Lasso Regression)

Lasso-регрессия использует L1-регуляризацию, накладывая штраф на сумму абсолютных значений коэффициентов:

$$
J(w) = \sum_{i=1}^{m} (y_i - \hat{y}_i)^2 + \lambda \sum_{j=1}^{n} |w_j|
$$

Lasso способствует разреженности модели, зануляя некоторые коэффициенты, что полезно для отбора признаков.

Пример в scikit-learn:

In [4]:
from sklearn.linear_model import Lasso

lasso = Lasso(alpha=0.1)
lasso.fit(X, y)

print("Коэффициенты Lasso:", lasso.coef_)

Коэффициенты Lasso: [1.92000000e+00 1.33226763e-16]


### 1.1.4 Эластичная сеть (Elastic Net)

Elastic Net сочетает L1- и L2-регуляризации:

$$
J(w) = \sum_{i=1}^{m} (y_i - \hat{y}_i)^2 + \lambda_1 \sum_{j=1}^{n} |w_j| + \lambda_2 \sum_{j=1}^{n} w_j^2
$$

Этот метод особенно полезен, если признаки коррелированы между собой.

Пример Elastic Net в scikit-learn:

In [5]:
from sklearn.linear_model import ElasticNet

elastic_net = ElasticNet(alpha=0.1, l1_ratio=0.5)
elastic_net.fit(X, y)

print("Коэффициенты Elastic Net:", elastic_net.coef_)

Коэффициенты Elastic Net: [0.96195901 0.9596548 ]


---