# Ridge, Lasso и Линейная регрессия

Пример обучения модели линейной регрессии с использованием L1 и L2 регуляризаций

---

## Импорт библиотек

In [None]:
import pandas as pd
from sklearn.linear_model import LinearRegression, Ridge, Lasso
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score

## Загрузка датасета

Чтение данных из CSV, где `x1`, `x2`, `x3`, `x4` — признаки, `y` — целевая переменная.

In [2]:
data2 = pd.read_csv("../datasets/linear_with_regularization.csv")

X = data2[["x1", "x2", "x3", "x4"]].values
Y = data2["y"].values

## Разделение датасета на тестовую и тренировочные выборки

80% датасета это тренировочные данные, 20% - тестовые

In [3]:
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=48)

## Создание моделей

In [4]:
models = {
    "Linear": LinearRegression(),
    "Ridge": Ridge(alpha=0.6),
    "Lasso": Lasso(alpha=0.05)
}

## Обучение

In [5]:
for model in models.values():
    model.fit(X_train, Y_train)

coef_table = pd.DataFrame({
    name: model.coef_
    for name, model in models.items()
}, index=["x1", "x2", "x3", "x4"])

coef_table

Unnamed: 0,Linear,Ridge,Lasso
x1,5.436504,3.500691,4.4678
x2,-0.462765,1.313285,0.0
x3,-0.124351,-0.159794,-0.0
x4,0.034384,-0.025426,0.0


## Получение предсказаний на тестовой выборке и расчет метрик

In [6]:
results = []

for name, model in models.items():
    y_pred = model.predict(X_test)
    results.append({
        "Model": name,
        "MSE": mean_squared_error(Y_test, y_pred),
        "MAE": mean_absolute_error(Y_test, y_pred),
        "R2": r2_score(Y_test, y_pred)
    })

results_df = pd.DataFrame(results)
results_df

Unnamed: 0,Model,MSE,MAE,R2
0,Linear,0.298318,0.458731,0.806034
1,Ridge,0.244478,0.403259,0.841041
2,Lasso,0.248439,0.419329,0.838465
