**Лекция: Понимание MSE, MAE и R² в контексте машинного обучения**

---

### Введение

В машинном обучении критически важно правильно оценить эффективность моделей. Для задач регрессии часто используются такие метрики, как Среднеквадратичная ошибка (MSE), Средняя абсолютная ошибка (MAE) и коэффициент детерминации (R²).

---

### Среднеквадратичная ошибка (MSE)

MSE измеряет средний квадрат разностей между фактическими и предсказанными значениями. Вычисляется как:

$$ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 $$

Где \( y_i \) - истинные значения,  \( \hat{y}_i \) - предсказанные значения, и \( n \) - количество наблюдений. MSE полезна для определения степени ошибки модели, но так как она в квадрате, большие ошибки взвешиваются сильнее.

---

### Средняя абсолютная ошибка (MAE)

MAE измеряет среднее абсолютное отклонение между фактическими и предсказанными значениями:

$$ \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| $$

Это дает прямое представление общей ошибки модели без учета направления ошибки. MAE более устойчива к выбросам по сравнению с MSE.

---

### Коэффициент детерминации (R²)

R², известный как коэффициент объяснённой вариации, показывает, какая доля вариации зависимой переменной объясняется независимыми переменными модели. Вычисляется как:

$$ R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2} $$

Где \( \bar{y} \) - среднее значение \( y \). Значение R² находится в диапазоне от 0 до 1, где близкое к 1 значение указывает на лучшую способность модели объяснять вариацию зависимой переменной.

---

### Заключение

MSE, MAE и R² являются важными метриками для оценки качества моделей регрессии. Они помогают понять, насколько хорошо модель предсказывает данные и какие ошибки она делает, предоставляя комплексную картину эффективности модели. Правильный выбор и понимание этих метрик являются ключевыми для разработки надежных и эффективных моделей машинного обучения.

### Пример

Предположим, у нас есть модель для предсказания цен на жилье. В таблице ниже представлены фактические и предсказанные цены:

| Жилье | Фактическая цена (y_i) | Предсказанная цена (ŷ_i) |
|-------|------------------------|-------------------------|
| 1     | 100                    | 110                     |
| 2     | 200                    | 190                     |
| 3     | 150                    | 160                     |
| 4     | 300                    | 310                     |
| 5     | 250                    | 240                     |

#### Вычисление MSE

$$
\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

$$
\text{MSE} = \frac{1}{5} ((100-110)^2 + (200-190)^2 + (150-160)^2 + (300-310)^2 + (250-240)^2)
$$

$$
\text{MSE} = \frac{1}{5} (100 + 100 + 100 + 100 + 100)
$$

$$
\text{MSE} = \frac{500}{5}
$$

$$
\text{MSE} = 100
$$

#### Вычисление MAE

$$
\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|
$$

$$
\text{MAE} = \frac{1}{5} (|100-110| + |200-190| + |150-160| + |300-310| + |250-240|)
$$

$$
\text{MAE} = \frac{1}{5} (10 + 10 + 10 + 10 + 10)
$$

$$
\text{MAE} = \frac{50}{5}
$$

$$
\text{MAE} = 10
$$

#### Вычисление R²

Сначала вычислим среднее значение фактических цен (\( \bar{y} \)):

$$
\bar{y} = \frac{1}{5} (100 + 200 + 150 + 300 + 250) = \frac{1000}{5} = 200
$$

Теперь вычислим R²:

$$
R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2}
$$

$$
R^2 = 1 - \frac{(100-110)^2 + (200-190)^2 + (150-160)^2 + (300-310)^2 + (250-240)^2}{(100-200)^2 + (200-200)^2 + (150-200)^2 + (300-200)^2 + (250-200)^2}
$$

$$
R^2 = 1 - \frac{500}{50000 + 0 + 2500 + 10000 + 2500}
$$

$$
R^2 = 1 - \frac{500}{40000}
$$

$$
R^2 = 1 - 0.0125
$$

$$
R^2 = 0.9875
$$

---

### Вывод

В этом примере мы рассчитали ключевые метрики для оценки качества регрессионной модели: MSE, MAE и R². Эти расчеты помогают понять, как модель работает с точки зрения ошибок предсказания и объяснения вариабельности данных.

![image.png](attachment:image.png)


1. **MSE (Mean Squared Error)**:
   - **Описание**: MSE вычисляется как среднее квадратов разностей между фактическими и предсказанными значениями. Большие ошибки вносят больший вклад в MSE, так как ошибка возведена в квадрат.
   - **Использование**: MSE часто используется, когда важно сильно наказывать большие ошибки. Это делает ее подходящей для ситуаций, где большие отклонения от истинных значений недопустимы.

2. **MAE (Mean Absolute Error)**:
   - **Описание**: MAE вычисляется как среднее абсолютных разностей между фактическими и предсказанными значениями. Это даёт более прямую оценку средней ошибки.
   - **Использование**: MAE полезна, когда необходимо избежать чрезмерного влияния выбросов или аномалий в данных. Это делает ее подходящей для задач, где все ошибки одинаково важны.

3. **R2 (коэффициент детерминации)**:
   - **Описание**: R2 измеряет, какая доля вариативности зависимой переменной объясняется независимыми переменными в модели. Он может варьироваться от 0 до 1, где ближе к 1 означает лучшее соответствие модели.
   - **Использование**: R2 используется для оценки качества общей подгонки модели к данным. Это полезно для сравнения моделей, поскольку оно дает понимание о том, насколько хорошо модель объясняет наблюдаемые данные.