### <font color='purple'>Метрики и способы оценки качества модели</font>

#### <font color='purple'>Регрессия</font>
- Среднеквадратичная ошибка (mean_squared_error, MSE). Это метрика для задач регрессии (когда модель предсказывает непрерывные числа, например, цену или температуру). Она измеряет средний квадрат разницы между реальными значениями и предсказанными моделью.
Чем меньше значение, тем лучше модель.
    - Плюс: Учитывает большие ошибки сильнее (из-за квадрата).
    - Минус: Чувствительна к выбросам, и результат в квадратах единиц (например, если цена в рублях, то ошибка в рублях² — не всегда удобно интерпретировать).
- Коэффициент детерминации (r2_score). Для регрессии. Показывает, насколько хорошо модель объясняет разброс данных по сравнению с простой средней. Значение от -∞ до 1: 1 — идеальная модель, 0 — модель не лучше, чем просто среднее значение, отрицательное — модель хуже среднего. Полезна, чтобы понять, сколько процентов вариации данных модель "захватила".
- Средняя абсолютная ошибка (mean_absolute_error) Для регрессии. Измеряет среднюю абсолютную (по модулю) разницу между реальными и предсказанными значениями. Чем меньше, тем лучше.
    - Плюс: Легко понять (в тех же единицах, что и данные, например, рубли).
    - Минус: Не наказывает большие ошибки так сильно, как квадратичная.
#### <font color='purple'>Классификация</font>
- Точность (accuracy_score) Для задач классификации (когда модель делит данные на классы, например, "спам/не спам"). Это доля правильных предсказаний от всех. Например, если из 100 примеров модель угадала 90 — точность 0.9 (90%).
    - Плюс: Простая и понятная.
    - Минус: Плохо работает с несбалансированными классами (если 99% — один класс, модель может просто всегда предсказывать его и получить высокую точность, но быть бесполезной).
- Точность класса (precision_score) Для классификации. Измеряет, сколько из предсказанных положительных примеров действительно положительные. Например, если модель сказала "спам" 10 раз, а реально спам было 8 — точность класса 0.8. Важна, когда ложные положительные дорогие (например, в медицине: не хочется зря диагностировать болезнь).
- Полнота (recall_score) Для классификации. Измеряет, сколько реальных положительных примеров модель нашла. Например, если реально 10 спамов, а модель нашла 8 — полнота 0.8. Важна, когда пропустить положительный — плохо (например, не заметить болезнь). 
- F1-мера (f1_score) Для классификации. Это среднее между точностью класса и полнотой (гармоническое среднее). Балансирует их: высокая, если обе хорошие.
Полезна для несбалансированных данных, когда нужна одна общая метрика.
#### <font color='purple'>Кластеризация</font>
- Скорректированный индекс Рэнда (ARI, Adjusted Rand Index) Для задач кластеризации (когда модель группирует данные без меток, например, клиентов по поведению). Измеряет, насколько две группировки похожи (например, предсказанная и реальная). Значение от -1 до 1: 1 — идеальное совпадение, 0 — случайное, отрицательное — хуже случайного. Скорректировано на случайные совпадения, чтобы не переоценивать.
- Скорректированная взаимная информация (AMI, Adjusted Mutual Information) Для кластеризации. Измеряет, сколько информации одна группировка даёт о другой (взаимная зависимость). Значение от 0 до 1: 1 — полное совпадение, 0 — независимы. Скорректировано на размер кластеров и случайность, лучше работает с разными размерами групп.


In [None]:
from sklearn.metrics import classification_report
import pandas as pd

data = pd.DataFrame([])
print(classification_report(y_test, y_pred))
pd.crosstab(y_test, y_pred)
print(model.score(X_test,y_test)) # тоже что и accuracy

ROC-кривые

Показывают насколько оценка модели лучше, чем случайное угадывание. Чем ближе кривая к левому верхнему углу, тем лучше. Совпадение с углом обозначает переобучение

In [None]:
from sklearn.metrics import roc_auc_score
from sklearn.metrics import roc_curve
logit_roc_auc = roc_auc_score(y_test, model.predict(X_test))
fpr, tpr, thresholds = roc_curve(y_test, model.predict_proba(X_test)[:,1])
plt.figure()
plt.plot(fpr, tpr, label='Logistic Regression (area = %0.2f)' % logit_roc_auc)
plt.plot([0, 1], [0, 1],'r--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver operating characteristic')
plt.legend(loc="lower right")
plt.savefig('Log_ROC')
plt.show()