# Метрики эффективности моделей машинного обучения
## Цель работы
Научиться измерять эффективность моделей машинного обучения с помощью метрик, вибирать метрики исходя из задачи, разбивать датасет на обучающую и тестовую подвыборки.

## Содержание работы
1. Загрузите данные о вероятности развития сердечного приступа, прилагающийся к этой работе (heart.csv).
2. Обучите на этих данных простую модель логистической регрессии и выведите метрику точности (accuracy).
3. Разделите датасет на две части - первую половину используйте для обучения, а вторую - для оценки точности. Сравните значения метрик.
4. Разделите датасет на две части случайным образом. Повторите анализ.
5. Разделите датасет с помощью библиотечной функции. Повторите анализ несколько раз.
6. Постройте матрицу классификации и отчет о классификации для обученной модели для обучающей и тестовой выборок. Проинтерпретируйте полученные значения.
7. Подсчитайте для построенной модели значение всех метрик эффективности классификации на тестовой и обучающей выборках. Нужно использовать следующие метрики: accuracy, precision, recall, f1.

In [1]:
import pandas as pd
import numpy as np 
import matplotlib.pyplot as plt

### 1. Загрузите данные о вероятности развития сердечного приступа, прилагающийся к этой работе (heart.csv).

In [2]:
data = pd.read_csv('data/heart.csv')
data.head()

Unnamed: 0,age,sex,cp,trtbps,chol,fbs,restecg,thalachh,exng,oldpeak,slp,caa,thall,output
0,63,1,3,145,233,1,0,150,0,2.3,0,0,1,1
1,37,1,2,130,250,0,1,187,0,3.5,0,0,2,1
2,41,0,1,130,204,0,0,172,0,1.4,2,0,2,1
3,56,1,1,120,236,0,1,178,0,0.8,2,0,2,1
4,57,0,0,120,354,0,1,163,1,0.6,2,0,2,1


### 2. Обучите на этих данных простую модель логистической регрессии и выведите метрику точности (accuracy).

In [3]:
from sklearn.linear_model import LinearRegression

In [4]:
X = data.drop('output', axis=1)
y = data['output']

In [5]:
lr_model = LinearRegression()
lr_model.fit(X, y)

LinearRegression()

In [6]:
lr_model.score(X, y)

0.5175499644256842

### 3. Разделите датасет на две части - первую половину используйте для обучения, а вторую - для оценки точности. Сравните значения метрик.

In [7]:
x_train, y_train = X[:200], y[:200]

In [8]:
x_train.shape, y_train.shape

((200, 13), (200,))

In [9]:
x_test, y_test = X[200:], y[200:]
x_test.shape, y_test.shape

((103, 13), (103,))

In [10]:
lr_model.fit(x_train, y_train)

LinearRegression()

In [11]:
lr_model.score(x_train, y_train)

0.45405804018236195

In [12]:
lr_model.predict(x_test)

array([ 0.75194431,  0.1589634 ,  0.45760619,  0.6185906 , -0.20536379,
        0.63463611,  0.34723006,  0.31155265,  0.4546555 ,  0.6752418 ,
        0.73309023,  0.14842541,  0.56768794,  0.55630577,  0.44877022,
        0.26813972,  0.73318975,  0.10733601,  0.21077554,  0.44121948,
        0.01226233, -0.07190108,  0.8527078 ,  0.00574668,  0.21386137,
        0.33361744,  0.41562629,  0.44133546,  0.95184152,  0.61487406,
        1.0651674 ,  0.23974811,  0.39561276,  0.22404809,  0.14463121,
        0.53857414,  0.54039987,  0.37441532,  0.49652804,  0.59427433,
        0.40497086,  0.88486639,  0.45384374,  0.33911121,  0.40688837,
        0.6005157 ,  0.25104764,  0.70110343,  0.79235655,  0.38460263,
       -0.13155312,  0.21930841,  0.39190055,  0.35642161,  1.05394538,
        0.3062811 ,  0.03386762,  0.45263146,  0.73724523,  0.57409542,
        0.55453266,  0.8048266 ,  0.15974414,  0.53138964,  0.53636692,
        0.61174202,  0.49997098,  0.63558869,  0.0727705 ,  0.26

In [13]:
lr_model.score(x_test, y_test)

0.0

### 4. Разделите датасет на две части случайным образом. Повторите анализ.

In [14]:
N = int(X.shape[0] * 0.8)

x_train, y_train, x_test, y_test = X[:N], y[:N], X[N:], y[N:]
x_train.shape, y_train.shape, x_test.shape, y_test.shape

((242, 13), (242,), (61, 13), (61,))

In [15]:
lr_model_fn = LinearRegression()

In [16]:
lr_model_fn.fit(x_train, y_train)  

LinearRegression()

In [17]:
lr_model_fn.score(x_train, y_train)

0.5452486098240782

In [18]:
lr_model_fn.score(x_test, y_test)

0.0

### 5. Разделите датасет с помощью библиотечной функции. Повторите анализ несколько раз.

In [19]:
from sklearn.model_selection import train_test_split

In [20]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

In [21]:
lr_model_fn.fit(X_train, y_train)

LinearRegression()

In [22]:
lr_model_fn.predict(X_test)

array([ 0.17647891,  0.82510779,  0.58514645,  0.1056269 ,  0.32574318,
        0.15210994,  0.82318605,  0.57018772,  0.70103733,  0.59180367,
        0.62588345,  0.85692247,  0.49847587,  0.6230463 ,  0.23663993,
        0.2352642 ,  0.91772138,  0.36957632, -0.02820548,  0.52333318,
        0.59945248,  0.80860817,  0.75258012,  0.64590009,  0.7665215 ,
        1.07262536,  0.30056898, -0.00319354,  0.60502925,  0.77703391,
        1.10967803,  0.70340858,  0.36648756,  1.17299956,  0.68591857,
        0.87238944,  0.35397888,  0.29997517,  0.960665  , -0.05687151,
        0.21038429,  0.2654329 ,  0.00298914,  1.25103845,  0.90200896,
        0.6245337 ,  0.60636119,  1.10160036,  0.72509245,  1.03859804,
       -0.11098893,  0.9544871 ,  0.64364698,  0.81414189,  0.55850174,
        0.86443662,  1.20780829,  0.49474224,  0.73065513, -0.08184096,
        0.2660605 ])

In [23]:
lr_model_fn.score(X_train, y_train)

0.5254123430004067

In [24]:
lr_model_fn.score(X_test, y_test)

0.4558675261000401

### 6. Постройте матрицу классификации и отчет о классификации для обученной модели для обучающей и тестовой выборок. Проинтерпретируйте полученные значения.

In [25]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, classification_report

In [26]:
y_test_pred = lr_model.predict(x_test)
y_train_pred = lr_model.predict(x_train)

In [27]:
y_train_pred_binary = (y_train_pred >= 0.5).astype(int)
confusion_matrix(y_train, y_train_pred_binary)

array([[ 22,  89],
       [ 31, 100]])

In [28]:
y_test_pred_binary = (y_test_pred >= 0.5).astype(int)
confusion_matrix(y_test, y_test_pred_binary)

array([[13, 14],
       [14, 20]])

In [29]:
print(classification_report(y_test, y_test_pred_binary))

              precision    recall  f1-score   support

           0       0.48      0.48      0.48        27
           1       0.59      0.59      0.59        34

    accuracy                           0.54        61
   macro avg       0.53      0.53      0.53        61
weighted avg       0.54      0.54      0.54        61



### 7. Подсчитайте для построенной модели значение всех метрик эффективности классификации на тестовой и обучающей выборках. Нужно использовать следующие метрики: accuracy, precision, recall, f1.

In [30]:
metrics = pd.DataFrame({
    "Train": [
        accuracy_score(y_train, y_train_pred_binary),
        precision_score(y_train, y_train_pred_binary),
        recall_score(y_train, y_train_pred_binary),
        f1_score(y_train, y_train_pred_binary),
    ],
    "Test": [
        accuracy_score(y_test, y_test_pred_binary),
        precision_score(y_test, y_test_pred_binary),
        recall_score(y_test, y_test_pred_binary),
        f1_score(y_test, y_test_pred_binary),
    ],
}, index = ["Accuracy", "Precision", "Recall", "F1"])

metrics

Unnamed: 0,Train,Test
Accuracy,0.504132,0.540984
Precision,0.529101,0.588235
Recall,0.763359,0.588235
F1,0.625,0.588235


## Задания для самостоятельного выполнения

### 1. Повторите анализ для других видов моделей. Используйте 5-10 разных классов моделей. Подсчитывайте только метрики на тестовой выборке.

In [31]:
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier, BaggingClassifier
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import roc_auc_score, accuracy_score, f1_score
from sklearn.model_selection import cross_val_score

In [32]:
def train_and_evaluate_models_classification(X_train, X_test, y_train, y_test):
    models = {
        "Логистическая регрессия": LogisticRegression(max_iter=1000),
        "Метод опорных векторов (линейное ядро)": SVC(kernel='linear', probability=True),
        "Метод опорных векторов (гауссовое ядро)": SVC(kernel='rbf', probability=True),
        "Метод ближайших соседей": KNeighborsClassifier(),
        "Дерево решений": DecisionTreeClassifier(),
        "Случайный лес": RandomForestClassifier(),
        "Градиентный бустинг": GradientBoostingClassifier(),
        "Беггинг": BaggingClassifier(),
        "Многослойный перцептрон": MLPClassifier(max_iter=1000)
    }

    for model_name, model in models.items():
        model.fit(X_train, y_train)
        y_pred = model.predict(X_test)
        y_pred_proba = model.predict_proba(X_test) # Берём вероятность положительного класса
        
        roc_auc = roc_auc_score(y_test, y_pred_proba, multi_class="ovr")
        accuracy = accuracy_score(y_test, y_pred)
        f1 = f1_score(y_test, y_pred, average="weighted")

        cv_score = cross_val_score(model, X_train, y_train, cv=5, scoring='f1_weighted').mean()

        print(f"{model_name}:")
        print(f"  ROC-AUC: {roc_auc:.4f}")
        print(f"  Accuracy: {accuracy:.4f}")
        print(f"  F1-score: {f1:.4f}")
        print(f"  Кросс-валидация (F1-score): {cv_score:.4f}\n")


In [33]:
from sklearn.datasets import load_iris
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)
classification_results = train_and_evaluate_models_classification(X_train, X_test, y_train, y_test)
print("Classification Results:")
print(classification_results)

Логистическая регрессия:
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9657

Метод опорных векторов (линейное ядро):
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9574

Метод опорных векторов (гауссовое ядро):
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9477



  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)


Метод ближайших соседей:
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9393

Дерево решений:
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9410

Случайный лес:
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9493

Градиентный бустинг:
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9410

Беггинг:
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9331

Многослойный перцептрон:
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9657

Classification Results:
None


### 2. Повторите анализ для другого датасета по вашему выбору. Используйте несколько моделей для сравнения. Используйте датасет для множественной классификации.

In [None]:
from sklearn.datasets import load_wine
wine = load_wine()
X_train, X_test, y_train, y_test = train_test_split(wine.data, wine.target, test_size=0.2, random_state=42)
classification_results_wine = train_and_evaluate_models_classification(X_train, X_test, y_train, y_test)
print("\nMulti-class Classification Results (Wine Dataset):")
print(classification_results_wine)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

Логистическая регрессия:
  ROC-AUC: 1.0000
  Accuracy: 0.9722
  F1-score: 0.9722
  Кросс-валидация (F1-score): 0.9427

Метод опорных векторов (линейное ядро):
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9426

Метод опорных векторов (гауссовое ядро):
  ROC-AUC: 0.8439
  Accuracy: 0.8056
  F1-score: 0.8024
  Кросс-валидация (F1-score): 0.6027

Метод ближайших соседей:
  ROC-AUC: 0.8828
  Accuracy: 0.7222
  F1-score: 0.7222
  Кросс-валидация (F1-score): 0.6539

Дерево решений:
  ROC-AUC: 0.9521
  Accuracy: 0.9444
  F1-score: 0.9440
  Кросс-валидация (F1-score): 0.9143



  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)
  mode, _ = stats.mode(_y[neigh_ind, k], axis=1)


Случайный лес:
  ROC-AUC: 1.0000
  Accuracy: 1.0000
  F1-score: 1.0000
  Кросс-валидация (F1-score): 0.9713



### 3. Повторите анализ для датасета, предназначенного для решения задачи регрессии. Используйте все метрики качества регрессии, изученные на лекции. Постройте 5 - 10 разных моделей регрессии.

In [None]:
import numpy as np
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, Ridge, Lasso, ElasticNet
from sklearn.svm import SVR
from sklearn.neighbors import KNeighborsRegressor
from sklearn.ensemble import RandomForestRegressor, BaggingRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.model_selection import cross_val_score

In [None]:
def train_and_evaluate_models(X_train, X_test, y_train, y_test):
    models = {
        "Линейная регрессия": LinearRegression(),
        "Гребневая регрессия": Ridge(),
        "Лассо регрессия": Lasso(),
        "ElasticNet регрессия": ElasticNet(),
        "Метод опорных векторов (без ядра)": SVR(kernel='linear'),
        "Метод опорных векторов (гауссовое ядро)": SVR(kernel='rbf'),
        "Метод опорных векторов (полиномиальное ядро)": SVR(kernel='poly'),
        "Метод ближайших соседей": KNeighborsRegressor(),
        "Многослойный перцептрон": MLPRegressor(max_iter=1000),
        "Дерево решений": DecisionTreeRegressor(),
        "Случайный лес": RandomForestRegressor(),
        "Беггинг": BaggingRegressor()
    }

    for model_name, model in models.items():
        model.fit(X_train, y_train)
        y_pred = model.predict(X_test)
        
        # Метрики
        r2 = r2_score(y_test, y_pred)
        mae = mean_absolute_error(y_test, y_pred)
        mse = mean_squared_error(y_test, y_pred)
        rmse = np.sqrt(mse)
        
        # Кросс-валидация - промежуточный этап оценки модели
        cv_score = cross_val_score(model, X_train, y_train, cv=5, scoring='r2').mean()

        # Выводим результаты
        print(f"{model_name}:")
        print(f"  R²: {r2:.4f}")
        print(f"  MAE: {mae:.4f}")
        print(f"  MSE: {mse:.4f}")
        print(f"  RMSE: {rmse:.4f}")
        print(f"  Кросс-валидация: {cv_score:.4f}\n")

In [None]:
diabetes = load_diabetes()
X, y = diabetes.data, diabetes.target

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
train_and_evaluate_models(X_train, X_test, y_train, y_test)

Линейная регрессия:
  R²: 0.4526
  MAE: 42.7941
  MSE: 2900.1936
  RMSE: 53.8534
  Кросс-валидация: 0.4493

Гребневая регрессия:
  R²: 0.4192
  MAE: 46.1389
  MSE: 3077.4159
  RMSE: 55.4745
  Кросс-валидация: 0.3802

Лассо регрессия:
  R²: 0.3576
  MAE: 49.7303
  MSE: 3403.5757
  RMSE: 58.3402
  Кросс-валидация: 0.3238

ElasticNet регрессия:
  R²: -0.0025
  MAE: 63.7059
  MSE: 5311.2128
  RMSE: 72.8781
  Кросс-валидация: -0.0216

Метод опорных векторов (без ядра):
  R²: 0.0203
  MAE: 61.9045
  MSE: 5190.3877
  RMSE: 72.0443
  Кросс-валидация: -0.0263

Метод опорных векторов (гауссовое ядро):
  R²: 0.1821
  MAE: 56.0237
  MSE: 4333.2860
  RMSE: 65.8277
  Кросс-валидация: 0.1122

Метод опорных векторов (полиномиальное ядро):
  R²: 0.2822
  MAE: 51.6617
  MSE: 3803.0441
  RMSE: 61.6688
  Кросс-валидация: 0.1794

Метод ближайших соседей:
  R²: 0.4302
  MAE: 42.7708
  MSE: 3019.0755
  RMSE: 54.9461
  Кросс-валидация: 0.3172





Многослойный перцептрон:
  R²: 0.3925
  MAE: 47.5081
  MSE: 3218.4649
  RMSE: 56.7315
  Кросс-валидация: 0.3779

Дерево решений:
  R²: 0.0602
  MAE: 54.2809
  MSE: 4979.0449
  RMSE: 70.5623
  Кросс-валидация: -0.0931

Случайный лес:
  R²: 0.4218
  MAE: 44.5292
  MSE: 3063.2860
  RMSE: 55.3470
  Кросс-валидация: 0.3923

Беггинг:
  R²: 0.3405
  MAE: 48.1169
  MSE: 3494.2620
  RMSE: 59.1123
  Кросс-валидация: 0.3702



**1. Почему для анализа модели нужно применять несколько метрик эффективности?**

Для более точной и комплексной оценки модели важно учитывать несколько метрик эффективности, потому что каждая метрика отражает разные аспекты работы модели. Например, точность может быть высокой, но при этом модель может не учитывать важные классы или проявлять сильные ошибки для некоторых типов данных. Использование нескольких метрик помогает избежать искажений, улучшает понимание модели и её слабых мест.

**2. Зачем для анализа качества модели делить датасет на обучающую и тренировочную выборки?**

Деление датасета на обучающую и тестовую выборки позволяет:
- Избежать переобучения (overfitting) — когда модель слишком хорошо подгоняется под данные, на которых обучалась, и не может обобщать на новых данных.
- Проверить обобщающую способность модели — насколько хорошо модель будет работать на данных, которые она не видела раньше.
- Получить объективную оценку качества модели, которая не будет завышенной из-за использования тех же данных для обучения и тестирования.

**3. В чем особенность и область применения каждой метрики качества?**

- **Точность (Accuracy)**: Применяется, когда важен общий процент правильных предсказаний по всем классам. Не подходит для дисбалансированных классов.
- **Точность (Precision)**: Используется, когда важно минимизировать ложные срабатывания (например, в задаче обнаружения спама). Хорошо подходит для работы с редкими событиями.
- **Полнота (Recall)**: Используется, когда важно минимизировать ложные пропуски (например, в задаче медицинского диагностики, где важно не пропустить больного пациента).
- **F1-меры**: Комбинированная метрика для учета как точности, так и полноты, используется, когда нужно сбалансировать оба аспекта.
- **ROC-AUC (Area Under the Curve)**: Используется для оценки модели на дисбалансированных данных. AUC измеряет способность модели различать классы.
- **MSE (Mean Squared Error)**: Используется в регрессии, когда важна минимизация ошибок предсказания.
- **MAE (Mean Absolute Error)**: Применяется, когда важно минимизировать абсолютную ошибку (не учитывая квадраты ошибок), например, для предсказания времени.

**4. Для каждой метрики классификации и регрессии придумайте пример, в котором данная метрика будет определяющей для выбора наилучшей модели.**

- **Точность (Accuracy)**: Для задачи классификации изображений, где важно, чтобы общая точность модели была как можно выше, например, для распознавания лиц на фото.
- **Точность (Precision)**: В задаче классификации спама, когда важно минимизировать количество ложных срабатываний.
- **Полнота (Recall)**: В медицинской диагностике для выявления заболеваний, где важно, чтобы модель не пропускала больных людей (например, для рака).
- **F1-меры**: В задачах, где нужно сбалансировать точность и полноту, например, для классификации редких событий в кредитных карточках.
- **ROC-AUC**: В задаче классификации заболеваний, где классы сильно дисбалансированы (например, больных и здоровых).
- **MSE (Mean Squared Error)**: В задаче прогнозирования стоимости недвижимости, где важна точность прогноза.
- **MAE (Mean Absolute Error)**: В задаче прогнозирования температуры, где важна минимизация абсолютной ошибки, независимо от её направления.

**5. В каких случаях нельзя делить выборку случайным образом?**

Делить выборку случайным образом не следует в следующих случаях:
- **Временные ряды**: Если данные имеют зависимость от времени (например, экономические показатели), случайное деление может нарушить временную последовательность.
- **Группировка данных**: Когда данные имеют определенные группы или кластеризацию, случайное деление может привести к неравномерному распределению этих групп между обучающей и тестовой выборками.
- **Дисбаланс классов**: Когда один из классов сильно преобладает, случайное разделение может привести к тому, что тестовая выборка не будет отражать реальное распределение данных. В таких случаях следует использовать методы стратификации.

**6. Зачем нужен и как использовать отчет о классификации?**

Отчет о классификации (classification report) в sklearn предоставляет сводную информацию о метриках точности, полноты, F1-меры и поддержке для каждого класса. Он полезен для:
- Оценки качества модели по различным классам, особенно когда классы дисбалансированы.
- Сравнения работы модели по различным меткам или категориям.
- Быстрой диагностики проблем модели, например, если модель плохо работает на одном из классов, несмотря на высокую общую точность.