# 8.1. F1-measure

На [лекции](https://colab.research.google.com/drive/12xpYdqi1S4y68FYHym2rZ3wzHSm8cSLm?usp=sharing) мы подробно обсудили, что доля правильных ответов - не самая лучшая метрика оценки качества классификации. Довольно часто доля правильных ответов даёт смещенную оценку качества и способна ввести в заблуждение. По этой причине мы пользуемся метриками качества, которые называются *точностью* и *полнотой*, а также их комбинацией - *F1-мерой*. Ваша задача - реализовать функции `precision`, `recall` и `f1`. На вход всех этих функий подаются два вектора: `y_true`: вектор правильных ответов и `y_pred`: вектор предсказаний.

В рамках выполнения этого задания можно использовать только модуль `numpy`.

In [None]:
import numpy


def precision(y_true, y_pred):
  """
    TODO: Заполните тело функции вычисления точности предсказания
  """

  TP = (y_pred * y_true).sum()
  FP = (y_pred * (1 - y_true)).sum()
  return TP/(TP + FP)

def recall(y_true, y_pred):
  """
    TODO: Заполните тело функции вычисления полноты предсказания
  """
  TP = (y_pred * y_true).sum()
  FN = ((1 - y_pred) * y_true).sum()
  return TP/(TP + FN)

def f1(y_true, y_pred):
  """
    TODO: Заполните тело функции вычисления f1-меры предсказания
  """
  pr = precision(y_true, y_pred)
  rec = recall(y_true, y_pred)
  return 2*pr*rec/(pr+rec)

In [None]:
import numpy as np
from random import shuffle

x_shape = 3
health_X = np.random.randn(950, x_shape)
f = [0] * 850 + [1] * 100
shuffle(f)
health_X[:, 0] = f

ill_x = np.random.randn(50, x_shape)
f = [0] * 10 + [1] * 40
shuffle(f)
ill_x[:, 0] = f

X = np.concatenate((health_X, ill_x))
Y = np.concatenate((np.zeros(950), np.ones(50)))

In [None]:
classifier_1 = lambda x: (x[:,0] == 1).astype(int) # Сравнение с признаком самочувствия
classifier_2 = lambda x: np.zeros_like(x[:,0]) # Константное предсказание

In [None]:
y_1 = classifier_1(X) # Предсказание первого классификатора
y_2 = classifier_2(X) # Предсказание второго классификатора

In [None]:
from sklearn.metrics import precision_score, recall_score, f1_score

pr_1 = precision(Y, y_1)
print(pr_1)
print(precision_score(Y, y_1))

0.2857142857142857
0.2857142857142857


In [None]:
f_1 = f1(Y, y_1)
print(f_1)
print(f1_score(Y, y_1))

0.4210526315789473
0.4210526315789473


In [None]:
rec_1 = recall(Y, y_1)
print(rec_1)
print(recall_score(Y, y_1))

0.8
0.8


## Примечания

1. Проверить себя Вы можете, сравнив свои ответы с функциями `sklearn.metrics.precision_score`, `sklearn.metrics.recall_score` и `sklearn.metrics.f1_score`.

2. В реализуемых функциях запрещается использовать вывод любой информации на экран (в частности, недопустимо использование print()).

3. Для улучшения качества кода мы не рекомендуем заново реализовывать вычисление precision и recall внутри функции f1. Достаточно просто внутри функции f1 вызвать уже реализованные вами ранее функции self.precision() и self.recall().

4. Мы считаем, что в качестве меток классов используется 0 или 1 (случай меток -1 и 1 можно не рассматривать, но для более корректного решения рекомендуем также учесть и эту ситуацию).

5. Реализуемые функции не должны ничего выводить на экран - они должны возвращать значения соответствующих метрик.