In [None]:
# Создание массива для проверки
import numpy as np


mean = 165  # Средний рост
std_dev = 10  # Стандартное отклонение
size = 100   # Количество элементов в массиве

# Генерация массива с ростом женщин
heights = np.random.normal(mean, std_dev, size)

# Округление значений до целых чисел
heights = np.round(heights).astype(int)

print(heights)
print(type(heights))

[161 163 173 169 164 154 161 159 184 192 173 172 153 157 159 166 175 182
 172 165 170 155 150 181 175 180 177 170 163 168 159 169 161 161 168 160
 157 168 171 169 153 175 169 171 147 175 151 167 164 161 158 162 170 164
 165 168 174 161 179 160 163 156 162 158 163 165 164 171 156 175 177 162
 173 164 173 142 176 163 164 164 157 163 167 158 133 163 159 162 159 169
 174 152 158 161 178 146 162 169 165 149]
<class 'numpy.ndarray'>


### Функция для вычисления стандартного отклонения случайной величины;

#### Среднее значение

$$ M(X) = \sum \limits_{i=1}^{n} \frac{x_i}{n} $$

In [None]:
import numpy as np

def mean(x):
  """
    Вычисление среднего числа по массиву

    :param x: Массив
    :type x: список, np.ndarray
    :return: Среднее
    :rtype: float
  """
  sum = 0
  for i in range(len(x)):
    sum += x[i]
  return sum / len(x)

#### Дисперсия

$$ s^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2 $$

In [None]:
def variance(x: np.ndarray):
  """
    Вычисление дисперсии

    :param x: Массив
    :type x: np.ndarray
    :return: Дисперсия
    :rtype: float
  """
  mu = mean(x)
  sum = 0

  for i in range(len(x)):
    sum += (x[i] - mu) ** 2
  return sum / len(x)

#### Стандартное отклонение случайной величины

$$ s = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2} $$

In [None]:
def standard_deviation(x: np.ndarray):
  """
    Вычисление среднего отклонения

    :param x: Массив
    :type x: np.ndarray
    :return: Среднее отклонение
    :rtype: float
  """
  return round(np.sqrt(variance(x)), 2)

### Функции для вычисления ошибок MSE, MAE, accuracy, precision, recall, f1 score.

Функции должны принимать два параметра y_pred, y_true.

См. аналогичные функции из библиотеки sklearn;

#### Среднеквадратическая ошибка (MSE)

$$ MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 $$

In [None]:

# Массивы для проверки
true_value = [110, 200, 300]
prediction_value = [90, 210, 290]

def mean_squared_error(y_pred: list, y_true:list):
  """
    Вычисление среднеквадратической ошибки

    :param y_pred: Массив с предсказанным значением
    :type y_pred: list
    :param y_true: Массив с реальным значением
    :type y_true: list
    :return: Среднеквадратическая ошибка
    :rtype: float
  """
  difference = []

  for i in range(len(y_true)):
    difference.append((y_true[i] - y_pred[i]) ** 2)

  mean_val = mean(x=difference)
  return mean_val
print(mean_squared_error(prediction_value, true_value))

200.0


#### Средняя абсолютная ошибка (MAE)

$$ MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| $$

In [None]:
import numpy as np
# Массивы для проверки
true_value = [120, 200, 300]
prediction_value = [90, 210, 290]

def mean_absolute_error(y_pred: list, y_true:list):
  """
    Вычисление средней абсолютной ошибки

    :param y_pred: Массив с предсказанным значением
    :type y_pred: list
    :param y_true: Массив с реальным значением
    :type y_true: list
    :return: Средняя абсолютная ошибка
    :rtype: float
  """
  difference = []
  n = len(y_true)

  for i in range(n):
    difference.append(abs(y_true[i] - y_pred[i]))


  mean_val = mean(x=difference)
  # return diff

mean_absolute_error(prediction_value, true_value)

#### Accuracy

$$ Accuracy =  \frac{TP + TN}{TP + TN + FP + FN} $$

In [6]:
import numpy as np
# Массивы для проверки
true_value =       [0, 1, 1, 0, 0, 1]
prediction_value = [0, 1, 0, 1, 1, 1]

def accuracy(y_pred: list, y_true:list):
  """
    Вычисление accuracy

    :param y_pred: Массив с предсказанным значением
    :type y_pred: list
    :param y_true: Массив с реальным значением
    :type y_true: list
    :return: accuracy
    :rtype: float
  """
  T = 0
  n = len(y_true)

  for i in range(len(y_true)):
    if y_true[i] == y_pred[i]:
      T += 1

  return T/len(y_true)



accuracy(prediction_value, true_value)

0.5

#### Precision

$$ Precision =  \frac{TP}{TP + FP} $$

In [5]:
# Массивы для проверки
true_value =       [0, 1, 1, 0, 0, 1]
prediction_value = [0, 1, 0, 1, 1, 1]

def precision (y_pred: list, y_true:list):
  """
    Вычисление precision

    :param y_pred: Массив с предсказанным значением, может быть только 0 или 1
    :type y_pred: list
    :param y_true: Массив с реальным значением, может быть только 0 или 1
    :type y_true: list
    :return: precision
    :rtype: float
  """
  TP = 0
  TN = 0
  FP = 0
  FN = 0
  n = len(y_true)

  for i in range(len(y_true)):
    if y_true[i] == y_pred[i] and y_true[i] == 0:
      TN += 1
    elif y_true[i] == y_pred[i] and y_true[i] == 1:
      TP += 1
    elif y_true[i] > y_pred[i]:
      FN += 1
    elif y_true[i] < y_pred[i]:
      FP += 1

  return TP/(TP + FP)



precision(prediction_value, true_value)

0.5

#### Recall

$$ Recall =  \frac{TP}{TP + FN} $$

In [8]:
# Массивы для проверки
true_value =       [0, 1, 1, 0, 0, 1]
prediction_value = [0, 1, 0, 1, 1, 1]

def recall (y_pred: list, y_true:list):
  """
    Вычисление Recall

    :param y_pred: Массив с предсказанным значением, может быть только 0 или 1
    :type y_pred: list
    :param y_true: Массив с реальным значением, может быть только 0 или 1
    :type y_true: list
    :return: recall
    :rtype: float
  """
  TP = 0
  TN = 0
  FP = 0
  FN = 0
  n = len(y_true)

  for i in range(len(y_true)):
    if y_true[i] == y_pred[i] and y_true[i] == 0:
      TN += 1
    elif y_true[i] == y_pred[i] and y_true[i] == 1:
      TP += 1
    elif y_true[i] > y_pred[i]:
      FN += 1
    elif y_true[i] < y_pred[i]:
      FP += 1

  return TP/(TP + FN)



recall(prediction_value, true_value)

0.6666666666666666

#### F1 score


$$ F1-score = 2 \times \frac{Precision \times Recall}{Precision + Recall} $$


In [9]:
# Массивы для проверки
true_value =       [0, 1, 1, 0, 0, 1]
prediction_value = [0, 1, 0, 1, 1, 1]

def f1_score (y_pred: list, y_true:list):
  """
    Вычисление Recall

    :param y_pred: Массив с предсказанным значением, может быть только 0 или 1
    :type y_pred: list
    :param y_true: Массив с реальным значением, может быть только 0 или 1
    :type y_true: list
    :return: F1 score
    :rtype: float
  """
  pre = precision(y_pred, y_true)
  rc = recall(y_pred, y_true)




  return 2 * ((pre * rc) / (pre + rc))



f1_score(prediction_value, true_value)

0.5714285714285715