## 1.4 Меры центральной тенденции

### Основные определения:

Типы описательной статистики:
1) Меры центральной тенденции - позволяет определить, насколько *высокие* значения принимает распределение;
2) Меры изменчивости - вариативность распределения.

**Мода** - это значение признака, которое встречается максимально часто. В выборке может быть несколько мод.  

**Медиана** - это значение признака, которое делит упорядочное множество пополам. Если множество содержит чётное количество элементов, то берётся среднее из двух серединных элементов упорядочного множества.

**Среднее значение** - сумма всех значений измеренного признака делённое на количество измеренных значений.

### Свойства среднего значения
1) Если к каждому значению
выборки прибавить число **c**, то среднее значение увеличится на это число;
2) Если каждое значению выборки умножить на число **c**, то среднее значение увеличится в **с** раз;
3) Если для каждого значения выборки рассчитать отклонение от среднего арифметического, то сумма таких отклонений будет = 0.

### Примеры:
![image.png](attachment:image.png)
*Красная линия* - Мода  
*Зеленая линия* - Медиана  
*Синяя линия* - Среднее значение

In [2]:
'''Самостоятельный расчет моды, медианы и среднего'''
nums = [int(i) for i in '185 175 170 169 171 175 157 172 170 172 167 173 168\
        167 166 167 169 172 177 178 165 161 179 159 164 178 172 170 173 171'.split()]

def get_mode(num_list):
    counts_of_num = {}
    for i in num_list:
        if i in counts_of_num:
            counts_of_num[i] += 1
        else:
            counts_of_num[i] = 1
            
    count = max(counts_of_num.values())         
    mode = max(counts_of_num, key=lambda key: counts_of_num[key])
    
    return mode, count
           

def get_median(num_list):
    median = 0
    
    num_list = sorted(num_list)
    
    if (len(num_list) / 2) % 1 == 0:
        median += (num_list[len(num_list) // 2 - 1] + num_list[len(num_list) // 2]) / 2
    else:
        median += (num_list[len(num_list) // 2])
        
    return median


def get_mean(num_list):
    mean = sum(num_list) / len(num_list)
    
    return mean


print('Mode =', get_mode(nums)) 
print('Median =', get_median(nums)) 
print('Mean =', get_mean(nums))

Mode = (172, 4)
Median = 170.5
Mean = 170.4


In [4]:
'''Расчёт моды, медианы и среднего с помощью библиотек numpy и scipy'''
import numpy as np
from scipy import stats
sample = np.array([185, 175, 170, 169, 171, 175, 157, 172, 170, 172, 167, 173, 168, 167, 166,
              167, 169, 172, 177, 178, 165, 161, 179, 159, 164, 178, 172, 170, 173, 171])

print('mode =', stats.mode(sample, keepdims=False))
print('median =', np.median(sample))
print('mean =', np.mean(sample))

mode = ModeResult(mode=172, count=4)
median = 170.5
mean = 170.4


In [5]:
'''Расчёт моды, медианы и среднего с помощью библиотеки pandas'''
import pandas as pd
sample = pd.Series([185, 175, 170, 169, 171, 175, 157, 172, 170, 172, 167, 173, 168, 167, 166,
              167, 169, 172, 177, 178, 165, 161, 179, 159, 164, 178, 172, 170, 173, 171])

print('mode =', sample.mode())
print('median =', sample.median())
print('mean =', sample.mean())

mode = 0    172
dtype: int64
median = 170.5
mean = 170.4
