###Задача 1

Даны значения зарплат из выборки выпускников: 
```
100, 80, 75, 77, 89, 33, 45, 25, 65, 17, 30, 230, 24, 57, 55, 70, 75, 65, 84, 90, 150
```
Используя только встроенные питоновские функции и структуры данных (т.е. без библиотек `numpy`, `pandas` и др.), посчитайте (несмещённое) среднее квадратичное отклонение для данной выборки.

###Решение

Для начала найдем дисперсию этой выборки:

In [3]:
a = [100, 80, 75, 77, 89, 33, 45, 25, 65, 17, 30, 230, 24, 57, 55, 70, 75, 65, 84, 90, 150]
a_mean = sum(a)/len(a)
a_mean

73.14285714285714

In [4]:
def variance(l: list):
    """Несмещенная дисперсия
    """
    n = len(l)
    l = map(lambda x: (x - a_mean) ** 2, l)
    
    return sum(l)/(n-1)

In [5]:
variance(a)

2241.8285714285716

Теперь найдем среднеквадратическое отклонение:

In [8]:
STD = variance(a)**0.5
print(round(STD, 8))

47.34795214


###Задача 2

Найдите число выбросов в выборке из задачи 1. Для определения выбросов используйте методику как при построении "усов" в `boxplot`, однако, как и в задаче 1, пользоваться можно только встроенными функциями и структурами данных.

###Решение

Для определения выбросов в выборке нам необходимо знать интерквартильный размах. Поэтому, для начала определим функцию для поиска квантилей.

In [10]:
def quantile(l: list, order: float) -> float:
    """Квантиль порядка `order` по списку `l`.
    """
    l = sorted(l)
    n = len(l)
    n_left_elements = int(n * order)
    n_right_elements = int(n * (1 - order))
    
    if n_left_elements + n_right_elements == n:
        return (l[n_left_elements - 1] + l[n_left_elements]) / 2
    else:
        assert n_left_elements + n_right_elements == n - 1
        
        return l[n_left_elements]

Найдем 1-ый, 2-ой (медиана) и 3-ий квартили:

In [13]:
print(quantile(a, 0.25))
print(quantile(a, 0.5))
print(quantile(a, 0.75))

45
70
84


И интеркавартильный размах:

In [14]:
IQD = quantile(a, 0.75) - quantile(a, 0.25)
IQD

39

Теперь найдем размер достоверной выборки:

In [15]:
boxplot_range = (quantile(a, 0.25) - 1.5 * IQD, quantile(a, 0.75) + 1.5 * IQD)
boxplot_range

(-13.5, 142.5)

Значения, лежащие за этими пределами, являются выбросами:

In [16]:
outliers = []
for i in a:
  if (i < boxplot_range[0]) or (i > boxplot_range[1]):
    outliers.append(i)
print(outliers)

[230, 150]


###Задача 3

В университет на факультет A поступило 100 человек, на факультет B - 90 человек и на факультет C - 45 человек. Вероятность того, что студент с факультета A сдаст первую сессию, равна 0.6. Для студента с факультета B эта вероятность равна 0.7, а для студента с факультета C - 0.8. Случайным образом выбирается студент, сдавший первую сессию. Какое событие наиболее вероятно:

студент учится на факультете A,
студент учится на факультете B,
студент учится на факультете C?

###Решение

Для начала определим события. Пусть $A$, $B$, $C$ — события, заключающиеся в том, что случайным образом взятый студент учится, соответственно, на факультете $A$, $B$ или $C$. Кроме того, пусть событие $S$ обозначает, что случайным образом взятый студент сдал первую сессию. Для решения задачи нам нужно посчитать условные вероятности
$$P(A|S), \: P(B|S), \: P(C|S)$$
Данные вероятности можно посчитать с помощью формулы Байеса.
Оценим вероятности $P(A)$, $P(B)$ и $P(C)$:

In [17]:
A = 100
B = 90
C = 45

p_A = A / (A+B+C)
p_B = B / (A+B+C)
p_C = C / (A+B+C)

p_A, p_B, p_C

(0.425531914893617, 0.3829787234042553, 0.19148936170212766)

Из условий задачи вероятности $P(S | A)$, $P(S | B)$, $P(S | C)$ равны:

In [18]:
p_SA = 0.5
p_SB = 0.6
p_SC = 0.7

Для того, чтобы посчитать вероятность $P(S)$, нам понадобится формула полной вероятности: $$P(S) = P(S | A) \cdot P(A) + P(S | B) \cdot P(B) + P(S | C) \cdot P(C)$$

In [19]:
p_S = p_SA * p_A + p_SB * p_B + p_SC * p_C
p_S

0.5765957446808511

Применяем формулу Байеса для каждого факультета:

In [21]:
p_AS = p_SA * p_A / p_S
p_BS = p_SB * p_B / p_S
p_CS = p_SC * p_C / p_S

p_AS, p_BS, p_CS

(0.36900369003690037, 0.3985239852398524, 0.23247232472324722)

Ответ: наиболее вероятно, что выбранный студент учится на факультете $B$.