### Задача 1

Объясняемая переменная y зависит от двух категориальных факторов __A__ и __B__, причём фактор __A__ имеет 3 уровня, а фактор __B__ - 4 уровня. 

Результаты наблюдений приведены в таблице:

y = [[2.68, 3.29, 2.88, 4.45],
[4.12, 4.96, 5.09, 5.22],
[5.52, 4.50, 5.42, 5.29]]

С помощью двухфакторного дисперсионного анализа проверьте влияние каждого из факторов на переменную __y__.

In [23]:
import numpy as np
from scipy import stats

y = np.array([[2.68, 3.29, 2.88, 4.45], 
     [4.12, 4.96, 5.09, 5.22], 
     [5.52, 4.50, 5.42, 5.29]])

Для вычисления значений статистик нам  понадобятся оценки дисперсий:
$$S_a^2 = k \cdot \displaystyle\sum_{i=1}^m \left( \overline{Y_{i \ast}} - \overline{Y} \right)^2, \:\:
S_b^2 = m \cdot \displaystyle\sum_{j=1}^k \left( \overline{Y_{\ast j}} - \overline{Y} \right)^2, \:\:
S_w^2 = \displaystyle\sum_{i=1}^m \displaystyle\sum_{j=1}^k \left( y_{ij} - \overline{Y_{i \ast}} - \overline{Y_{\ast j}} + \overline{Y} \right)^2$$

_Замечание_. Первая сумма — отклонения между уровнями фактора $a$, вторая — между уровнями фактора $b$, третья — внутригрупповые отклонения.

Оценки дисперсий:
$$\sigma_a^2 = \dfrac{S_a^2}{m - 1}, \:\: \sigma_b^2 = \dfrac{S_b^2}{k - 1}, \:\:
\sigma_w^2 = \dfrac{S_w^2}{(k - 1) (m - 1)}$$

Напомним, что в двухфакторном дисперсионном анализе мы проверяем две гипотезы (отдельная гипотеза о влиянии каждого из факторов). Итак, статистика для гипотезы о влиянии фактора $a$:
$$F_a = \dfrac{\sigma_a^2}{\sigma_w^2}$$

В предположении верности гипотезы $H_{0a}$ эта статистика имеет распределение Фишера с параметрами $k_{1a} = m - 1$, $k_{2a} = n - m$. Далее, как обычно, строится критическая область (правосторонняя, поскольку распределение Фишера имеет один хвост), и проводится тест.

Аналогично, для гипотезы о влиянии фактора $b$ статистика:
$$F_b = \dfrac{\sigma_b^2}{\sigma_w^2}$$

Она также имеет распределение Фишера, теперь с параметрами $k_{1b} = k - 1$, $k_{2b} = n - k$.

In [3]:
a1_mean = y[0].mean()
a2_mean = y[1].mean()
a3_mean = y[2].mean()

a1_mean,a2_mean, a3_mean

(3.325, 4.8475, 5.1825)

In [16]:
b1_mean = y[:,[0]].mean()
b2_mean = y[:,[1]].mean()
b3_mean = y[:,[2]].mean()
b4_mean = y[:,[3]].mean()

b1_mean,b2_mean, b3_mean, b4_mean

(4.1066666666666665, 4.25, 4.463333333333334, 4.986666666666667)

In [17]:
y_mean = y.mean()
y_mean

4.451666666666666

In [21]:
S2_a = 4 * ((a1_mean - y_mean) ** 2 + (a2_mean - y_mean) ** 2 + (a3_mean - y_mean) ** 2)

S2_b = 3 * ((b1_mean - y_mean) ** 2 + (b2_mean - y_mean) ** 2 + (b3_mean - y_mean) ** 2 \
            + (b4_mean - y_mean) ** 2)

S2_w = ((y[0, [0]] - a1_mean - b1_mean + y_mean) ** 2) + ((y[1, [0]] - a2_mean - b1_mean + y_mean) ** 2)\
+ ((y[2, [0]] - a3_mean - b1_mean + y_mean) ** 2) + ((y[0, [1]] - a1_mean - b2_mean + y_mean) ** 2) \
+ ((y[1, [1]] - a2_mean - b2_mean + y_mean) ** 2) + ((y[2, [1]] - a3_mean - b2_mean + y_mean) ** 2) \
+ ((y[0, [2]] - a1_mean - b3_mean + y_mean) ** 2) + ((y[1, [2]] - a2_mean - b3_mean + y_mean) ** 2) \
+ ((y[2, [2]] - a3_mean - b3_mean + y_mean) ** 2) + ((y[0, [3]] - a1_mean - b4_mean + y_mean) ** 2) \
+ ((y[1, [3]] - a2_mean - b4_mean + y_mean) ** 2) + ((y[2, [3]] - a3_mean - b4_mean + y_mean) ** 2)

S2_a, S2_b, S2_w

(7.8407166666666654, 1.338166666666669, array([1.92988333]))

In [19]:
# оценки дисперсий:

sigma2_a = S2_a / 2
sigma2_b = S2_b / 3
sigma2_w = S2_w[0] / (3*2)

sigma2_a, sigma2_b, sigma2_w

(3.9203583333333327, 0.4460555555555563, 0.3216472222222222)

In [20]:
# проверяем две гипотезы:
Fa = sigma2_a / sigma2_w
Fb = sigma2_b / sigma2_w
Fa, Fb

(12.188379262995172, 1.3867850388192748)

In [25]:
# уровень значимости α=0.05 . Для него найдём критические значения Fcrit:
alpha = 0.05
F_crit_a = stats.f.ppf(1 - alpha, 2, 9)
F_crit_b = stats.f.ppf(1 - alpha, 3, 8)
F_crit_a, F_crit_b

(4.25649472909375, 4.06618055135116)

Fb < F_crit_b , поэтому гипотезу, что фактор b не влияет на значение объясняемой переменной, оставляем в силе.

### Задача 2

Прикрепите ссылку на курсовой проект на github (см. выбор темы в ДЗ к Уроку 6).

Курсовая работа по теории вероятностей и математической статистике [здесь](https://github.com/Art260679/Mathematics/blob/master/Probability%20theory%20and%20mathematical%20statistics/Курсовая%20работа%20по%20теории%20вероятностей%20и%20математической%20статистике.ipynb)
