## Статистические тесты  
  
_________________________________________________________________________________________________________________________________________________________________

In [1]:
import numpy as np

from scipy.stats import shapiro
from scipy.stats import ttest_ind
from scipy.stats import f_oneway
from scipy.stats import mannwhitneyu
from scipy.stats import chi2_contingency
from scipy.stats import pearsonr, spearmanr
from statsmodels.tsa.stattools import adfuller

### 1. Shapiro-Wilk Test

#### Shapiro-Wilk Test проверяет, соответствуют ли данные нормальному распределению. 

#### Гипотезы
- **$H_0:$**  Данные распределены нормально.
- **$H_1:$**  Данные не распределены нормально.

#### Формула
Статистика теста вычисляется как:
$$
W = \frac{\left(\sum_{i=1}^n a_i x_{(i)}\right)^2}{\sum_{i=1}^n (x_i - \bar{x})^2}
$$
где:
- $x_{(i)}$ — i-е упорядоченное значение данных,
- $a_i$ — веса, зависящие от ожидаемых значений нормального распределения,
- $\bar{x}$ — среднее значение данных.

#### Тестовая статистика
- **$W$-статистика:** показывает, насколько данные соответствуют нормальному распределению.
  - $W \to 1$: данные ближе к нормальному распределению.
  - $W \to 0$: данные существенно отклоняются от нормального распределения.

#### Использование
Если $p$-value > 0.05, нулевая гипотеза принимается (данные нормальны).

In [2]:
data = [12, 14, 15, 13, 16, 18, 19]
stat, p = shapiro(data)
print("Shapiro-Wilk Test statistic:", stat)
print("p-value:", p)

if p > 0.05:
    print("Данные распределены нормально.")
else:
    print("Данные не распределены нормально.")

Shapiro-Wilk Test statistic: 0.9621089100837708
p-value: 0.8366110920906067
Данные распределены нормально.


### 2. t-тест для сравнения средних

#### Описание
t-тест используется для сравнения средних значений двух групп.

#### Гипотезы
- **$H_0:$** Средние значения двух групп равны.
- **$H_1:$** Средние значения различаются.

#### Формула
$$
t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}
$$
где:
- $\bar{X}_1, \bar{X}_2$ — средние значения групп,
- $s_1^2, s_2^2$ — дисперсии групп,
- $n_1, n_2$ — размеры выборок.

#### Тестовая статистика
- **$t$-статистика:** измеряет разницу между средними значениями относительно их дисперсий.
  - Большой модуль $t$: сильное различие между средними.
  - Малый модуль $t$: слабое или отсутствующее различие.

#### Использование
Если $p$-value > 0.05, нулевая гипотеза принимается (средние равны).

In [3]:
group1 = [12, 14, 15, 13, 16, 18, 19]
group2 = [15, 16, 17, 18, 14, 19, 20]

t_stat, p = ttest_ind(group1, group2)
print("t-statistic:", t_stat)
print("p-value:", p)

if p > 0.05:
    print("Средние значения не отличаются статистически значимо.")
else:
    print("Средние значения отличаются.")


t-statistic: -1.3529628504050915
p-value: 0.20100859296298734
Средние значения не отличаются статистически значимо.


### 3. ANOVA (Analysis of Variance)

#### Описание
ANOVA используется для проверки равенства средних значений между более чем двумя группами.

#### Гипотезы
- **$H_0:$** Средние значения всех групп равны.
- **$H_1:$** Средние значения хотя бы одной группы отличаются.

#### Формула
Статистика $F$:
$$
F = \frac{MS_{between}}{MS_{within}}
$$
где:
- $MS_{between} = \frac{SS_{between}}{k - 1}$,
- $MS_{within} = \frac{SS_{within}}{N - k}$,
- $SS_{between}$ — сумма квадратов между группами,
- $SS_{within}$ — сумма квадратов внутри групп,
- $k$ — число групп,
- $N$ — общее число наблюдений.

#### Тестовая статистика
- **$F$-статистика:** показывает отношение межгрупповой дисперсии к внутригрупповой.
  - $F \approx 1$: группы похожи.
  - $F \gg 1$: группы существенно различаются.

#### Использование
Если $p$-value > 0.05, нулевая гипотеза принимается (средние равны).

In [4]:
group1 = [12, 14, 15, 13, 16]
group2 = [15, 16, 17, 18, 14]
group3 = [19, 20, 21, 22, 23]

f_stat, p = f_oneway(group1, group2, group3)
print("F-statistic:", f_stat)
print("p-value:", p)

if p > 0.05:
    print("Нет статистически значимых различий между группами.")
else:
    print("Есть статистически значимые различия между группами.")

F-statistic: 26.0
p-value: 4.3451786041259766e-05
Есть статистически значимые различия между группами.


### 4. Mann-Whitney U Test

#### Описание
Непараметрический тест для сравнения двух групп. Используется, когда данные не нормальны.

#### Гипотезы
- **$H_0:$** Распределения значений в двух группах равны.
- **$H_1:$** Распределения различаются.

#### Формула
$$
U = R_1 - \frac{n_1 (n_1 + 1)}{2}
$$
где:
- $R_1$ — сумма рангов первой группы,
- $n_1$ — размер первой группы.

#### Тестовая статистика
- **$U$-статистика:** отражает разницу между рангами двух групп.
  - Меньшее значение $U$: сильные различия между группами.
  - Большое значение $U$: группы похожи.

#### Использование
Если $p$-value > 0.05, нулевая гипотеза принимается (распределения равны).

In [5]:
group1 = [12, 14, 15, 13, 16, 18, 19]
group2 = [15, 16, 17, 18, 14, 19, 20]

u_stat, p = mannwhitneyu(group1, group2)
print("U-statistic:", u_stat)
print("p-value:", p)

if p > 0.05:
    print("Нет значимых различий между группами.")
else:
    print("Есть значимые различия между группами.")

U-statistic: 14.5
p-value: 0.22224108935543152
Нет значимых различий между группами.


### 5. Chi-Square Test

#### Описание
Chi-Square Test проверяет независимость категориальных переменных.

#### Гипотезы
- **$H_0:$** Переменные независимы.
- **$H_1:$** Переменные зависимы.

#### Формула
$$
\chi^2 = \sum \frac{(O - E)^2}{E}
$$
где:
- $O$ — наблюдаемая частота,
- $E$ — ожидаемая частота.

#### Тестовая статистика
- **$\chi^2$-статистика:** измеряет степень отклонения наблюдаемых частот от ожидаемых.
  - Большое $\chi^2$: существенные различия между ожидаемыми и наблюдаемыми значениями.
  - Малое $\chi^2$: значения близки к ожидаемым.

#### Использование
Если $p$-value > 0.05, нулевая гипотеза принимается (переменные независимы).

In [6]:
# Матрица частот наблюдений
data = [[50, 30], [20, 40]]  # Например, результаты A/B теста
chi2, p, dof, expected = chi2_contingency(data)

print("Chi2 statistic:", chi2)
print("p-value:", p)
print("Degrees of freedom:", dof)
print("Expected frequencies:", expected)

if p > 0.05:
    print("Нет зависимости между переменными.")
else:
    print("Есть зависимость между переменными.")

Chi2 statistic: 10.529166666666667
p-value: 0.0011750518530845063
Degrees of freedom: 1
Expected frequencies: [[40. 40.]
 [30. 30.]]
Есть зависимость между переменными.


### 6. Корреляция

#### Описание
Тесты корреляции измеряют связь между двумя переменными. 

#### Формулы
**Корреляция Пирсона**:
$$
r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}
$$

**Ранговая корреляция Спирмена**:
$$
\rho = 1 - \frac{6 \sum d_i^2}{n (n^2 - 1)}
$$
где:
- $d_i$ — разность рангов,
- $n$ — количество наблюдений.

#### Тестовая статистика
- **$r$ (Pearson):** линейная зависимость.
- **$\rho$ (Spearman):** ранговая зависимость.
  - Близко к 1: сильная положительная связь.
  - Близко к -1: сильная отрицательная связь.

#### Использование
Если $p$-value < 0.05, связь статистически значима.

In [7]:
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# Pearson
pearson_corr, p_pearson = pearsonr(x, y)
print("Pearson correlation:", pearson_corr)
print("p-value:", p_pearson)

# Spearman
spearman_corr, p_spearman = spearmanr(x, y)
print("Spearman correlation:", spearman_corr)
print("p-value:", p_spearman)

Pearson correlation: 1.0
p-value: 0.0
Spearman correlation: 0.9999999999999999
p-value: 1.4042654220543672e-24


### 7. Проверка стационарности временного ряда (Dickey-Fuller Test)

#### Описание
Dickey-Fuller Test используется для проверки стационарности временного ряда.

#### Гипотезы
- **$H_0:$** Временной ряд имеет единичный корень (нестационарен).
- **$H_1:$** Временной ряд стационарен.

#### Формула
Тест основан на следующем регрессионном уравнении:
$$
\Delta y_t = \alpha + \beta t + \gamma y_{t-1} + \sum_{i=1}^p \phi_i \Delta y_{t-i} + \varepsilon_t
$$
где:
- $\Delta y_t = y_t - y_{t-1}$ — разности временного ряда,
- $\gamma$ — коэффициент, который проверяется на значимость,
- $\phi_i$ — параметры лагов разностей,
- $\varepsilon_t$ — белый шум.

#### Тестовая статистика
- **ADF-статистика:** оценивает, отличается ли $\gamma$ от нуля.
  - Меньшее значение ADF-статистики (отрицательное): более вероятно, что ряд стационарен.
  - Большее значение: ряд нестационарен.

#### Использование
- Если $p$-value < 0.05, нулевая гипотеза отвергается (ряд стационарен).
- Если $p$-value > 0.05, нулевая гипотеза принимается (ряд нестационарен).


In [8]:
time_series = [112, 118, 132, 129, 121, 135, 148, 148, 136, 119]

result = adfuller(time_series)
print("ADF Statistic:", result[0])
print("p-value:", result[1])

if result[1] > 0.05:
    print("Временной ряд нестационарный.")
else:
    print("Временной ряд стационарный.")

ADF Statistic: -2.4349864374587464
p-value: 0.13210419851109995
Временной ряд нестационарный.


### 8. Bootstrap Test

#### Описание
Bootstrap — это метод повторной выборки данных, используемый для оценки статистик (например, среднего, медианы) и доверительных интервалов.

#### Принцип
1. Из исходных данных многократно выбираются случайные подвыборки с возвращением.
2. Для каждой подвыборки вычисляется статистика (например, среднее).
3. На основе распределения полученных статистик строятся доверительные интервалы.

#### Формула
Пусть $X = \{x_1, x_2, ..., x_n\}$ — исходные данные, а $T(X)$ — статистика, которую нужно оценить. 
Доверительный интервал вычисляется как:
$$
CI = \left[ \text{Percentile}(2.5\%), \text{Percentile}(97.5\%) \right]
$$
где:
- $\text{Percentile}(2.5\%)$ — нижний перцентиль,
- $\text{Percentile}(97.5\%)$ — верхний перцентиль.

#### Тестовая статистика
- Зависит от цели анализа. Например:
  - Среднее: $\bar{x} = \frac{1}{n} \sum_{i=1}^n x_i$.
  - Медиана: центральное значение упорядоченного набора.

#### Использование
Bootstrap позволяет:
- Оценить надежность статистики,
- Построить доверительные интервалы,
- Работать с малым объемом данных или данными без предположений о распределении.

In [9]:
data = [12, 14, 15, 13, 16, 18, 19]

# Функция для повторной выборки
bootstrap_samples = [np.mean(np.random.choice(data, size=len(data), replace=True)) for _ in range(1000)]

# Доверительный интервал
ci_lower = np.percentile(bootstrap_samples, 2.5)
ci_upper = np.percentile(bootstrap_samples, 97.5)
print(f"95% доверительный интервал: [{ci_lower}, {ci_upper}]")

95% доверительный интервал: [13.428571428571429, 17.142857142857142]
