In [2]:
import numpy as np 
import scipy.stats as ss
import matplotlib.pyplot as plt
import scipy.stats as ss

# Контрльная задача

Моя нейронка решает 89% задач из 100, другая 85%
Узнать моя лучше или хуже

### 1. Z-тест для одной доли

Здесь мы проверяем гипотезу о том, что доля успехов нашей нейросети (89%) статистически значимо отличается от известной доли 85%. 

- **Нулевая гипотеза ($H_0$)**: Истинная доля успехов нашей сети равна 85% ($p = 0.85$).
- **Альтернативная гипотеза ($H_1$)**: Истинная доля успехов не равна 85% ($p \neq 0.85$).

Мы вычисляем Z-статистику по формуле:
$$ Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} $$
где $\hat{p}$ — выборочная доля (0.89), $p_0$ — гипотетическая доля (0.85), $n$ — размер выборки (100).

Затем мы сравниваем полученное значение `t` (1.12) с критическими значениями для уровня значимости $\alpha=0.05$ (это -1.96 и 1.96). Поскольку `t` находится внутри этого интервала, мы не можем отвергнуть нулевую гипотезу. Это означает, что статистически значимой разницы между 89% и 85% в данном случае нет.

In [None]:
x = 89 / 100
n = 100
t = (x - 0.85) / np.sqrt(0.85 * (1 - 0.85) / n) 
D = ss.norm(0, 1)
print(t)
print(D.ppf(0.025), D.ppf(0.975))
if (t < D.ppf(0.025) or t > D.ppf(0.975)):
  print("Наша нейронная сеть хуже работает") # Ошибка
else:
  print("Наша нейронная сеть лучше работает")
  # Если попадает в диапазон, то не изменилось
  # Если больше диапазона, то лучше 
  # Если меньше диапазона, то хуже

1.1202240672224086
-1.9599639845400545 1.959963984540054
Наша нейронная сеть лучше работает


In [10]:
m0 = 5
s0 = 0.1
n0 = 50
m1 = 4.95
s1 = 0.1
n1 = 15
z = (m0 - m1) / np.sqrt((s0 ** 2 / n0)  + (s1 ** 2 / n1))
print(z)

1.6984155512168875


In [5]:
m0 = 5
s0 = 0.1
n0 = 50
m1 = 4.95
s1 = 0.1
n1 = 15
z = (m0 - m1) / np.sqrt((s0 ** 2) / n0  + (s1 ** 2) / n1)
D = ss.norm(0, 1)
pval = (1 - D.cdf(abs(z))) * 2 #Для двухстороннего интервала
pval

np.float64(0.08942935902899474)

In [6]:
pval = D.cdf(z)
pval

np.float64(0.9552853204855026)

### 3. Расчет необходимого размера выборки

Эта ячейка демонстрирует, как найти минимальный размер выборки (`n1`), необходимый для обнаружения статистически значимой разницы между двумя средними при заданных параметрах (средние, стандартные отклонения, уровень значимости).

Код итерируется по разным значениям `n1` и на каждом шаге вычисляет Z-статистику. Цикл останавливается, когда абсолютное значение Z-статистики превышает критическое значение (1.96 для $\alpha=0.05$), что указывает на достижение статистической значимости.

In [7]:
m0 = 5
s0 = 0.1
n0 = 50
m1 = 4.95
s1 = 0.1
n = 0

for n1 in range(1, 100):
  Z = (m1 - m0) / np.sqrt( ( (s1**2) / n1) + ( (s0**2) / n0) )
  pval = (1 - ss.norm(0, 1).cdf(np.abs(Z))) * 2
  if (abs(Z) > 1.96):
    print(f'n = {n1}')
    break
  # if pval <= 0.05:
  #   print(n1)
  #   print(pval)
  #   break


n = 23


### 4. t-тест Уэлча для двух средних

Этот тест используется для сравнения средних двух независимых выборок, когда нет оснований полагать, что их дисперсии равны. В отличие от Z-теста, он используется, когда дисперсии генеральной совокупности неизвестны и оцениваются по выборкам.

Ключевые шаги:
1. Вычисляется t-статистика `T`.
2. Вычисляется количество степеней свободы `df` по формуле Уэлча-Саттертуэйта. Это значение может быть нецелым.
3. На основе t-статистики и степеней свободы вычисляется p-value.

Здесь p-value (1.73) значительно больше 0.05, что говорит об отсутствии статистически значимых различий между средними `det_m` и `det_s`.

In [8]:
# t-критерий для среднего
det_m = [5, 5.05, 5.01, 4.99, 5, 4.98]
det_s = [4.98, 4.96, 4.9, 4.8,  5.1, 5.0]
m0 = np.mean(det_m)
m1 = np.mean(det_s)
s0 = np.std(det_m)
s1 = np.std(det_s)
n0 = len(det_m)
n1 = len(det_s)
T = (m1 - m0) / np.sqrt( (s1**2 / n1) + (s0**2 / n0))

df = (s1**2 / n1 + s0**2 / n0)**2 / ((s1**2 / n1)**2 / (n1 - 1)) + ((s0**2 / n0)**2 / (n0 -1))
df

D = ss.t(df)
pval = 2 * (1 - D.cdf(T))
T, pval, df
#Работает только при n0 > n1 при s0 > s1

(np.float64(-1.251636618749953),
 np.float64(1.7395429212120466),
 np.float64(5.598377218712051))

In [9]:
import math
n1 = 100
n2 = 105
p1 = 95 / 205
p2 = 100 / 200
p0 = (p1 * n1 + p2 * n2) / (n1 + n2)
z = (p1 - p2) / math.sqrt(p0 * (1 - p0) * (1 / n1 + 1 / n2))
pval = 2 * (1 - ss.norm(0, 1).cdf(z))
z, pval

(-0.5240007848400233, np.float64(1.3997220060174198))