## Задача 1

Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти доверительный интервал для оценки математического ожидания mu с надёжностью 0.95, если выборочное среднее равно 80, а объём равен 256.

$\sigma = 16$<br>
p = 0.95<br>
$\overline{X} = 80$<br>
n = 256 <br>
$\alpha = 1-p = 0.05$<br>
Так как у нас нормальное распределение, то доверительный интервал расчитываем по формуле: $$P \left( \overline{X} + t_{\alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}} \leq \mu \leq \overline{X} + t_{1 - \alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}} \right) = p$$
где $t_{\beta}$ — квантиль порядка $\beta$ для стандартного нормального распределения.




In [45]:
from scipy import stats
import numpy as np
def confidence_interval(alpha,x,sigma,n):   
    t1 = stats.norm.ppf(alpha/2)
    t2 = stats.norm.ppf(1 - alpha/2)
    return (x + t1*sigma / np.sqrt(n), x + t2*sigma / np.sqrt(n))
p = 0.95
sigma = 16
alpha = 1 - p
x = 80
n = 256
print("Довериетльный интеравал :", confidence_interval(alpha, x, sigma, n))

Довериетльный интеравал : (78.04003601545995, 81.95996398454005)


***

## Задача 2

Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:

202, 203, 199, 197, 195, 201, 200, 204, 194, 190

Известно, что их веса распределены нормально.<br>
 1. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%?<br>
 2. Найдите P-значение для данного теста.

нулевая гипотеза  M = 200г<br>
n = 10<br>
sample = (202, 203, 199, 197, 195, 201, 200, 204, 194, 190)<br>
номарльное распределение.<br>
alpha = 0.01
Нам надо использовать распределение Стьюдента и t-статистику так как у нас нету среднеквадратичного отклонения.$$t = \dfrac{\overline{X} - \mu}{\sigma_X / \sqrt{n}},$$


In [46]:
def t_statistic(x,M,n,sigma_x):
    return (x - M)/(sigma_x / np.math.sqrt(n))

In [47]:
M = 200
n = 10
alpha = 0.01
sample = np.array((202, 203, 199, 197, 195, 201, 200, 204, 194, 190))
x = sample.mean()
sigma_x = sample.std(ddof=1)

Находим t-статистику.

In [48]:
S_t = t_statistic(x,M,n,sigma_x)
S_t

-1.0651074037450896

считаем критическую область.

In [49]:
t1 = stats.t.ppf(alpha / 2, df=n - 1)
t2 = stats.t.ppf(1 - alpha / 2, df=n - 1)
print(f"(-inf;{t1}),({t2};+inf)")

(-inf;-3.2498355440153697),(3.2498355440153697;+inf)


наша статистика не попала в критическую область, значит наша нулевая гипотеза верна при нашем уровне значимости 0.001

Посчитаем P-значение, для двусторнней области:$$P = 2 \cdot \min (P_l, P_r)$$

In [50]:
p_left = stats.t.cdf(S_t, df=n - 1)
p_right = 1 - stats.t.cdf(S_t, df=n - 1)
pvalue = 2 * min(p_left, p_right)
pvalue


0.3145666035247285

## Задача 3

Дана выборка диаметров подшипников из примера 1 с занятия 5:

sample = \[0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02 \]

Предполагая, что диаметры подшипников распределены нормально, проверьте гипотезу о том, что дисперсия случайной величины равна 0.0625 при уровне значимости alpha = 0.05. Что для этого нужно знать:<br>
1. Альтернативная гипотеза двухсторонняя.<br>
2. Статистика для теста: H = (n - 1) * sample_variance / variance, где n - число элементов в выборке, sample_variance - несмещённая оценка дисперсии, variance - утверждаемая нулевой гипотезой дисперсия.<br>
3. Эта статистика в предположении верности нулевой гипотезы имеет распределение хи-квадрат с параметром df = n - 1. Её квантили можно найти с помощью функции scipy.stats.chi2.ppf.

нормальное распределение.<br>
нулевая гепотиза  - $\sigma^2 = 0.0625$ при $\alpha = 0.05$<br>
альтернативная гипотеза $\sigma^2$ больше либо меньше 0.0625<br>


In [51]:
sample = np.array([0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02])

In [52]:
def statistic(n, D, D_x):
    return (n - 1) * D_x / D

n = len(sample)
D = 0.0625
alpha = 0.05
M = 1
D_x = (sample.std(ddof=1))**2
print(sigma_x)


4.453463071962462


Считаем нашу статистику

In [53]:
H = statistic(n, D, D_x)
H

6.401853165946039

уровень значисмости $\alpha = 0.05$
функция распределения нашей статистики имеет функцию распределения $\chi^2$<br>
так же альтернативная гипотеза двухсторонняя

In [54]:
t1 = stats.chi2.ppf(alpha / 2, df=n - 1)
t2 = stats.chi2.ppf(1 - alpha / 2, df=n - 1)
t1, t2

(11.688551922452438, 38.0756272503558)

то что вне этого отрезка, наша критическая область.<br>
Наша статистика H лежит вне критической области, значит мы принимаем нулевую гипотезу.
