In [103]:
import numpy as np
from scipy.stats import norm, t

### Задача 1.
Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, равным 16. Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

СКО задано => решаю через Z-критерий по формуле:
$$T_{1,2} = \overline{X} \pm Z_{\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} $$

In [104]:
sko   = 16
M     = 80
n     = 256
alpha = 1 - 0.95

Z = norm.ppf( alpha / 2)
# print(f'Z = {round(Z, 6)}')

T1 = M + Z * sko / np.sqrt(n)
T2 = M - Z * sko / np.sqrt(n)

print(f'Доверительный интервал = [{round(T1, 6)}, {round(T2, 6)}]')

Доверительный интервал = [78.040036, 81.959964]


### Задача 2.
В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные: 6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1 Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

СКО не задано => решаю через t-критерий Стьюдента по формуле:
$$T_{1,2} = \overline{X} \pm t_{\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} $$

In [105]:
x = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])
print(x)
print()

M = x.mean()
print(f'M     (средняя по выборке)        = {round(M, 6)}')

sko = np.sqrt(x.var(ddof = 1))
print(f'СКО   (для несмещенной дисперсии) = {round(sko, 6)}')

alpha = 1 - 0.95 
print(f'Aplha (уровень значимости)        = {round(alpha, 6)}')

n = 10
v = n - 1
print(f'v     (число степеней свободы)    = {v}')

t_crit = t.ppf(alpha/2, 9)
print(f't     (статистический критерий)   = {round(t_crit, 6)}')
print()

T1 = M + t_crit * sko / np.sqrt(n)
T2 = M - t_crit * sko / np.sqrt(n)

print(f'Доверительный интервал = [{round(T1, 6)}, {round(T2, 6)}]')

[6.9 6.1 6.2 6.8 7.5 6.3 6.4 6.9 6.7 6.1]

M     (средняя по выборке)        = 6.59
СКО   (для несмещенной дисперсии) = 0.450802
Aplha (уровень значимости)        = 0.05
v     (число степеней свободы)    = 9
t     (статистический критерий)   = -2.262157

Доверительный интервал = [6.267516, 6.912484]


### Задача 3.
3. Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм.
Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр
оказался равным 17.5 мм, а дисперсия известна и равна 4 кв.мм

In [106]:
mu0 = 17
alpha = 0.05
n = 100
D = 4
mu = 17.5

* Гипотеза H0: mu = mu0
* Гипотеза H1: mu > mu0   

In [107]:
# Найдем Сигму для выборочной совокупности
sigma = np.sqrt(D) / np.sqrt(n)
print(f'Сигма выборки             = {sigma}')
print()

Z = norm.ppf(1 - alpha)
print(f'Z-критерий                = {round(Z, 6)}')

# Найдем число сигм между mu и mu0
count_sigm = (mu - mu0) / sigma
print(f'Число сигм между mu и mu0 = {count_sigm}')

Сигма выборки             = 0.2

Z-критерий                = 1.644854
Число сигм между mu и mu0 = 2.5


#### Вывод
* mu находится на расстоянии 2.5 сигмы от mu0 и лежит правее критерия значимости alpha 
* Гипотеза H0 отклоняется и верна гипотеза H1

### Задача 4.
Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190. Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%?

* Гипотеза H0: mu = mu0
* Гипотеза H1: mu <> mu0   

In [108]:
mu0 = 200
x = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
print()

mu = x.mean()
print(f'mu     (средняя по выборке)        = {round(mu, 6)}')

sko = np.sqrt(x.var(ddof = 1))
print(f'СКО   (для несмещенной дисперсии) = {round(sko, 6)}')

sigma = sko / np.sqrt(n)
print(f'Сигма выборки                     = {round(sigma, 6)}')

alpha = 1 - 0.99
print(f'Aplha (уровень значимости)        = {round(alpha, 6)}')

n = 10
v = n - 1
print(f'v     (число степеней свободы)    = {v}')
print()

t_crit = t.ppf(alpha/2, 9)
print(f't     (статистический критерий)   = {round(t_crit, 6)}')

# Найдем число сигм между mu и mu0
count_sigm = (mu0 - mu) / sigma
print(f'Число сигм между mu и mu0         = {round(count_sigm, 6)}')


mu     (средняя по выборке)        = 198.5
СКО   (для несмещенной дисперсии) = 4.453463
Сигма выборки                     = 0.445346
Aplha (уровень значимости)        = 0.01
v     (число степеней свободы)    = 9

t     (статистический критерий)   = -3.249836
Число сигм между mu и mu0         = 3.368165


#### Вывод
* mu находится на расстоянии 1.065 сигмы от mu0 и лежит внутри интервала значимости alpha
* Гипотеза H0 верна и гипотеза H1 отклоняется