In [40]:
import numpy as np
from scipy.stats import norm

In [41]:
# 1. Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, 
# равным 16. Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, 
# если выборочная средняя M = 80, а объем выборки n = 256.

# Решение: сигма ген. совокупности известна (16), используем z-критерий в формуле доверительного интервала
#  M ± z(a/2) * std / sqrt(n)

M = 80  # выборочная средняя
a = (1 - 0.95)  # уровень значимости 5 %
n = 256  # объем выборки
sigma = 16  # среднеквадратичное отклонение

print(f'Доверительный интервал: [{M + norm.ppf(a/2) * sigma / np.sqrt(n)}; {M - norm.ppf(a/2) * sigma / np.sqrt(n)}]')

Доверительный интервал: [78.04003601545995; 81.95996398454005]


In [42]:
# 2. В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, 
# получены опытные данные: 6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1 Предполагая, что результаты 
# измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X 
# при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

# Решение: сначала рассчитаем сигму и среднее для опытных данных
# Будем использовать t-критерий, т.к. сигма ген.совокупности неизвестна

x = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])
D = np.var(x, ddof=1)  # оценка дисперсии, несмещенная
M = np.mean(x)
print(f'M={M} D={D}')

t = 2.262  # значение для объема выборки 10 и 95% дов.интервала
n = 10
print(f'Доверительный интервал: [{M - t * np.sqrt(D/n)}; {M + t * np.sqrt(D/n)}]')

M=6.590000000000001 D=0.2032222222222223
Доверительный интервал: [6.267538255912426; 6.912461744087575]


In [43]:
# 3. Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм.
# Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр
# оказался равным 17.5 мм, а дисперсия известна и равна 4 кв.мм.

# Решение: через тестирование гипотезы
# mu0 - нулевая гипотеза = диаметр шарика H0=17 мм
# mu1 - альтернативная гипотеза, mu1 > mu0, H1=17.5 мм
# Используем z-критерий, т.к. дисперсия ген.выборки известна
# Требуется сравнить z-критерий табличный и z-критерий наблюдаемый.

# Сигма выборки будет равна sqrt(D/n) = sqrt(4/100) = 2/10 мм
# 
Zn = (17.5-17) / (2/10)  # наблюдаемый
Zt = norm.ppf(0.95)   # табличный
print(f'Zn={Zn}, Zt={Zt}, Zn>Zt => верна гипотеза mu1')

Zn=2.5, Zt=1.6448536269514722, Zn>Zt => верна гипотеза mu1


In [44]:
# 4. Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. 
# Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190. Известно, что их веса распределены 
# нормально. Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%?

# Решение: используем t-критерий (критерий Стьюдента), есть только сама выборка
# mu0 - нулевая гипотеза, H0=200 г.
# Делаем двусторонний тест mu1 <> mu0, H1 <> H0

# Рассчитаем сигму по выборке
x = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
D = np.var(x, ddof=1)  # оценка дисперсии, несмещенная
M = np.mean(x)
print(f'M={M} D={D}')
sigma = np.sqrt(D)
print(f'sigma={sigma}')

n = 10  # объем выборки
Tt = 3.250 # табличный для n=10 и вероятности 0.005, т.к. критерий двусторонний (1%/2=0.5%)

Tn = (200 - M) / np.sqrt(D/n)  # наблюдаемый
print(f'Tn={Tn}, Tt={Tt}, Tn>Tt => верна гипотеза mu0')

M=198.5 D=19.833333333333332
sigma=4.453463071962462
Tn=1.0651074037450896, Tt=3.25, Tn>Tt => верна гипотеза mu0
