In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
import scipy
from scipy import stats
warnings.filterwarnings('ignore')

##### 1. Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, равным 16 Найти доверительный интервал для оценки математического ожидания с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

Поскольку мы имеем дело с нормальным распределением с известным среднеквадратичным отклонением, то воспользуемся формулой:

$$\overline{X} \pm Z_\frac a2 \cdot \frac{\sigma}{\sqrt{n}}$$
Z-значение нашла из таблицы и из условия, что надежность равна 0,95. 

Z = 1.96

In [2]:
ocenka = 1.96*(16/np.sqrt(256))
print("Доверительный интервал: ", (80 - ocenka, 80 + ocenka))

Доверительный интервал:  (78.04, 81.96)


##### 2. В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные: 6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1 Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

Применим критерий Стьюдента (т.к. СКО генеральной совокупности нам не известно). Доверительный интервал найдем по формуле:

$$\overline{X} \pm t_\frac a2 \cdot \frac{S}{\sqrt{n}}$$
Найдем $\overline{X},$ S и n.

In [3]:
viborka = pd.DataFrame([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])

In [4]:
# Найдем СКО
S = np.sqrt(((viborka[0] - viborka[0].mean())**2).sum() / (viborka[0].count() - 1))
S

0.4508017549014448

In [5]:
# Найдем количество элементов выборки
n = viborka[0].count()
n

10

In [6]:
# Найдем выборочное среднее
X = viborka[0].mean()
X

6.589999999999999

In [7]:
# Найдем t-критерий из таблицы для (0.05, 9). Берем а=1-0.95 (0,95 - доверительная вероятность), 9 = (число элементов выборки-1)
t = 2.262

In [11]:
ocenka = t*(S/np.sqrt(10))
print("Таким образом, можно утверждать, что величина X (с доверительной вероятностью 0.95) находится в интервале: ", (X - ocenka, X + ocenka))

Таким образом, можно утверждать, что величина X (с доверительной вероятностью 0.95) находится в интервале:  (6.267538255912425, 6.912461744087573)


##### 3. Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 кв.мм.

3.1. Формулировка основной и альтернативной гипотез:

    Н0: диаметр = 17 мм, µ =µ0
    Н1: диаметр = 17,5 мм, µ >µ0


3.2. Выбор статистического критерия, на основе которого будет проводиться проверка.

    В качестве критерия выберем Z-критерий, т.к.нам известно СКО генеральной совокупности из условия.


3.3. Выбор уровня значимости $\alpha$.

    Уровень значимости 5%.


3.4. Определение границ области данной гипотезы.

In [23]:
Z = stats.norm.ppf(q = 0.95)
Z

1.6448536269514722

In [24]:
n=100
Zn = (17.5-17)/(2/np.sqrt(n))
Zn

2.5

3.5. Подведение итогов и формулировка вывода.

    Мы получили, что Zn > Z. Следовательно, нулевая гипотеза не верна. 
    Т.о. средний диаметр шариков больше 17 мм с вероятностью 95%.

##### 4. Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190. Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%?

Найдем $\overline{X},$ S и n из выборки

In [26]:
viborka = pd.DataFrame([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])

In [27]:
# Найдем СКО выборки
S = np.sqrt(((viborka[0] - viborka[0].mean())**2).sum() / (viborka[0].count() - 1))
S

4.453463071962462

In [28]:
# Найдем количество элементов выборки
n = viborka[0].count()
n

10

In [38]:
# Найдем выборочное среднее выборки
X = viborka[0].mean()
X

198.5

4.1. Формулировка основной и альтернативной гипотез:

    H0 - Вес пачки равен 200 г
    H1 - Вес пачки не равен 200 г (больше или меньше)

4.2. Выбор статистического критерия, на основе которого будет проводиться проверка.

    Применим критерий Стьюдента (т.к. СКО генеральной совокупности нам не известно).

4.3. Выбор уровня значимости $\alpha$.

    Уровень значимости 0,01 (по 0,005 с каждой стороны).

4.4. Определение границ области данной гипотезы.

In [42]:
# Найдем t для построения 99%-го доверительного интервала, n=10 по таблице: t(0.005, n-1)
t = 3,25

Т.о. Р(|T|>3.25)=0.01 - наш уровень значимости

In [47]:
# найдем t выборки справа
tn_r = (200-X)/S*np.sqrt(n)
tn_r

1.0651074037450896

In [48]:
# найдем t выборки слева
tn_l = (X-200)/S*np.sqrt(n)
tn_l

-1.0651074037450896

4.5. Подведение итогов и формулировка вывода.

    |tn| < |t|, следовательно, нулевая гипотеза верна: средний вес пачки печенья равен 200 г.