In [1]:
import numpy as np
from scipy import stats

### Задача 1.

#### Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16.
#### Найти ширину доверительного интервала для оценки математического ожидания mu с надёжностью 0.95,
#### если выборочное среднее равно 80, а объём выборки равен 256.

In [2]:
# дано:

std = 16 # среднее квадратическое отклонение
p = 0.95 # уровень доверия
mean = 80 # выборочное среднее
n = 256 # объём выборки

print(f'Среднее квадратическое отклонение = {std}\nУровень доверия = {p}\nВыборочное среднее = {mean}\nОбъём выборки = {n}')

Среднее квадратическое отклонение = 16
Уровень доверия = 0.95
Выборочное среднее = 80
Объём выборки = 256


In [3]:
alpha = 1 - p # уровень значимости

# считаем квантили:

t1 = stats.norm.ppf(alpha / 2)
t2 = stats.norm.ppf(1 - alpha / 2)

t1, t2

(-1.959963984540054, 1.959963984540054)

In [4]:
# найдём ширину доверительного интервала:

print(f'Ширина доверительного интервала = {round((mean + t2 * std / np.sqrt(n)) - (mean + t1 * std / np.sqrt(n)), 8)}')

Ширина доверительного интервала = 3.91992797


### Задача 2.

#### Продавец утверждает, что средний вес пачки печенья составляет 200 г.
#### Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:
#### 202, 203, 199, 197, 195, 201, 200, 204, 194, 190
#### Известно, что их веса распределены нормально.
#### Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%?
#### Найдите P-значение для данного теста и укажите его в качестве ответа.

In [5]:
# дано:

mean = 200 # средний вес пачки
samples = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190]) # выборка с весами пачек
alpha = 0.01 # уровень значимости

print(f'Средний вес пачки = {mean}\nВыборка с весами пачек: {samples}\nУровень значимости = {alpha}')

Средний вес пачки = 200
Выборка с весами пачек: [202 203 199 197 195 201 200 204 194 190]
Уровень значимости = 0.01


In [6]:
# посчитаем объём выборки:

n = samples.shape[0]

print(f'Объём выборки = {n}')

Объём выборки = 10


In [7]:
# считаем квантили:

t1 = stats.t.ppf(alpha / 2, df=n - 1)
t2 = stats.t.ppf(1 - alpha / 2, df=n - 1)

t1, t2

(-3.24983554401537, 3.2498355440153697)

In [8]:
# для подсчёта статистики используем t-статистику, поскольку мы не знаем дисперсию:

S = (samples.mean() - mean) / (samples.std(ddof=1) / np.sqrt(n))

S

-1.0651074037450896

In [9]:
# найдём P-значение:

p_left = stats.t.cdf(S, df=n - 1) # левая сторона
p_right = 1 - stats.t.cdf(S, df=n - 1) # правая сторона

pvalue = round(2 * min(p_left, p_right), 8) # P-значение

print(f'P-значение = {pvalue}')

P-значение = 0.3145666


### Задача 3.

#### Дана выборка диаметров подшипников из примера 1 с занятия 5:
#### samples = [0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134, 1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784,
#### 1.1168, 1.1372, 0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02]
#### Предполагая, что диаметры подшипников распределены нормально, проверьте гипотезу о том,
#### что дисперсия случайной величины равна 0.0625 при уровне значимости alpha = 0.05.
#### Что для этого нужно знать:
#### 1. Альтернативная гипотеза двусторонняя.
#### 2. Статистика для теста: H = (n - 1) * sample_variance / variance, где n - число элементов в выборке,
#### sample_variance - несмещённая оценка дисперсии, variance - утверждаемая нулевой гипотезой дисперсия.
#### 3. Эта статистика в предположении верности нулевой гипотезы имеет распределение хи-квадрат с параметром df = n - 1.
#### Её квантили можно найти с помощью функции scipy.stats.chi2.ppf.
#### В качестве ответа запишите 1, если нулевая гипотеза верна, и 0 иначе.

In [10]:
# выборка диаметров подшипников:

samples = np.array([0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
                    1.2088, 1.701, 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
                    0.7273, 1.3958, 0.8665, 1.5112, 1.161, 1.0232, 1.0865, 1.02])

In [11]:
# дано:

variance = 0.0625 # дисперсия
alpha = 0.05 # уровень значимости

print(f'Дисперсия = {variance}\nУровень значимости = {alpha}')

Дисперсия = 0.0625
Уровень значимости = 0.05


In [12]:
# посчитаем объём выборки:

n = samples.shape[0]

print(f'Объём выборки = {n}')

Объём выборки = 24


In [13]:
# найдём несмещённую оценку дисперсии

sample_variance = np.sum((samples - samples.mean()) ** 2) / (n - 1)

print(f'Несмещённая оценка дисперсии = {sample_variance}')

Несмещённая оценка дисперсии = 0.07804495041666669


In [14]:
# вычисляем значение статистики:

H = (n - 1) * sample_variance / variance

print(f'Значение статистики = {H}')

Значение статистики = 28.720541753333343


In [15]:
# считаем квантили:

t1 = stats.chi2.ppf(alpha / 2, df=n - 1)
t2 = stats.chi2.ppf(1 - alpha / 2, df=n - 1)

t1, t2

(11.688551922452438, 38.0756272503558)

In [16]:
print('Так как альтернативная гипотеза - двусторонняя, то критическая область имеет вид t1 < H < t2')
print()
print('H больше t1 и меньше t2. Соответственно, выдвинутую гипотезу H0 можно принять')

Так как альтернативная гипотеза - двусторонняя, то критическая область имеет вид t1 < H < t2

H больше t1 и меньше t2. Соответственно, выдвинутую гипотезу H0 можно принять


In [17]:
if t1 < H < t2:
    print('Ответ: 1')
else:
    print('Ответ: 0')

Ответ: 1
