# Умова задачі

Протягом 50 років вимірювався рівень води навесні під час повені відносно умовного нуля. Результати вимірювання наведено у
вигляді інтервального статистичного розподілу:

|$x_i$  | 0-24  | 24-48 | 48-72 | 72-96 | 96-120 | 120-144 | 144-168 | 168-192 | 192-216 |
|:----: | :---: | :---: | :---: | :---: | :----: | :-----: | :-----: | :-----: | :-----: |
|$n_i$  | 1     | 2     | 4     | 6     | 12     | 16      | 6       | 2       | 1       |

За заданими статистичними розподілами вибірки висунути $ H_0 $ про закон розподілу ознаки генеральної сукупності і при рівні значущості $ \alpha = 0,01 $ перевірити її правильність.

# Розв'язок

Гіпотеза $ H_0 $ - генеральна сукупність відповідає закону нормального розподілу.

Для перевірки висунутої гіпотези спочатку визначимо середні значення інтервалів $ x_i $ статистичної вибірки:

|$x_i$  |   12  |   36  |   60  |   84  |   108  |   132   |   156   |   180   |   204   |
|:---   | :---: | :---: | :---: | :---: | :----: | :-----: | :-----: | :-----: | :-----: |
|$n_i$  | 1     | 2     | 4     | 6     | 12     | 16      | 6       | 2       | 1       |

Обчислимо вибіркове середнє $ \overline{x_в} $, де $ n =50 $ :

$ \overline{x_B} = \cfrac{1}{n} \sum{x_i * n_i} = $

In [1]:
1/50*(12*1 + 36*2 + 60*4 + 84*6 + 108*12 + 132*16 + 156*6 + 180*2 + 204*1)

114.72

Обчислимо дисперсію $ D_в $ та середнє квадратичне відхилення вібірки $ \sigma_в $:

$ D_в = \cfrac{1}{n}\sum{x_i^2 * n_i} - (\overline{x_в})^2 = $

In [3]:
round(1/50*(12**2*1 + 36**2*2 + 60**2*4 + 84**2*6 + 108**2*12 + 132**2*16 + 156**2*6 + 180**2*2 + 204**2*1) - (114.72**2), 2)

1452.44

$ \sigma_в = \sqrt{D_в} = $

In [4]:
round(1452.44**0.5, 2)

38.11

На основі відомих інтервалів $(\alpha_{𝑖−1}, \alpha_{i}]$ визначимо інтервали $(z_{𝑖−1}, z_{i}]$:

$z_{𝑖−1} =\cfrac{\alpha_{𝑖−1}−\overline{x_в}}{\sigma_в}$

$z_{𝑖} =\cfrac{\alpha_{𝑖}−\overline{x_в}}{\sigma_в} $

При цьому визначаємо, що $ z_0 = −∞ $, а $ z_9 = +∞ $

Тепер обчислимо значення $z_{1}, z_{2}, z_{3}, z_{4}, z_{5}, z_{6}, z_{7}, z_{8} $:

In [3]:
aver_x = 114.72
aver_sqr_x = 38.11
list_x = [24, 48, 72, 96, 120, 144, 168, 192]
list_z = []
for i in range(len(list_x)):
    z = round((list_x[i] - aver_x)/aver_sqr_x, 2)
    list_z.append(z)
print(list_z)

[-2.38, -1.75, -1.12, -0.49, 0.14, 0.77, 1.4, 2.03]


З таблиці значень функції $\phi{(z)}$ для інтегральної теореми Муавра-Лапласа знайдемо значення $\phi{(z_{i-1}})$,  $\phi{(z_i)}$ та обчислимо теоретичну ймовірность $p_i$ для відповідних значень:

In [4]:
fi_0 = -0.5
fi_1 = -0.4913
fi_2 = -0.4599
fi_3 = -0.3686
fi_4 = -0.1879
fi_5 = 0.0557
fi_6 = 0.2794
fi_7 = 0.4192
fi_8 = 0.4788
fi_9 = 0.5
p = []
p.append(round(fi_1-fi_0, 4))
p.append(round(fi_2-fi_1, 4))
p.append(round(fi_3-fi_2, 4))
p.append(round(fi_4-fi_3, 4))
p.append(round(fi_5-fi_4, 4))
p.append(round(fi_6-fi_5, 4))
p.append(round(fi_7-fi_6, 4))
p.append(round(fi_8-fi_7, 4))
p.append(round(fi_9-fi_8, 4))
print(p)

[0.0087, 0.0314, 0.0913, 0.1807, 0.2436, 0.2237, 0.1398, 0.0596, 0.0212]


Пересвідчимось у правильності зроблених розрахунків (сума $p_i$ має дорівнювати $1$):

In [9]:
print(round(sum(p), 4))

1.0


Тепер можемо обчислити теоретичну частоту $\overline{n_i}$:

In [19]:
pn = []
for i in p:
    pn.append(round(i*50, 4))
print(pn)

[0.435, 1.57, 4.565, 9.035, 12.18, 11.185, 6.99, 2.98, 1.06]


Пересвідчимось у правильності зроблених розрахунків (сума $n_i$ має дорівнювати $50$):

In [17]:
print(round(sum(pn), 0))

50.0


Отримані результати відобразимо у вигляді таблиці:

|i  |($z_{i-1}$; $z_i$]|Ф($z_{i-1}$)     |Ф($z_{i}$)    |$p_i$ |$\overline{n_i}$|
|:-:|:----------------:|:---------------:|:------------:|:----:|:--------------:|
|1  |(−∞;-2,38]        |-0,5             |-0,4913       |0,087 |0.0             |
|2  |(-2,38;-1,75]     |-0,4913          |-0,4599       |0,314 |2.0             |
|3  |(-1,75; -1,12]    |-0,4599          |-0,3686       |0,0913|5.0             |
|4  |(-1,12; -0,49]    |-0,3686          |-0,1879       |0,1807|9.0             |
|5  |(-0,49; 0,14]     |-0,1879          |0,0557        |0,2436|12.0            |
|6  |(0,14; 0,77]      |0,0557           |0,2794        |0,2237|11.0            |
|7  |(0,77; 1,4]       |0,2794           |0,4192        |0,1398|7.0             |
|8  |(1,4; 2,03]       |0,4192           |0,4788        |0,0596|3.0             |
|9  |(2,03; +∞)        |0,4788           |0,5           |0,0212|1.0             |

Перевіримо висунуту гіпотезу $H_0$ шляхом обчислення емпіричного значення критерію узгодження Пірсона за формулою:

$ K_{емп} = \cfrac{\displaystyle\sum_{i=1}^{m}{(n_i - \overline{n_i})^2}}{\overline{n_i}} $

In [29]:
n_exp = [1, 2, 4, 6, 12, 16, 6, 2, 1]
k_emp = []
for i in range(len(n_theor)):
    k_emp.append((n_exp[i] - pn[i])**2/pn[i])
print("Емпіричне значення критерію узгодження Пірсона:", round(sum(k_emp), 1))

Емпіричне значення критерію узгодження Пірсона: 4.5


З таблиці критичних точок розподілу $\chi^2$ при рівні значущості $ \alpha = 0,01 $ і кількості ступенів вільності
$r = m - s - 1 = 9 - 2 - 1 = 6 $ знаходимо, що $k_{кр} = 16,8.$

Таким чином, $К_{емп} = 4,5, k_{кр} = 16,8 $, отже $ К_{емп} < k_{кр} $ і тому ми приймаємо гіпотезу $ H_0 $ (генеральна сукупність відповідає закону нормального розподілу).