In [1]:
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
from scipy import stats

In [2]:
fp = np.array([173, 175, 180, 178, 177, 185, 183, 182], dtype=np.float64)
hp = np.array([177, 179, 180, 188, 177, 172, 171, 184, 180], dtype=np.float64)
lf = np.array([172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170], dtype=np.float64)

n1 = fp.shape[0]
n2 = hp.shape[0]
n3 = lf.shape[0]

### Найдем средний рост для каждой выборки:

In [3]:
fp_mean = fp.mean()
hp_mean = hp.mean()
lf_mean = lf.mean()

fp_mean, hp_mean, lf_mean

(179.125, 178.66666666666666, 172.72727272727272)

### Найдем среднее значение роста по всем значениям:

In [4]:
y = np.concatenate([fp, hp, lf])
print(y)

[173. 175. 180. 178. 177. 185. 183. 182. 177. 179. 180. 188. 177. 172.
 171. 184. 180. 172. 173. 169. 177. 166. 180. 178. 177. 172. 166. 170.]


In [5]:
y_mean = y.mean()
y_mean

176.46428571428572

### Найдем сумму квадратов отклонений наблюдений от общего среднего и остаточную сумму квадратов отклонений:

In [6]:
S2_F = n1 * (fp_mean - y_mean) ** 2 + n2 * (hp_mean - y_mean) ** 2 + n3 * (lf_mean - y_mean) ** 2
S2_res = ((fp - fp_mean) ** 2).sum() + ((hp - hp_mean) ** 2).sum() + ((lf - lf_mean) ** 2).sum()
S2_F, S2_res

(253.9074675324678, 577.0568181818182)

In [7]:
S2_F + S2_res

830.964285714286

### Найдем факторную и остаточную дисперсии:

In [8]:
k = 3
n = n1 + n2 + n3

k1 = k - 1
k2 = n - k

sigma2_F = S2_F / k1
sigma2_res = S2_res / k2

sigma2_F, sigma2_res

(126.9537337662339, 23.08227272727273)

### Рассчет Fh

In [9]:
Fh = sigma2_F / sigma2_res
Fh

5.500053450812598

### Рассчет F_crit из таблицы критических точек распределения Фишера-Снедекора для заданного уровня значимости 𝛼 двух степеней свободы

In [10]:
alpha = 0.05

F_crit = stats.f.ppf(1 - alpha, k1, k2)
F_crit

3.3851899614491687

### Fh превышает F_crit, значит выборки имеют разные средние значения