<a href="https://colab.research.google.com/github/nuzhand/Python/blob/main/%D0%AD%D0%BC%D0%BF%D0%B8%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Найти асимметрию и эксцесс эмпирического распределения

|||||||||
|-|---|---|---|---|---|---|---|
|$x_i$|10,6|10,8|11,0|11,2|11,4|11,6|11,8|
|$n_i$ |5|10|17|30|20|12|6|


In [1]:
import numpy as np

In [16]:
x_i = np.array([10.6, 10.8, 11, 11.2, 11.4, 11.6, 11.8])
n_i = np.array([5, 10, 17, 30, 20, 12, 6])

$ n = \sum_{i=1}^k n_i $

In [10]:
n = np.sum(n_i)
print(f'n = {n}')

n = 100


$ x̅_B = \frac{1}{n}\sum_{i=1}^k n_i x_i $ - *выборочное среднее*

$ D_B = \frac{1}{n}\sum_{i=1}^k n_i (x_i - x̅_B)^2 $ - *выборочная дисперсия*

$ σ_B = \sqrt D_b $ - *выборочное среднеквадратическое отклонение*

Для вычисления выборочной дисперсии можно использовать более удобную формулу:

$ D_B = \frac{1}{n}\sum_{i=1}^k n_i x_i^2 - (x̅_B)^2 $


In [13]:
k = len(n_i)

In [23]:
x_B = np.sum(x_i * n_i) / n
D_B = np.sum(n_i * x_i ** 2) / n - x_B ** 2
sigma_B = np.sqrt(D_B)

In [28]:
print(f'выборочное среднее: {x_B}')
print(f'выборочная дисперсия: {D_B:.2f}')
print(f'выборочное среднеквадратическое отклонение: {sigma_B:.1f}')

выборочное среднее: 11.22
выборочная дисперсия: 0.09
выборочное среднеквадратическое отклонение: 0.3


Для вычисления сводных характеристик выборок используют эмпирические моменты, аналогичные соответствующим теоретическим моментам. **Обычным эмпирическим моментом порядка s** называется среднее значение $s-х$ степеней разностей $х_i – С$, где $х_i$ — наблюдаемая варианта, $С$ — произвольная постоянная (ложный нуль — либо мода, либо любая варианта, расположенная примерно в середине вариационного ряда):

$ M_s = \frac{1}{n}\sum_{i=1}^k n_i (x_i - C)^s $.

При $С = 0$ имеем **начальные эмпирические моменты порядка s**.

В частности, в случае **$s = 1$**

$ M_1 = \frac{1}{n}\sum_{i=1}^k n_i x_i = x̅_B$.

**Центральным эмпирическим моментом порядка s** называется обычный момент при $C = x̅_B$:

$ m_s = \frac{1}{n}\sum_{i=1}^k n_i(x_i - x̅_B)^s$.

В частности, центральный момент второго порядка

$ m_2 = \frac{1}{n}\sum_{i=1}^k n_i(x_i - x̅_B)^2 = D_B$,

иными словами, выборочная дисперсия.

**Асимметрия эмпирического распределения** определяется следующим равенством:

$ a_s = \frac{m_3}{σ_B^3} $.

**Эксцесс эмпирического распределения** определяется следующим равенством:

$ e_k = \frac{m_4}{\sigma_B^4} - 3 $.

*Асимметрия* и *эксцесс* служат для сравнения полигона эмпирического распределения с нормальным распределением: знак $а_s$ указывает на расположение длинной части ломаной относительно математического ожидания (справа при $а_s > 0$ и слева при $а_s < 0$): $e_k$ характеризует «крутизну» ломаной (при $e_k > 0$ сравниваемая кривая более высокая и острая, при $e_k < 0$ она более низкая и плоская).

In [47]:
m = np.zeros((3, 1))
for degree in range(2, 5):
  m[degree - 2] = np.sum(n_i * (x_i - x_B) ** degree) / n

In [51]:
for idx in range(3):
  print(f'центральный эмпирический момент порядка {idx + 2}: m_{idx + 2} = {m[idx][0]:.4f}')

центральный эмпирический момент порядка 2: m_2 = 0.0892
центральный эмпирический момент порядка 3: m_3 = -0.0017
центральный эмпирический момент порядка 4: m_4 = 0.0204


In [52]:
a_s = m[1][0] / sigma_B ** 3
e_k = m[2][0] / sigma_B ** 4 - 3

In [53]:
print(f'ассиметрия: a_s = {a_s:.4f}')
print(f'эксцесс: e_k = {e_k:.4f}')

ассиметрия: a_s = -0.0631
эксцесс: e_k = -0.4361
