In [11]:
import numpy as np

# Моменты распределения

## Математическое ожидание (Mean, среднее)

Для большинства известных распределений среднее обозначается как $\mu$

Для дискретной случайной величины

$ E[X] = \sum_{X}xp(x) $

Для непрерывной случайной величины

$ E[X] = \int_{X}xp(x)dx $

Среднее линейно

$ E[aX + b] = aE[x] + b $

Среднее линейно по сумме случайных величин

$ E[\sum_{i=1}^{N}X_i] = \sum_{i=1}^{N}E[X_i]$

Если случайные величины независимы

$ E[\prod_{i=1}^{N}X_i] = \prod_{i=1}^{N}E[X_i]$

In [3]:
X1 = np.random.normal(0, 1, size=(1_000,))


X2 = np.random.normal(2, 2, size=(1_000,))


X3 = np.random.normal(-4, 3, size=(1_000,))


X = np.array([0.2, 0.8])


X_mean = 0.8


Y = np.array([0.4, 0.6])


Y_mean = 0.6


XY = X * Y


print(f"Среднее X1: {X1.mean()}")


print(f"Среднее X2: {X2.mean()}")


print(f"Среднее X3: {X3.mean()}")


print(f"Среднее 5 * X2 + 2: {(5 * X2 + 2).mean()}")


print(f"Среднее суммы распределений: {(X1 + X2 + X3).mean()}")


print(f"Сумма средних распределений: {X1.mean() + X2.mean() + X3.mean()}")


print(f"Произведенеие средних: {X_mean * Y_mean}")


print(f"Среднее произведение: {XY[1]}")

Среднее X1: -0.05314522895016449
Среднее X2: 1.9834067674941391
Среднее X3: -3.8985191808782567
Среднее 5 * X2 + 2: 11.917033837470695
Среднее суммы распределений: -1.9682576423342817
Сумма средних распределений: -1.9682576423342821
Произведенеие средних: 0.48
Среднее произведение: 0.48


## Дисперсия

Дисперсия это мера "разброса" значений в распределении, обозначается как $\sigma^2$

$ V[X] = E[(X - \mu)^2] = \int (x - \mu)^2p(x)dx = \int x^2p(x)dx - 2\mu \int xp(x)dx + \mu^2\int p(x)dx = E[X^2] - \mu^2$

Тогда:

$ E[X^2] = \sigma^2 + \mu^2 $

Стандартное отклонение, является корнем из дисперсии

$ std[X] = \sqrt {V[X]} = \sqrt {\sigma^2} = \sigma $

Дисперсия линейной случайной величины

$ V[aX+b] = a^2 V[X]$

Дисперсия суммы независимых случайных величин

$ V[\sum_{i=1}^N X_i] = \sum_{i=1}^N V[X_i]$

In [4]:
X1 = np.random.normal(0, 1, size=(1_000,))


X2 = np.random.normal(2, 2, size=(1_000,))


X3 = np.random.normal(-4, 3, size=(1_000,))


print(f"Дисперсия X1: {X1.var()}")


print(f"Дисперсия X2: {X2.var()}")


print(f"Дисперсия X3: {X3.var()}")


print(f"Дисперсия суммы распределений: {(X1 + X2 + X3).var()}")


print(f"Сумма дисперсий распределений: {X1.var() + X2.var() + X3.var()}")

Дисперсия X1: 0.9650902563758876
Дисперсия X2: 4.112259319222379
Дисперсия X3: 8.580111120003595
Дисперсия суммы распределений: 13.753099442243776
Сумма дисперсий распределений: 13.657460695601863


## Мода

такое значение x случайной величины X, что p(x) - max (самое частое значение в распределении)

$ x^* = argmax_xp(x)$

In [14]:
X = np.array([1, 2, 2, 3, 3, 3])

values, counts = np.unique(X, return_counts=True)

i_max = np.argmax(counts)


print(f"Мода: {values[i_max]}")

Мода: 3
