# Типы распределений

## Генеральная совокупность и выборка

**Генеральная совокупность** — это полный набор всех элементов, которые исследуют в рамках задачи.

**Выборка** — это отдельный набор элементов, отобранных из генеральной совокупности некоторым случайным процессом.

Правила определения генеральной совокупности:

- **Чёткое определение.** Определите генеральную совокупность чётко и однозначно, указывая критерии принадлежности объектов к ней.
- **Релевантность.** Убедитесь, что генеральная совокупность соответствует целям исследования и включает все необходимые объекты.
- **Достижимость.** Учитывайте практические ограничения и определите генеральную совокупность так, чтобы данные были доступны и их можно было собрать.
- **Воспроизводимость.** Используйте такую формулировку генеральной совокупности, чтобы другие исследователи могли воспроизвести исследование и проверить результаты.
- **Временные рамки.** Если генеральная совокупность связана с конкретным временным интервалом, указывайте его в определении.

Правила определения выборки:

- **Репрезентативность.** Выборка должна быть репрезентативной относительно генеральной совокупности, то есть она должна содержать характеристики, которые отражают генеральную совокупность в целом.
- **Размер выборки.** Он важен для точности выводов, которые мы делаем на основе анализа данных. Более крупная выборка обычно даёт более точные результаты, однако данные для неё сложнее собрать.
- **Способ отбора выборки.** Способ отбора влияет на точность и репрезентативность результатов исследования.
- **Исследовательские ошибки.** Всегда следует учитывать возможные ошибки, связанные с выборкой, такие как смещение выборки и ошибки измерения. Смещение выборки возникает, когда выборка не является репрезентативной для генеральной совокупности. Ошибки измерения могут возникать из-за неточностей в сборе, обработке или анализе данных.

## Случайная величина

**Случайная величина** — это переменная, значение которой можно узнать только в результате проведения измерения.

**Вероятность события** — это отношение числа случаев, когда событие произошло, к общему числу испытаний или наблюдений.

**Функция вероятности** определяет вероятность того, что случайная величина примет определённое значение.

`P(X=x)`

**Эмпирическая функция распределения** определяет вероятность того, что случайная величина примет значение, меньшее или равное заданному.

`F^(x) = P(X <= x)`

In [2]:
from functions import F

data = [1, 1, 2, 3, 1, 4, 2, 1, 1, 1, 2, 1, 3]
F(data)

{1: 0.54, 2: 0.23, 3: 0.15, 4: 0.08}

In [7]:
# F(2 < x <= 4)

probs = F(data)
print(f"{1 - probs[1] - probs[2]:.2f}")

0.23


## Равномерное распределение

**Равномерное дискретное распределение** — это тип теоретического распределения, в котором каждое возможное значение случайной величины X имеет одинаковую вероятность и лежит в пределах от a до b.

Обозначают так: 

`X∼U(a,b)` от английского Uniform — «равномерный».  

**Функция вероятности теоретического распределения** описывает вероятность того, что случайная величина примет определённое значение. Обозначается как `P(X=x)`

Тогда для равномерного распределения:

`P(X=x1​)=P(X=x2​)=…=P(X=xn​)`

Но `P(X=x1​)+P(X=x2​)+…+P(X=xn​)=1`

Тогда:
`n⋅P(X=x)=1` или `P(X=x)=1/n`

Дискретная случайная величина имеет равномерное распределение с параметрами a, b,a, b, если для каждого целого значения в интервале a<=x<=b, она описывается функцией вероятности `P(X=x)=1/n`

где `n=b−a+1` — количество возможных значений X.

Функция распределения F(x) для всех целых значений из интервала
a<=x<=b в случае равномерного распределения будет такой:

`F(x)=(x−a+1)⋅P(X=x)=(x−a+1)/n​`

**Математическое ожидание** — это взвешенное среднее значение случайной величины, где веса представляют собой вероятности возможных значений этой случайной величины.

`E(X) = SUM(x_i * P(X=x_i))`

В случае равномерного распределения `E(X) = (a+b)/2`

**Дисперсия случайной величины** — это математическое ожидание квадрата отклонения случайной величины от её математического ожидания.

`Var(X)=E[(X−E(X))^2]`

В случае равномерного распределения `Var(X)=(n^2-1)/12`

## Нормальное распределение