# Распределение Пуассона
Poisson Distribution

Как уже было сказанно существует множество распределений вероятностей, используемых для представления практически любого случайного события. Ранее мы познакомились с биномильным распределением для представления событий с дискретными величинами. Binom

А также нормальном распределении используемым для непрерывных числовый значений. Norm

Распределение Пуассона - это еще одно распространенное распределение, которое используется для описания кол-ва появления определенного события в течении фиксированного временного или пространственного интервала.

Например: Подобное распределение можно использовать для описания кол-ва автомобилей, проезжающих через определенный перекресток между 4 и 5 часами вечера в определенный день. Его также можно использовать для описания кол-ва звонков, полученных в офисе между часом и тремя часами для в определенный день.

Распределение Пуассона определяется параметром скорости, которую обозначают греческой буквой **лямбда**

**Лямбда** представляет собой ожидаемое значение - или среднее значение - распределения. Например, если наше ожидаемое число клиентов между 13:00 и 14:00 равно 7, то мы установим параметр для распределения Пуассона равным 7. PMF (Probability Mass Function) для распределения Пуассона будет выглядеть следующим образом 

![Poisson Distribution](Poisson%20distribution.png)

Чем выше значение **лямбда** тем выше дисперсия (разброс) возможных значений

## Расчет вероятности точных значений с использованием PMF

Для расчета вероятности по распределению Пуассона используется PMF (Probability Mass Functions)

Который находится в модуле poisson библиотеки scipy.stats

Например предположим что мы ожидаем что в течении следующих 30 дней будет идти дождь 10 раз, получается что лямбда равна 10.

Мы можем рассчитать вероятность дождя на 6 день учитывая лямбду 10

In [17]:
# импортируем библиотеку
import scipy.stats as stats

print(stats.poisson.pmf(6, 10))

0.06305545800345125


Как и в предыдущей функции вероятностной массы дискретных случайных величин, отдельные вероятности можно суммировать, чтобы найти вероятность наблюдения значения в некотром диапазоне.

Например, если мы ожидаем, что в течение следующих 30 дней будет 10 дождей, то кол-во дождей в течении следующих 30 дней будет распределено по закону Пуассона с **лямбда** = 10. Мы можем рассчитать вероятность дождя в период с 12 по 14 дни следующим образом.

In [18]:
# импортируем библиотеку
import scipy.stats as stats

print(stats.poisson.pmf(12, 10) + stats.poisson.pmf(13, 10) + stats.poisson.pmf(14, 10))

# Таким образом вероятность дождя в период с 12 по 14 дней равна 21.9%

0.21976538076223123


## Расчет вероятностей диапазона с использование CDF (Cumulative Distribution Function)

Мы можем использовать poisson.cdf() метод, scipy.stats библиотеки для оценки вероятности наблюдения определенного числа или меньше, учитывая ожидаемое значение распределения.

Например если мы хотим рассчитать вероятность наблюдения 6 или меньше дождевых дней в течении следующих 30 дней, когда мы ожидали 10, мы могли бы сделать следующее

In [4]:
import scipy.stats as stats

print(stats.poisson.cdf(6, 10))

# Получается что вероятность дождливых дней от 0 до 6 при ожидаемых 10 равна 13% 

0.13014142088248304


Также как и в предыдущих функциях мы можем производить математические действия с вероятности для вычисления вероятности в диапазоне

In [6]:
print(1 - stats.poisson.cdf(11, 10))

# Таким образом получили что с вероятностью 30% осадки выпадут кол-ом в диапазоне от 12 до 30 дней
# Также для расчета вероятности что осадки в течении 30 дней будут в кол-ве дипазона от 12 до 18 раз

print(stats.poisson.cdf(18, 10) - stats.poisson.cdf(11, 10))

# Вероятность выавдения осадков в кол-ве от 12 до 18 раз за 30 дней равна 29.6%

0.30322385369689386
0.29603734909303947
