"Притормози, притормози...". Недавно вы завершили модуль по теории вероятности и пришло время закрепить полученные знания и навыки - давайте попробуем смоделировать процесс работы сервиса такси. Как полагается, у нас есть водители, которым поступают заказы. Процесс приема заказа хорошо моделируется распределением Пуассона - которое позволяет оценить интенсивность событий, или среднее количество событий за единицу времени.

```
При решении этого проекта вы будете моделировать данные из заданного распределения, подберёте параметры распределения, описывающего процесс, примените найденную модель для ответа на практические вопросы владельцев сервиса.
```

# Задание 1

## Моделирование пуассоновской случайной величины

Сервис по заказу такси “Блиц” расширяется и открывается в городе Барнаул. Необходимо рассчитать примерную нагрузку на таксистов. Доступа к данным с заказами у нас нет – ещё бы, это же ценная информация! Поэтому придется эти данные сгенерировать. Напишем функцию, возвращающую случайные значения, распределенные по закону Пуассона.

Как вы знаете, вероятность того, что пуассоновская случайная величина имеет значение $k$, равно $f(k,\lambda)=\dfrac{\lambda^ke^{-\lambda}}{k!}$, где $\lambda$ - параметр распределения.

Для того, чтобы сгенерировать значения такой случайной величины, воспользуемся следующим алгоритмом: выберем случайное число $y$ из промежутка $[0, 1]$. Затем будем суммировать $f(k,\lambda)$ до тех пор, пока сумма не превысит выбранного числа $y$. Тот $k$, на котором сумма превысила  - это и есть наш результат.

```
Таким образом мы находим, при каком k значение кумулятивной функции распределения превышает выбранное случайное число.
```


**Входные данные**: параметр $\lambda$.

**Результат**: напишите функцию <code>poisson(lambda)</code>, которая будет возвращать значения, распределённые по закону Пуассона с параметром $\lambda$.

**Пример входных данных**: <code>A = [[1, 2]], B=[[2], [1]], C=[[5]]</code>

**Пример**: <code>poisson(3)</code> чаще всего будет возвращать 2 или 3.


## Решение

Напишем функцию вероятности того, что пуассоновская случайная величина имеет значение $k$: $f(k,\lambda)=\dfrac{\lambda^ke^{-\lambda}}{k!}$

In [None]:
def f(k,l):
    from math import exp, factorial

    return pow(l,k)*exp(-l)/factorial(k)

Теперь напишем функцию, которая будет возвращать значения, распределённые по закону Пуассона с параметром $\lambda$:

In [None]:
def poisson(l):
    from random import random
    
    y = random()
    k = 0
    sum = f(0,l)
    
    while sum <= y:
        k += 1
        sum += f(k,l)
        
    return k

# Задание 2

## Насколько модельные данные отличаются от реальных?

Отлично, сервис “Блиц” зашел на рынок транспортных услуг Барнаула и успешно доставляет пассажиров из точки А в точку N! Пришло время проверить, насколько сгенерированные нами ранее данные отличаются от реальных.

```
Для этого напишем функцию, которая генерирует массив случайных значений и сравнивает его с реальными данными – находит средний квадрат разности. Это стандартная метрика для нахождения отклонения одной величины от другой.
```

Будем считать, что у нас есть данные по дням за последний год ($365$ чисел). А именно, пусть у нас есть массив, $i$-й элемент которого содержит число пассажиров, перевезённых одним водителем в $i$-й день года. Будем считать, что эта случайная величина имеет **распределение Пуассона**.

Вам требуется найти параметр $\lambda$ (напомним, что среднее значение пуассоновской величины как раз равно этому параметру). Затем, используя результат из предыдущей задачи, сгенерируйте 365 чисел. Имея два массива (исходные данные и сгенерированные вами), посчитайте средний квадрат разности между соответствующими значениями: 

<code>sum((data_real[i] - data_generated[i])2)/365</code>

**Входные данные**: массив <code>data_real</code> из $365$ элементов, каждый из элементов равен количеству перевезённых пассажиров в соответствующий день.

**Результат**: напишите функцию <code>poisson_error(data)</code>, которая сгенерирует массив <code>data_generated</code> и вернёт средний квадрат разности между исходными и сгенерированными данными.

## Решение

Используя предыдущие функции запишем решение:

In [None]:
def poisson_error(data):
    n = len(data)
    l = sum(data)/n
    return sum([(data[i] - poisson(l))**2 for i in range(n)])/n

# Задание 3

## Вероятность перевезти ровно $k$ пассажиров

Корбен, водитель сервиса такси “Блиц” решил заключить пари с другом. Он утверждает, что завтра у него будет ровно $k$ заказов. Используя исторические данные, найдите параметр пуассоновского распределения $\lambda$ и оцените эту вероятность.

**Входные данные**: данные по поездкам <code>data</code> за предыдущие $365$ дней и число <code>k</code>.

**Результат**: напишите функцию <code>poisson_prob(data, k)</code>, вероятность того, что водитель завтра перевезёт ровно $k$ пассажиров.

**Пример**: допустим, что <code>data</code> имеет распределение Пуассона с параметром <code>l=3</code>. Тогда функция <code>poisson_prob(data, 3)</code> должна вернуть <code>0.22404180765538773</code>.

## Решение

Используя функцию из **задания 1**, напишем требуемую функцию:

In [None]:
def poisson_prob(data, k):
    l = round(sum(data)/len(data))
    
    prob = poisson(l)-poisson(l-1)
    
    return prob

# Задание 4

## Время ожидания следующего пассажира

Пусть заказы в течение рабочей смены ($8$ часов) водителя не имеют пиков (т. е., это процесс Пуассона). Корбен хочет сделать перерыв на обед, но не хочет пропускать заказы - тут без вашей помощи не обойтись. Посчитайте матожидание времени до следующего заказа, чтобы Корбен смог спланировать свой перекус.

**Входные данные**: как и в предыдущей задаче, вам доступны исторические данные по заказам за предыдущий год data (массив <code>data</code> из $365$ элементов).

**Результат**: напишите функцию <code>time_to_order(data)</code>, которая восстанавливает параметр $\lambda$ пуассоновского распределения и возвращает ожидаемое время до следующего заказа в часах.

**Пример**: если вычисленный параметр распределения $\lambda$ будет равен $3$, то функция <code>time_to_order</code> должна вернуть <code>2.6666666666666665</code>. 

**Подсказка**: используйте [экспоненциальное распределение](https://ru.wikipedia.org/wiki/%D0%AD%D0%BA%D1%81%D0%BF%D0%BE%D0%BD%D0%B5%D0%BD%D1%86%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5).

## Решение

Посчитаем математическое ожидание ($\lambda$) числа заказов, а затем математическое ожидание времени одного заказа:

In [None]:
def time_to_order(data, time=8):
    l = round(sum(data)/len(data))
    
    return time/l

# Задание 5

## Смесь распределений

Количество клиентов сервиса “Блиц” разнится изо дня в день. В целом, мы можем выделить обычные дни (основной поток), а также дни, когда происходят некоторые “знаковые” события (дополнительный поток): например, концерты или футбольные матчи. В такие “знаковые” дни пассажиропоток, а следовательно и число клиентов, растет. Необходимо найти параметры распределений основного потока и дополнительного.

Пусть вам даны количества поездок за предыдущие $365$ дней и массив с номерами дней, которые были праздничными. Необходимо вернуть параметры пуассоновского распределения для обычных дней и для праздничных.

**Входные данные**: массив <code>data</code> с данными о количестве поездок и массив <code>days</code> с номерами праздничных дней (индексация с нуля).

**Результат**: напишите функцию <code>estimate_parameters(data, days)</code>, возвращающую кортеж из двух чисел <code>(l_usual, l_special)</code>.
<code>l_usual</code> - параметр распределения в обычные дни, <code>l_special</code> - в праздничные.

## Решение

Напишем функцию:

In [None]:
def estimate_parameters(data, days):
    l = lambda data: round(sum(data)/len(data))

    data_usual = [data[i] for i in range(len(data)) if i not in days]
    data_special = [data[i] for i in days]
    
    return (l(data_usual), l(data_special))