# Наша легенда

DeliverFoods - продуктовый онлайн-гипермаркет, который доставляет пользователям продукты более 20 лет. У компании есть веб-сайт и мобильное приложение. У компании есть около 30 точек в каждом из городов присутствия, т.н. дарксторы, где хранятся продукты, собираются заказы и доставляются пользователям. Доставку осуществляют курьеры компании. Города поделены на зоны доставок, они не пересекаются, каждый из дарксторов обеспечивает свою зону. 

Пользователи могут заказать быструю доставку продуктов (в течение 60 минут), а могут выбрать любой часовой слот на сегодня или следующий день.

# Что нужно сделать

В секции "Задачи" есть две формулировки проблемы, к которым нужно предложить ML-решение.
Вам нужно выбрать одну из двух формулировок и придумать решение.

**Что может быть частью решения**:
- постановка задачи с т.з. машинного обучения: что есть целевая переменная, что есть объект
- какие фичи  можно было бы использовать
- какую метрику качества использовать
- как можно/нужно использовать прогнозы для решения конкретной проблемы
- как можно измерить полезность и эффективность предложенного решения
- как решение должно жить внутри сервисов компании

**Формат решения**:
- в целом, свободный: текст, схема с описанием, что-то еще 
- структурированность строго приветствуется

**Идеальный образ результата**:

Читатель, то бишь преподаватель, способен понять (и принять):
- суть вашего предложения
- как это решение должно работать
- как оно может появиться
- как должны быть подтверждены качество и эффективность решения


**Дедлайн**:
- 27 декабря в 23.30
- 28 декабря преподаватель планирует сесть и прочитать ответы, чтобы поставить отметки

# Задачи

## 1. Сколько нужно курьеров?

В последнее время компания наблюдает, что где-то заказы доставляют очень быстро и курьеры простаивают без работы, а где-то доставка сильно опаздывает, потому что курьеры не успевают. Менеджмент предполагает, что курьерская сеть устроена неоптимально. Наверное, мы могли бы перераспределить курьеров по точкам так, чтобы везде не было опозданий или было бы минимально опозданий.

Как машинное обучение могло бы помочь решить эту проблему?

## 2. Минимальная стоимость корзины

Пользователи делают разные заказы. Иногда они заказывают пирожок и газировку, иногда продуктовую корзину на неделю. Когда заказ оформляется на часовой слот в будущем, компания умеет доставлять все заказы. При этом когда много заказов быстрой доставки, компания не всегда справляется - курьеров не хватает. Компания задумалась, как определить минимальную стоимость корзины, чтобы срезать избыточный спрос, чтобы доставлять все заказы, которые попали в систему - а не принимать и не доставлять.

Как машинное обучение могло бы помочь решить эту проблему?

# Структура данных

Возможно, вам пригодится понимание, какие данные внутри компании доступны. В этой секции есть описание некоторых таблиц и полей, которые могут пригодиться при проработке решения.

## Таблица orders:
- **order_id**: уникальный идентификатор заказа
- **customer_id**: уникальный идентификатор покупателя
- **store_id**: уникальный идентификатор даркстора
- **order_status**: статус заказа (оформлен, в доставке, доставлен)
- **order_purchase_timestamp**: время покупки
- **order_approved_at**: время подтверждения оплаты заказа
- **order_delivered_customer_date**:дата и время фактической доставки товара покупателю
- **order_estimated_delivery_date**: дата и время планируемой даты покупателю, показанная при покупке

## Таблица deliveries:
- **delivery_order_id**: уникальный идентификатор заказа
- **store_id**: уникальный идентификатор даркстора
- **delivery_couried_id**: уникальный идентификатор курьера
- **delivery_assigned_time**: время, когда был назначен курьер
- **delivery_start_time**: дата и время старта сборки заказа
- **delivery_assembly_end_time**: дата и время старта сборки заказа
- **delivery_pickup_time**: время забора доставки курьером из даркстора
- **delivery_delivery_time**: время доставки курьером из клиента


## Таблица order_items:
- **order_id**: уникальный идентификатор заказа
- **order_item_id**: количество товара, включенного в заказ
- **product_id**: уникальный идентификатор товара
- **price**: цена айтема.
- **freight_value**: стоимость доставки айтема (если в одном заказе несколько айтемов, то стоимость доставки делится между айтемами)

## Таблица products

- **product_id**: уникальный идентификатор товара
- **product_category_name**: категория товара
- **product_name_lenght**: длина названия товара
- **product_description_lenght**: длина описания товара
- **product_photos_qty**: количество фотографий товара
- **product_weight_g**: вес товара в граммах 
- **product_length_cm**: длина товара в см
- **product_height_cm**: высота товара в см
- **product_width_cm**: ширина товара в см

## Таблица order_payments:

- **order_id**: уникальный идентификатор заказа
- **payment_type**: способ оплаты, выбранный пользователем
- **price**: стоимость транзакции

## Таблица customers:

- **customer_id**: идентификатор пользователя, ключ к заказам
- **customer_unique_id**: уникальный идентификатор пользователя
- **customer_zip_code_prefix**: первые 5 цифр почтового индекса
- **customer_city**: город
- **customer_state**: область

## Таблица couriers:

- **courier_id**: уникальный идентификатор курьера
- **courier_id_start_date**: дата старта работы курьеров
- **courier_id_end_date**: дата конца работы курьера 
- **courier_city**: город работы курьера

## Таблица couriers_shifts:

- **courier_id**: уникальный идентификатор курьера
- **shift_id**: идентификатор смены курьера
- **shift_start_date**: дата и время старта смены
- **shift_end_date**: дата и время конца смены

## Таблица stores:

- **store_id**: уникальный идентификатор даркстора
- **store_city**: город даркстора
- **store_address**: адрес даркстора