# Исследование локального управления в задаче регулировки трафика

Целью работы - показать, что в задаче регулировки трафика допустимо локальное управление.

## Описание модели
Выбрана максимально упрощенная модель.
В модели не учитываются перегрузки сети или другие подобные эффекты.
Основные составляющие:
1. Граф $G(v, e)$, вершины которого - маршрутизаторы, ребра - каналы передачи данных.
2. Потоки $F(i, j, l, p)$
    * $i$ - маршрутизатор-отправитель
    * $j$ - маршрутизатор-получатель
    * $l$ - нагрузка, которую поток оказывает на сеть
    * $p = (i, k_1, k_2, \dots, k_n, j)$ - фиксированный при создании потока путь, $k_i$ - промежуточные маршрутизаторы
    
Есть множество способов выбрать граф.
В данной работе генерируется случайный граф: 
фиксируются $N$ точек (вершин) на плоскости, 
после чего проводятся ребра так, 
что чаще всего соединяются ближайшие вершины.
Пример графа на рисунке 1.
Каждой вершине соответствует загрузка, равная сумме нагрузок проходящих через нее потоков.
Нет никакого предела по загрузке маршрутизаторов или каналов.

<!-- <img src="graph.png" width=600> -->

Модель инициализируется созданием $100\ 000$ случайных потоков. 
При создании потока последовательно генерируются $k_1, k_2, \dots, k_n$ с помощью алгоритма 
$$
\begin{gathered}
    k_1 = next(i, j)\\ k_t = next(k_{t - 1}, j),\ t > 1
\end{gathered}
$$
после чего для всех маршрутизаторов из пути $p = (i, k_1, k_2, \dots, k_n, j)$ добавляется нагрузка, которую поток оказывает на сеть.

После инициализации модель эволюционирует в течение $1\ 000\ 000$ шагов.
На каждом шаге добавляется $1$ новый поток и удаляется $1$ старый.
При удалении потока для маршрутизаторов из $p$ удаляется нагрузка, которую оказывал поток.

Всегда добвляется или удаляется *случайный* поток.
При добавлении потока $F(i, j, l, p)$ его параметры выбираются так:
* $i \in V$ - выбирается из всех вершин с одинаковой вероятностью
* $j \in V, j \ne i$ - выбирается из оставшихся вершин с одинаковой вероятностью
* $l \in [0, 1]$ - нагрузка из равномерного распределения
* $p = p(i, j)$ зависит от функции $next$, гарантируется, что является минимальным маршрутом от $i$ к $j$ (по числу вершин).

При удалении потока выбирается любой с одинаковой вероятностью.

## Описание функции $next$
Функция $next(i, j)$ определяет, куда $i$-й маршрутизатор направит новый поток, путь которого лежит в $j$.
На данный момент гарантируется, что поток проходит кратчайший путь. 
Если $N(i, j)$ - множество соседей $i$, через которых проходит кратчайший путь из $i$ в $j$,
то $next(i, j) \in N(i, j)$.
Значение $next(i, j)$ может быть случайным.

Самый простой способ реализации $next(i, j)$ - выбор случайного элемента $N(i, j)$ с одинаковыми вероятностями.
Понятно, что если у маршрутизатора есть вся информация о системе и достаточные вычислительные ресурсы,
то он может выбрать $next$ оптимальным образом.

В данной работе выбран  критерий оптимальности, который характеризует равномерность загрузки маршрутизаторов: стандартное отклонение от средней загрузки маршрутизаторов.
Предположение: в таком случае выгодно выбирать наименее загруженный путь. Загрузка пути равна сумме загрузок составляющих его маршрутзаторов.

Введем набор функций $next_n(i, j)$, 
которые будут вибирать наименее загруженный путь на основе информации об $n$ ближайших вершинах.
Так при $n = 0$ информация о загрузке не используется, при $n = 1$ доступна информация только о соседях, а при большом $n$ (наример, больше, чем любой возможный путь) используется вся информация.
График зависимости оптимальности от $n$ представлен на рисунке 2.
Сначала наблюдается значительное уменьшение стандартного отклонения, а затем значение стабилизируется.
Стабилизацию можно объяснить тем, что в среднем длина нового потока не превышает $n$.
<!-- <img src="std.png" width=600> -->

На рисунке 3 изображены средняя загрузка и вариация для каждого маршрутизатора при разных $n$.
Для улучшения восприятия маршрутизаторы были отсортированы.
Стоить обратить внимание на две вещи:
1. Для $n = 20$ пиковые нагрузки ниже, чем для $n = 0$ и распределение более равномерное.
2. Для обоих случаев наблюдается низкая вариация загрузки, что может говорить о недостаточной репрезентативности модели.

<!-- <img src="load.png" width=600> -->

## Проблемы больших $n$
Одной из важных проблем при увеличении $n$ является возрастающая нагрузка на сеть,
связанная с необходимостью передачи информации от всех соседей в радиусе $n$.
График зависимости числа информации от $n$ представлен на рисунке 4.

<!-- <img src="neigborhood.png" width=600> -->

Возможным решением является уменьшение частоты передачи данных.
Но это приводит к использованию устаревшей информации.
Что особенно важно, когда нагрузка в сети быстро меняется.

Другая важная проблема - с увеличением $n$ приходится решать оптимизационные задачи большой размерности,
что не всегда удается делать в режиме реального времени.
Поэтому становятся популярны неклассические подходы, такие как машинное обучение.

На рисунке 5 представлен график зависимости доступной информации (число соседей) и индекса оптимальности (стандартного отклонения).
Можно заметить, что с определенного момента $(n = 4)$ рост информации не дает значительного улучшения.
Поэтому можно поставить вопрос о локальном управлении, когда $n$ мало.
 
<!-- <img src="std_info.png" width=600> -->

## Возможная постановка задачи
Выбрать конкретное $n$ и найти, как оптимальнее всего выбирать $next$.
Возможно, есть уже алгоритмы, а может надо что-то вроде RL делать, если данные будут.

## Проблемы
### Слабая репрезентативность модели
Загрузка в сети почти не меняется со временем. 
Это может быть вызвано алгоритмом генерации новых потоков: 
он слишком равномерно распределяет потоки по графу. 
В итоге загрузка определяется положением маршрутизатора в сети.
### Нет сравнения с оптимальным алгоритмом
Сейчас нет сравнения с по-настоящему оптимальным алгоритмом.
Поэтому сложно говорить о степени оптимальности локального управления.
### Упрощенная модель
Никак не учитываются ограничения реальной сети. По сути сейчас это сеть с бесконечными ресурсами.