# Напоминание о A\*

**Эвристический алгоритм** $-$ это алгоритм решения задачи, правильность которого для всех возможных случаев не доказана, но про который известно, что он дает достаточно хорошее решение в большинстве случаев. В действительности может быть известно (то есть доказано) то, что эвристический алгоритм формально неверен. Его все равно можно применять, если при этом он дает неверный результат в отдельных, достаточно редких случаях, или же дает неточный, но все же приемлинмый результат.

Проще говоря, эвристика $-$ это не полностью математически обоснованный (или даже 'не совсем корректный'), но при этом практически полезный алгоритм.

Важно понимать, что эвристика, в отличие от корректного алгоритма решения задачи, обладает следующими особенностями:
- Она не гарантирует нахождения лучшего решения.
- Она не гарантирует нахождения решения, даже если оно заведомо существует (возможен 'пропуск цели').
- Она не может дать неверное решение в некоторых случаях.

**Алгоритм поиска A\*** $-$ относится к эвристическим алгоритмам поиска по первому лучшему совпадению на графе с положительными весами ребер, который находит маршрут с наименьшей стоимостью от одной вершины (начальной) к другой (целевой, конечной).

**Идея алгоритма A\*.** A\* пошагово просматривает все пути, ведущие от начальной вершины в конечную, пока не найдет минимальный путь. Как и все эвристические алгоритмы поиска, он просматривает сначала те маршруты, которые "кажутся" ведущими к цели. От "**жадного алгоритма**", который тоже является алгоритмом поиска по первому лучшему совпадению, его отличает то, что при выборе вершины он учитывает, помимо почего, весь пройденный до нее путь. Составляющая $g(x)$ $-$ это стоимость пути от начальной вершины, а не от предыдущей, как в жадном алгоритме.

В начале работы просматриваются узлы, смежные с начальным; выбирается тот из них, который имеет минимальное значение $f(x)$, после чего этот узел раскрывается. На каждом этапе алгоритм оперирует с множеством путей из начальной точки до всех еще не раскрытых (листовых) вершин графа $-$ множеством частных решений, $-$ которое размещается в очереди с приоритетами. Приоритет определяется по значению $f(x) = g(x) + h(x)$. Алгоритм продолжает свою работу до тех пор, пока значение $f(x)$ целевой вершины не окажется мкньшим, чем любое значене в очереди, либо пока все дерево не будет просмотрено. Из множества решений выбирается решение с наименьшей стоимостью.


# Эвристические функции

Поведение алгоритма сильно зависит от того, какая эвристика используется. В свою очередь, выбор эвристики зависит от постановки задачи. Часто A\* используется для моделирования перемещения по поверхности, покрытой координатной сеткой.

Если мы можем перемещаться в четырех направлениях, то в качестве эвристики стоит выбрать **манхэттенское расстояние** (расстояние городских кварталов, метрика прямоугольного города) $-$ метрика, введенная Германом Минковским. Согласко этой метрике, расстояние между двумя точками равно сумме модулей разностей их координат:
$$ h(u) = |u.x - f.x| + |u.y - f.y| $$

**Расстояние Чебышева** применяется, когда е четырем направлениям добавляются диагонали:
$$ h(u) = max(|u.x - f.x|, |u.y - f.y|) $$ 

Если передвижение не ограничено сеткой, то можно использовать **евклидово расстояние** по прямой:
$$ h(u) = \sqrt{(u.x - f.x)^2 +(u.y - f.y)^2 } $$

Также стоит обратить внимание на то, как соотносятнся $(x)$ и $h(x)$. Если они измеряются в разных величинах (например, $g(x)$ $-$ это расстояние в километрах, а $h(x)$ $-$ оценка времени пути в часах) A\* может выдать некорректный результат.

***Свойства.*** Алгоритм A\* обладает селдующими свойствами:
- Допустимость: если решение существует, оно будет найдено.
- Оптимальность: найденное решение всегда оптимально. Если решений несколько, будет найдено одно из них.
- Эффективность: нес существует алгоритмов, которые находят решене быстрее с применением той же эвристической функции (A\* расрывает минимальное количество вершин).

***Временная сложность.*** Обычно алгоритм A\* просматривает только часть вершин. Однако, в лабириктах быстродействие приближается к худшему случаю. Бытродействие алгоритма зависит от двух факторов:
- Точность эвристической функции.
- Реализация контейнеров известных и исследованных вершин: Наиболее затратными операциями в алгоритме есть операции сложения, изъятия и изменения элементов в списках известных и исследованных вершин. На их быстродействие существенно влияют конкретные реализации этих структур данных.

Пусть имеется множество вершин в графе, информация о вершинах и ребрах доступна до начала работы алгоритма, ипользованная эвристическая функция $-$ монотонная. Список известных вершин реализован как биранрая куча, список исследованных $-$ как массив. Тогда алгоритм A\* имеет квадратичную зависимость от количества вершин граф и худшее время работы:
$$ O(|V|^2) $$

Функция нахождения минимальной оценки расстояния может быть оптимизирована. Если каждая вершина хранится как указатель как указатель на соотсетствующий объект в кучее, то время работы функции уменьшится с квадратичного до логарифмического, а общее время работы алгоритма $-$ до линейно-логарифмического:
$$ O(|V|\cdot \log{|V|}) $$

# Алгоритм ALT

***Опеределение.*** Двухэтапный алгоритм.

Алгоритм разбивается на два этапа: предобработка и запрос.

Предобработка выполняется один раз для каждого графа и может занимать значительное количество времени. Результатом предобработки являеются вспомогательные данные.

Запрос может использовать предобработанные данные и выполняется для любой пары вершин ($s$, $t$). Запрос должен выполняться как можно быстрее.

Задача: построить алгоритм, предобработка которого занимает часы или минуты, результатом работы является линейное количество вспомогательных данных, позволяющих обрабатывать запросы в реальном времени.

## ALT (A\* + Landmarks + Triangle inequality = ALT)

**Предобработка.**

1. Выбирается некоторое число вершин в качестве ориентиров (landmarks). 
2. Выполняется нахождение путей между ориентирами и всеми вершинами. 
3. Найденные пути сохраняются.

**Запрос.**

Выполняется алгоритм A\* с использованием ориентиров и неравенства треугольника.

Пример применения неравенства треугольника для нижней оценки расстояния:

$$ d(v, w) \geq d(A, w) - d(A, v) $$ 
$$ d(v, w) \geq d(v, A) - d(w, A) $$ 
$$ d(v, w) \geq \max{\{d(A, w) - d(A, v), d(v, A) - d(w, A)\}} $$ 

![](./images/triangle_inequality_example.png)


Важно число используемых ориентиров: при использовании большего числа ориентиров улучшаются границы оценок, но происходят большие затраты памяти.

Также выжен выбор положения самих ориентиров в графе: хороший ориентир должен находиься "перед" вершиной $v$ или "полсе" вершины $w$.

Необходимо выбрать ориентиры, которые будут подходить для любых запросов для данного графа. Выбор ориентиров, расположенных на "границах" графа кажется разумным.

Существует несколько подходов выбора ориентиров:
- Случайный.
- Пранарный.
- Избегание.
- Максимальное покрытие.

Планарный подход подразумевает разбение карты на несколько кусков примекно одного размера и выбрать самую далекую вершину каждого куска в качестве ориентира.

![](./images/planar_example.png)

Подход избеганием подразумевавет последовательный выбор ориентиров, каждый следующий ориентир должен как можно лучше покрывать регионы, плохо покрытые предыдущими ориентирами.

Метод максимального покрытия подразумевает генерацию путей между большим числом ориентиров, из которых инвормация сохраняется только о "лучших" (находится подмножество с минимальным временем запросов). 

# Reach

**Идея.** Не нужно посещать "местные" дороги, когда происходит поиск пути от далеко расположенных $s$ и $t$.

Пусть вершина $v$ находится на кратчайшем пути $P$ между вершинами $s$ и $t$.

Введем оценку $r$ на пути $P$ для данной вершины:
$$ r(v, P) = \min{\{d(v,s), d(v, t)\}} $$

Оценка $r$ для всего графа:
$$ r(v) = \max\limits_Pr(v, P) \text{,} $$

для всех **кратчайших** путей $P$, содержащих вершину $v$.

**Идея.**
- Вершины, для которых оценка $r$ велика, близки к середине какого-то длинного кратчайшего пути.
- Вершины на магистралях имеют высокую оценку $r$.
- Локальные пересечения имеют малую оценку $r$.

Оценка $r$ может сократить поиск при запросе пути из $s$ в $t$, если не посещать вершины с малой оценкой, находящиеся далеко от $s$ и $t$.

**Предобработка.**
1. Инициализация: установить $r(v) \leftarrow 0\text{, } \forall v$
2. Для каждой вершины $v$ в дереве кратчайших путей $T_s$:
- Взять наибольший кратчайший путь $P_{st}$, содержащий $v$.
- $d_s(v)$ (**глубина**): расстояние от $s$.
- $h_s(v)$ (**высота**): расстояние до наиболее далекого листа.
- $r_s(v)$ (**оценка $r$** для $T_s$) $ = \min{\{d_s(v), h_s(v)\}}$
- установить $r(v) \leftarrow \max{\{r(v), r_s(v)\}}$

![](./images/reash_tree_example.png)
![](./images/reash_tree_example_2.png)


**Срезы (shortcuts).**

Рассмотрим последовательность вершин степени 2, содержащиеся в кратчайшем пути.

Добавим срез (одна дуга, обходящая все вершины и имеющая ту же стоимость, что и путь по вершинам)

Предположим, что построение пути происходит выбором пути с наименьшим числом узлов.

Больше срезов можно добавить рекурсивно.

![](./images/shortcuts_example.png)

# REAL (Reach + ALT)

Поиск алгоритмом A\* с ориентирами может использовать оценку $r$:
- A\* устанавливает направление поиска
- Оценка $r$ ограничивает пространство поиска

При этом ориентиры имеют двойное назначение:
- Дают направление поиска
- Предоставляют нижнюю границу для планирования поиска

# Иерархии путей (Contraction Hierarchies)

**Предобработка.**
1. Удалять вершины одну за одной в определенном порядке.
2. Добавлять срезы для сохранения расстояний.

Поддерживается следующий инвариант:
Расстояния между оставшимися вершинами сохраняется

На выходе получаем дополненный граф с упорядоченными вершинами.

![](./images/ch_1.png)
![](./images/ch_2.png)
![](./images/ch_3.png)
![](./images/ch_4.png)

При двунаправленном поиске происходит следование только по восходящим дугам.

# Arc Flags

**Предобработка.**
- Разделить граф на $k$ частей.
- Хранить $k$-битный флаг с каждой дугой ($i$-ый бит отражает, есть ли из вершины $v$ кратчайший путь к $i$-ой части используя дугу ($v$, $w$)).

**Запрос.**
Запустить модифицированный алгоритм Дейкстры, пропускающий дуги, флаг искомого региона в которых установлен в 0.

![](./images/arc_flags.png)


Части можно выбирать двумя способами:
- Разделить граф на равные части.

![](./images/equal_parts.png)

- Использовать деревья квадрантов.
- Использовать k-d деревья.

![](./images/equal_density.png)

![](./images/complexity.png)