# Корневые деревья

Дерево называется *корневым*, если оно ориентированно и из какой-то вершины можно попасть во все остальные — такая вершина единственная, и она называется *корнем*.

Примеры корневых деревьев:
* наследование классов в языках программирования (если множественное наследование запрещено),
* дерево факторизации числа на простые (в общем случае не уникальное),
* иерархия в какой-нибудь компании,
* просто множество как-то вложенных объектов (ссылка на крысу-роботягу).

Сегодня мы поговорим о разных задачах на корневых деревьях. Они все бесполезны в реальной жизни, но очень красивые, и поэтому часто встречаются на олимпиадах.

![dfs](https://raw.githubusercontent.com/e-maxx-eng/e-maxx-eng/master/img/LCA_Euler.png)

## Напоминание: DFS

Посчитаем для каждой вершины времена входа ($tin$) и выхода ($tout$) из неё во время эйлерова прохода. 

In [None]:
vector<int> g[maxn];
int p[maxn], tin[maxn], tout[maxn];
int t = 0;

void dfs (int v) {
    tin[v] = t++;
    for (int u : g[v])
        dfs(u);
    tout[v] = t;
}

У этих массивов много полезных свойств:
* Вершина $u$ является предком $v$ $\iff tin_v \in [tin_u, tout_u) $. Эту проверку можно делать за константу.
* В $tin$ есть все числа из промежутка от 0 до $n-1$. У каждой вершины — свой номер.
* Размер поддерева вершины $v$ (включая саму вершину) равен $tout_v - tin_v$.
* Если ввести нумерацию вершин, соответствующую $tin$-ам, то поддерево вершины — всегда какой-то промежуток в этой нумерации.

## Наименьший общий предок

> Дано дерево $T$. Требуется отвечать на запросы нахождения наименьшего общего предка вершин $u_i$ и $v_i$, то есть вершины $w$, которая лежит на пути от корня до $u_i$, на пути от корня до $v_i$, и при этом самую глубокую (нижнюю) из всех таких.

По-английский эта задача называется *Least Common Ancestor*. Есть много разных способов её решать, и мы рассмотрим основные.

![lca](http://homepages.kcbbs.gen.nz/tonyg/pictures/least-common-ancestor.png)

Для лучшего понимания — тривиально (за линейное время) это можно делать так:

In [None]:
bool a (int u, int v) {
    return tin[u] <= tin[v] && tin[v] <= tout[u];
}

int lca (int u, int v) {
    while (!ancestor(u, v))
        u = p[u];
    return u;
}

## LCA: двоичные подъемы

Предпосчитаем для каждой вершины её 1-го предка, 2-го предка, 4-го, и т.д. Сохраним это всё в двумерном массиве `up` размера $n \times \lceil \log n \rceil$ — столько точно хватит. В `up[v][d]` будет храниться предок вершины $v$ на расстоянии $2^d$, а если такой вершины не существует — то корень.

Такой препроцессинг можно выполнить за $O(n \log n)$, используя тот факт, что предок на расстоянии $2^{d+1}$ — это предок на расстоянии $2^d$ предка на расстоянии $2^d$:

In [None]:
int up[maxn][logn];

void dfs (int v) {
    for (int l = 1; l < logn; l++)
        up[v][l] = up[up[v][l-1]][l-1];
    tin[v] = t++;
    for (int u : g[v]) {
        up[u][0] = v;
        dfs(u);
    }
    tout[v] = t++;
}

Пусть поступил очередной запрос — пара вершин $(u, v)$:
* Проверим, не является ли одна вершина предком другой — в таком случае она и является результатом.
* Иначе, пользуясь массивом `up`, будем подниматься по предкам одной из них, пока не найдём самую высокую вершину, которая ещё не является предком другой. Следующая за ней будет искомым LCA.

Подробнее про второй пункт. Пусть $L = \lceil \log n \rceil$. Присвоим $i = L$. Будем уменьшать эту переменную на единицу, пока `up[v][i]` не станет предком $u$. Когда это произошло, двигаем указатель на $2^i$-го предка $v$, и продолжаем дальше. Мы можем это делать, потому что два раза прыгать — бессмысленно.

In [0]:
int lca (int v, int u) {
    if (a(v, u)) return v;
    if (a(u, v)) return u;
    for (int l = logn-1; l >= 0; l--)
        if (!ancestor(up[v][l], u))
            v = up[v][l];
    return up[v][0];
}

### Асимптотика

Препроцессинг — $O(n \log n)$, как размер массива `up`, каждый элемент которого вычисляется за константу.

Ответ на запрос — $O(\log n)$, потому что по сути мы делаем один бинпоиск.

## Запросы на путях

Пусть нас вместо LCA спрашивают, например, о минимуме на пути (на всех рёбрах записаны какие-то числа).

Мы можем использовать метод двоичных подъемов, храня минимум на пути до предка вместе с самим предком.

Аналогичным образом можно считать сумму, `gcd`, полиномиальный хэш и много других странных функций на пути, но только в статичном случае (т. е. когда у нас нет обновлений).

## Сведение к RMQ

Другая идея — это пройтись dfs-ом и выписать два массива: глубины вершин и их номера.

Теперь, у нас есть запрос: найти LCA от вершин $a$ и $b$. Пусть мы посетили $a$ первой, тогда посмотрим на момент, когда мы из нее вышли и на момент, когда впервые вошли в $b$. Где-то по пути мы должны были прийти в наименьший общий предок, потому что путь от $a$ до $b$ в дереве единственный. Где-то на этом массиве выписанных глубин и будет LCA — на той позиции, где глубина минимальная.

Получается, что можно свести задачу к RMQ на массиве глубин — для этого можно задействавать какую-нибудь структуру, например ДО.

### Разреженная таблица

Помимо ДО, есть более крутая структура, позволяющая отвечать на запрос минимума за O(1). Подробнее в [соответствующей статье](http://sereja.me/a/sparse-table).

## А наоборот можно?*

интересный с теоретической точки зрения факт: LCA сводится к RMQ, но не наоборот.

На самом деле, существует алгоритм, и даже несколько, которые решают LCA быстрее, чем за $O(\log n)$ на запрос. Но из этого не следует, что можно с такой же асимптотикой решать RMQ.

Подробнее смотрите алгоритм Фараха-Колтона-Бендера. У него линейная асимптотика, но очень плохая константа, поэтому на контестах писать его не надо. Это так, для общего образования.