# Центроидная декомпозиция

Центроидная декомпозиция — обобщение метода «разделяй-и-властвуй» на деревья (массив можно представить бамбуком, так что это действительно обобщение). Обычно её используют для решения двух типов задач: «сколько есть путей с такими-то свойствами» и «есть ли такое-то свойство у этого пути».

Иногда вместо неё можно написать Heavy-light декомпозиция, что чуть сложнее, или метод переливаний, что чуть проще.

![](https://tanujkhattar.files.wordpress.com/2016/01/1.jpg?w=700)

**Определение**. *Центром* или *цетроидом* (англ. *centroid*) дерева будем называть вершину, при удалении которой размеры оставшихся компонент будут не более $\frac{n}{2}$.

Выясняется, что центр всегда существует — это следует из алгоритма его поиска:

In [None]:
int s[maxn];

int size (int v) {
    s[v] = 1;
    for (int u : g[v])
        s[v] += sizes(u);
    return s[v];
}

// второй параметр — размер дерева
int centroid (int v, int n) {
    for (int u : g[v])
        if (s[u] > n/2)
            return centroid(u, n);
    return v;
}

**Утверждение.** `centroid` действительно находит цетроид.

**Доказательство:**

* `centroid` вернет вершину, у которой размеры всех детей не больше $\frac{n}{2}$ (это явно проверяется в `if`-е).
* Мы пришли в эту вершину, когда её размер был больше $\frac{n}{2}$, а это значит, что в «обратном» направлении есть не более $n - (\frac{n}{2}+1) = \frac{n}{2}-1$ вершин.
* Значит, размеры всех соседей не больше половины $n$, и алгоритм корректен.

Иногда центров два (пример: 1-**2-3**-4), тогда алгоритм вернёт «нижний» центроид.

**Определение**. *Центроидной декомпозицией* будем называть рекурсивный процесс «выделить центроид, удадить, запуститься от компонент».

**Определение**. *Компонентой центроида* будем называть множество вершин, достижимых из центроида непосредственно перед его удалением.

Заметим, что в конце всё дерево будет удалено, а значит каждая вершина ровно один раз побывала центроидом своей компоненты.

Теперь поймём, зачем мы всё это делали.

**Утверждение**. Каждая вершина входит в $O(\log n)$ компонент.

**Доказательство.** Центроид разбивает дерево на компоненты в хотя бы два раза меньшего размера. Значит, никакая вершина не может «выжить» более $\lceil \log_2 n \rceil$ разделений.

**Утверждение**. Для любого пути $a \leadsto b$ есть единственный центроид $c$, в чьей компоненте были и $a$, и $b$.

**Доказательство.** Каждая вершина когда-то была центроидом. Какая-то из вершин на пути была центроидом первой, и она навсегда разъединила $a$ и $b$.

Запомните эти факты: мы будем их использовать для подсчета количества путей с какими-то свойствами или ответа на запросы про пути.

## Подсчет путей с заданным свойством

Рассмотрим конкретный пример: подсчёт путей с заданной длины.

Посмотрим на процесс центроидной декомпозции (см. определение выше). Для каждого центроида перед его удалением будем прибавлять к ответу число интересующих нас путей, которые проходят через этот центроид. Количество таких путей можно посчитать за размер текущей компоненты. Асимптотика $O(n \log n)$, потому что каждая вершина входит в $O(\log n)$ компонент.

Чтобы не делать явно удаление вершины, заведем массив `used[]` — была ли вершина удалена.

In [None]:
int l = 179; // нужная нам длина
int ans = 0; // тут мы храним ответ

bool used[maxn];
int s[maxn];

void sizes (int v, int p) {
    s[v] = 1;
    for (int u : g[v])
        if (u != p && !used[u])
            sizes(u, v), s[v] += s[u];
}

int centroid (int v, int p, int n) {
    for (int u : g[v])
        if (u != p && !used[u] && s[u] > n/2)
            return centroid(u, v, n);
    return v;
}

// записывает в t[] глубины вершин
void dfs (int v, int p, int d, vector<int> &t) {
    t.push_back(d);
    for (int u : g[v])
        if (u != p && !used[u])
            dfs(u, v, t);
} 

void solve (int v) {
    /* <единственный зависящий от конкретной задачи код> */
    size(v);
    vector<int> d(s[v], 0);
    d[0] = 1;
    for (int u : g[v]) {
        if (!used[u]) {
            vector<int> t;
            dfs(u, v, 1, t);
            for (int x : t)
                if (x <= l)
                    ans += d[l-x];
            for (int x : t)
                d[x]++;
        }
    }
    /* </единственный зависящий от конкретной задачи код> */

    used[v] = 1;
    for (int u : g[v])
        if (!used[u])
            solve(centroid(u, v, s[u]/2));
}

Во многих задачах вместо центроидной декомпозиции можно использовать сливающиеся сеты, heavy-light декомпозицию или разные (часто персистентные) структуры данных. Конкретно здесь самое просто решение будет со сливающимися сетами с сохранением асимптотики $O(n \log n)$.

## Как структура данных

Мы находим что нам надо сразу, как получаем новую компоненту. Если мы у нас есть запросы посчитать что-то на пути, то мы часто можем обрабатывать их в offline, храня вместе с вершиной список ещё не отвеченных запросов, относящихся к ней. Таким образом, каждый запрос будет просмотрен $O(\log n)$ раз, пока не будет удален.

Альтернативно, можно сначала «построить» центроидную декомпозицию, а потом отвечать на запросы. Создадим двумерный массив `centroid[][]` размера $n \times \log n$, в котором для каждой вершины будем хранить $O(\log n)$ центроидов, в чьи компоненты она когда-то входила, а также будем хранить информацию, которая нам будем нужна для ответа на запросы. Например, если мы хотим посчитать минимум на пути, то мы для каждой пары вершина-центроид храним минимум на соответствующем пути. Тогда, при ответе на запрос, мы за $O(\log n)$ операций находим центроид на нужном нам пути и очевидным образом считаем ответ. Так мы можем отвечать на запросы в online и с субьективно более опрятным кодом.

Подробнее смотрите в [конспекте от Сергея Копелиовича](http://acm.math.spbu.ru/~sk1/mm/lections/zksh2016-centroid/conspect.pdf).