# Clase 45

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2045%20-%20Estructuras%20de%20Datos%20X.ipynb)

# Requisitos Previos

* Centroid Decomposition

## Principio Inclusión-Exclusión sobre el Divide and Conquer on Trees

La forma natural de analizar un Divide and Conquer on Trees consiste en plantear una solución considerando que tenemos un árbol con raíz $r$ y resolver el problema basándonos en que dicha solución es lo suficientemente rápida para el problema si le agregamos un factor logarítmico.

Sin embargo, esto no siempre es el caso, así que debemos aplicar Principio Inclusión-Exclusión para algunos casos en los que se nos pide contar los caminos que cumplan con ciertas condiciones.

Consideremos el siguiente [problema](https://codeforces.com/problemset/problem/293/E)

El enunciado se resume a que tenemos un árbol $T$ con aristas ponderadas y queremos contar todos los caminos que tengan a lo mucho $l$ aristas y la suma de sus pesos sea a lo mucho $w$.

Es complicado plantear una solución lo suficientemente eficiente que se haga de manera incremental, así que debemos buscar la alternativa del PIE: Si tenemos una forma de contar los caminos entre todos los pares de nodos $(u, v)$ que pertenezcan a un mismo subárbol (sea esta función $f(x)$), entonces el aporte que hace el centroide $c$ es:

$$ A(c) = f(c) - \sum\limits_{v \text{ es hijo de }c}f(v) $$

Y esta forma es mucho más sencilla de analizar, pues basta con no realizar conteos dobles al calcular $f$ y el cálculo directo se puede realizar usando two pointers y alguna estructura de datos para *order statistics* y de esa forma obtendremos un procesamiento de $O(size \cdot log{size})$, donde $size$ es el tamaño del subárbol considerado.

Entonces, si la función `compute` nos da el resultado de $f$, el procesamiento por cada centroide sería esbozado como:

```C++
void solve(int u){
	T = 0;
	h[u] = path[u] = 0;
	DFS(u);
	ans += compute(in[u], out[u]);
	for(int v : G[u]){
		if(removed[v]) continue;
		ans -= compute(in[v], out[v]);
	}
}
```

Y para hallar el resultado podemos ordenar todos los nodos por $(altura, suma)$ y aplicar el two pointers para ir insertando todos los elementos válidos posibles para no excedernos las $l$ aristas en un treap y luego consultar todos los elementos $x$ con $x \leq w - suma$.

```C++
long long compute(int l, int r){
	vector< pair<int, int> > values;
	node* T = nullptr;
	for(int i = l; i <= r; i++){
		int at = a[i];
		values.emplace_back(make_pair(h[at], path[at]));
	}
	sort(values.begin(), values.end());
	int pos = 0;
	long long res = 0LL;
	for(int i = values.size() - 1; i >= 0; i--){
		while(pos < values.size() and values[pos].first + values[i].first <= llim){
			T = insert(T, values[pos].second);
			pos += 1;
		}
		T = getLeq(T, wlim - values[i].second, res); // Calcula la respuesta y la agrega a res
	}
	return res;
}
```

### Problema para implementar

- [Awesome Shawarma](https://codeforces.com/problemset/gymProblem/101991/A)

## Ancestor-Descendant Query - Fenwick Tree Generalization using Centroids

Ya hemos visto cómo propagar información a los caminos desde un nodo $u$ a todos los demás, ahora debemos analizar cómo se puede propagar información **sólo al subárbol o a los ancestros** de $u$.

Vamos a usar cierta notación para que sea más sencillo el análisis:

Sea $T = (V, E)$ el árbol del cual obtendremos el Centroid Tree $CT$, entonces.

- $LCA_{G}(x, y)$ es el LCA de los nodos $x$ y $y$ en el arbol $G$.
- $C(x) = \{v \in V : v\text{ esta en el camino desde la raiz de }CT\text{ hasta }x\}$
- $S_{r}(x) = \{v \in V : v\text{ esta en el subarbol de }x\text{ cuando }r\text{ es raiz de }T\}$
- $A_{r}(x) = \{v \in V : v\text{ esta en el camino desde }x\text{ hasta }r\text{ en }T\}$

**Teorema:** Dado $x \in V$ y una raíz $r \in V$ fija, el conjunto $I(x) = C(x) \cap S_{r}(x)$ tiene todos los nodos mediante los cuales $x$ puede propagar información a todos sus descendientes.

**Prueba:**

Si $y \in S_{r}(x)$, entonces cualquier nodo $z$ de ese camino también pertenece a $S_{r}(x)$. Esto quiere decir que, dado que $l = LCA_{CT}(x, y) \in x \leadsto y$, entonces $LCA_{CT}(x, y) \in S_{r}(x)$. Ya que $l \in S_{r}(x)$ y $l \in C(x)$, tendremos que $l \in C(x) \cap S_{r}(x) = I(x)$.

Como $y$ es fijo pero arbitrario, todos los posibles nodos $l$ están contenidos en $I(x)$, lo que concluye la prueba.

**Teorema:** Dado $x \in V$ y una raíz $r \in V$ fija, el conjunto $I(x) = C(x) \cap A_{r}(x)$ tiene todos los nodos mediante los cuales $x$ puede propagar información a todos sus ancestros.

**Prueba:**

Análoga al caso de descendientes.

Esto nos da la idea de que nos basta con establecer un filtro para propagar información a ancestros o descendientes, pero una nueva pregunta que surge es si es que, al momento en que propagamos la información, se duplicará algún dato propagado.

**Teorema:** Sean dos nodos $u$ y $v$, así como los conjuntos $S'_{r}(u) = S_{r}(u) \cap C(u)$ y $A'_{r}(v) = A_{r}(v) \cap C(v)$, entonces se cumple que $D(u, v) = |S'_{r}(u) \cap A'_{r}(v)| \leq 1$.

**Prueba:**

Hay dos posibles casos:

1) $u$ y $v$ tienen una relación ancestro-descendiente: Solamente existe un nodo en $D(u, v)$, pues luego de que este nodo fuera seleccionado como centroide, $u$ y $v$ estarán en diferentes componentes, por lo que luego del primer nodo que cumpla con estar en el camino de $u$ a $v$, no podrán existir otros nodos que puedan pertenecer a $D(u, v)$.

2) $u$ y $v$ no tienen una relación ancestro-descendiente: Los conjuntos $S_{r}(u)$ y $A_{r}(v)$ no se intersectan, por lo que al intersectar a ambos con el mismo conjunto tampoco tendrán elementos en común. $|S'_{r}(u) \cap A'_{r}(v)| = 0$ en este caso.

Esto quiere decir que si propagamos de ancestro a descendiente o viceversa, podremos realizarlo sobre $S_{r}(x)$ o $A_{r}(x)$, respectivamente, sin propagar la misma información dos veces.

Para mostrar la forma básica de modificación de ancestros y descendientes consideraremos que se tienen los timestamps de llegada y salida de cada nodo, para verificar rápidamente la relación.

### Modificar ancestros/descendientes y consultar la información

Para propagar la información a los ancestros, tenemos que recordar que si tenemos un nodo $x$, este mandará la información a los nodos que estén en $A'_{r}(x)$; pero para consultar la información de $x$, tendremos que consultar a los descendientes (pues estos me han propagado la información a mí que soy su ancestro).

```C++
void update(int u, int add){
    for (int v = u; v != -1; v = par[v]){
        if(in[v] <= in[u] && out[u] <= out[v]){
            ft[v] += add;
        }
    }
}
```

```C++
int query(int u){
    int ans = 0;
    for (int v = u; v != -1; v = par[v]){
        if(in[u] <= in[v] && out[v] <= out[u]){
            ans += ft[v];
        }
    }
    return ans;
}
```

Para el caso de propagar información a los descendientes, las condicionales se intercambian entre las dos funciones.


### Problemas para resolver en clase

- [Propagating tree](https://codeforces.com/problemset/problem/383/C)
- [Maximum Child Sum](https://www.spoj.com/problems/MAXCHILDSUM/)

## Circular query

Circular query es una forma especial de aplicar el Centroid Decomposition, en la cual la información a propagar no se da hacia los ancestros, descendientes o todos los demás nodos, sino que a todos los nodos que estén a una distancia menor o igual a una constante $d$.

Este suele estar apoyado de alguna estructura monótona de modificaciones o de *order statistics*, la aplicación de la técnica varía por problema, así que analizaremos dos problemas diferentes sobre los cuales podemos aplicar Circular query:

### [Tree Query](https://codeforces.com/problemset/gymProblem/100570/F)

En este problema debemos almacenar las consultas y responderlas de manera offline, más que todo por comodidad. Entonces, podemos establecer una lista para cada nodo con las consultas. Ya que cada nodo es visitado $O(\log{n})$ veces, esa misma cantidad de veces visitaremos cada consulta realizada, así que la complejidad por ahora va siendo $O(q\log{n})$.

Entonces, si tenemos un centroide $c$, necesitaremos una estructura de datos para *order statistics*, pues tendremos que consultar la cantidad de alturas anteriores menores o iguales a un valor $l[x] - h[u]$, donde $l[x]$ es el parámetro de la consulta $x$ y $u$ es el nodo consultado.

Debido al uso de la estructura de datos, tendremos al final una complejidad de $O((n + q)\log^{2}{n})$. La siguiente implementación de las funciones de actualización y consulta usó compresión de coordenadas y Fenwick Tree.

```C++
int query(long long x){
	int lo = 0, hi = len - 1;
	while(lo < hi){
		int mi = lo + (hi - lo + 1) / 2;
		if(val[mi] <= x) lo = mi;
		else hi = mi - 1;
	}
	return getSum(lo);
}
 
void addQueries(int u){
	for(auto x : queries[u]){
		if(l[x] >= h[u]){
			ans[x] += query(l[x] - h[u]);
		}
	}
}
```

Donde $len$ es la cantidad de diferentes valores en la compresión de coordenadas, $val[i]$ es el $i$-ésimo valor de la compresión y $getSum$ es la función usual del Fenwick Tree.

```C++
void solve(int u){
	T = 0;
	h[u] = 0;
	DFS(u);
	compress(u);
	for(int i = 0; i < G[u].size(); i++){
		int v = G[u][i];
		if(removed[v]) continue;
		for(int i = in[v]; i <= out[v]; i++){
			int at = a[i];
			addQueries(at);
		}
		for(int i = in[v]; i <= out[v]; i++){
			int at = a[i];
			update(h[at], 1);
		}
	}
	for(int i = 0; i <= len; i++) ft[i] = 0;
	update(0, 1);
	for(int i = G[u].size() - 1; i >= 0; i--){
		int v = G[u][i];
		if(removed[v]) continue;
		for(int i = in[v]; i <= out[v]; i++){
			int at = a[i];
			addQueries(at);
		}
		for(int i = in[v]; i <= out[v]; i++){
			int at = a[i];
			update(h[at], 1);
		}
	}
	addQueries(u);
	for(int i = 0; i <= len; i++) ft[i] = 0;
}
```

Notemos que estamos iterando dos veces para considerar los caminos con $in[v] \leq in[u]$ y luego con $in[u] \leq in[v]$.

### [LWDB](https://codeforces.com/problemset/gymProblem/100633/D)

En este problema debemos realizar modificaciones de manera online, pues nos van a mandar consultas intermedias del color de cada nodo. Para poder resolver el problema, podemos realizar algunas observaciones que nos van a ayudar a establecer una solución lo suficientemente eficiente:

1) Si propagamos información desde el nodo $u$ hacia su ancestro $v$ en el Centroid Tree, tendremos que todos los nodos $x$ con $\delta(x, v) \leq d - \delta(u, v)$ serán coloreados por dicha modificación: Es sencillo notar que podemos establecer esa condición sin restringir a los nodos que son del mismo subárbol de $u$ desde $v$, pues la condición solo se debilita a medida que te acercas a $u$.

2) Ya que la información del coloreo es sobreescribible, podemos mantener una pila por cada nodo $u$ de manera que esta almacenará la distancia, tiempo y color con el que han llegado las modificaciones que todavía no han sido sobreescritas por completo (es decir, no ha llegado alguna otra modificación a $u$ más reciente con $d' \geq d$). Esto nos permitirá usar búsqueda binaria para saber de qué color ha sido coloreado algún nodo que tenga distancia $k$ de $u$ o si no ha sido coloreado en absoluto.

3) Recordando que las modificaciones de un $d'$ mayor sobreescriben a las menores, podemos simplemente eliminar los elementos de la pila que sean menores o iguales a $d'$ antes de insertarla. Mantener esta propiedad cuando modificamos la pila permitirá que los valores de distancia estén en orden estrictamente decreciente.

4) Ya que para todo nodo $u$ podremos consultar en $O(\log{n})$ su color y tiempo en que fue coloreado para cada ancestro del Centroid Tree, podemos tomar la modificación de tiempo más reciente y esa será la respuesta, como hay $O(\log{n})$ ancestros, tendremos $O(\log^{2}{n})$ por consulta.

5) Cada nodo $u$ agregará un elemento a la pila de a lo mucho $O(\log{n})$ nodos, ya que cada elemento de la pila tiene solamente $O(1)$ de trabajo (Para ser insertada o eliminada de la pila), la complejidad de las modificaciones en total sería $O(q\log{n} + q\log^{2}{n}) = O(q\log^{2}{n})$.

Un esbozo de las funciones involucradas con la modificación y consulta están a continuación:

```C++
void insert(int u, int d, int col, int t){
	while(!dis[u].empty() and dis[u].back() <= d){ // Eliminamos las sobreescritas antes de insertar
		dis[u].pop_back();
		tim[u].pop_back();
		color[u].pop_back();
	}
	dis[u].emplace_back(d);
	tim[u].emplace_back(t);
	color[u].emplace_back(col);
}
 
void update(int u, int d, int col, int timer){
	int pos = 0;
	for(int v = u; v != -1; v = par[v]){
		int left = d - D[u][pos++];
		if(left < 0) continue; // Si la distancia es menor que 0 no tiene sentido
		insert(v, left, col, timer);
	}
}
```


```C++
int query(int u){
	int ans = 0;
	int pos = 0;
	int anstim = 0;
	for(int v = u; v != -1; v = par[v]){
		int d = D[u][pos++];
		int lo = 0, hi = dis[v].size() - 1;
        if(dis[v].back() < d) continue;
		while(lo < hi){ // Buscamos la modificacion con distancia >= d y distancia minima
            int mi = lo + (hi - lo + 1) / 2;
			if(dis[v][mi] >= d) lo = mi;
			else hi = mi - 1;
		}
		int cur_color = color[v][lo]; // Color asignado a u por el nodo v
		int timer = tim[v][lo]; // Tiempo en que se asignó el color
		if(timer > anstim){ // Cambiamos si el tiempo es más reciente
			ans = cur_color;
			anstim = timer;
		}
	}
	return ans;
}
```