# Clase 24

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2024%20-%20Estructuras%20de%20Datos%20II.ipynb)

# Requisitos Previos

* Matemática Básica
* Matemática Discreta

# Binary Indexed Tree

El *Binary Indexed Tree (BIT)* o *Fenwick Tree (por Peter Fenwick)* es una estructura de datos que permite modificaciones y consultas en $O(\log{n})$, siendo $n$ la cantidad de elementos de referencia en la estructura (sea $a$ el arreglo con todos esos elementos). Toma como referencia una función asociativa $f$ y calcula respuestas parciales para optimizar el tiempo de consulta y de modificación.

El BIT de manera natural permite almacenar y consultar datos respecto a un prefijo de $a$ en el caso general si las actualizaciones son *sobreescribibles*; sin embargo, si $f$ es invertible, entonces el BIT permite consultar cualquier rango de los elementos almacenados considerando que:

$$ a_{l}\oplus a_{l+1} \oplus \cdots \oplus a_{r} = f^{-1}(a_{1}\oplus \cdots \oplus a_{r}, a_{1}\oplus \cdots \oplus a_{l-1}) $$

Consideraremos que las respuestas parciales de la estructura serán almacenadas en un arreglo $ft$. La cantidad de memoria que necesita el BIT es $O(n)$, siendo más específicos, necesitaría una cantidad cercada a $n + 1$ estructuras del mismo tipo que los elementos de $a$, lo cual probaremos a continuación.

## ¿Cómo guardar y consultar los datos?

Lo que propone el BIT es almacenar en la posición $pos$ el resultado de todos los elementos en el rango $[pos - LSO(pos) + 1, pos]$, donde $LSO(pos)$ es el *Least Significant One* de $pos$, el cual es la máxima potencia de $2$ tal que $pos$ es divisible por ella (esta terminología ya la habíamos usado en Bitmask, por lo que no profundizaremos al respecto acá).

Ahora, asumiendo que mantenemos dicha forma de almacenar los datos, es sencillo notar que para obtener el resultado de todos los elementos del rango $[1, pos]$ basta con usar la siguiente iteración:

```C++
node getPrefix(int pos){
    if(pos == 0) return Neutro; // Elemento neutro porque no hay elementos en [1, 0]
    return f(getPrefix(pos - LSO(pos)), ft[pos]); // Quitamos el LSO, obtenemos su respuesta y operamos con ft[pos]
}
```

**Teorema:** El algoritmo `getPrefix(pos)` obtiene adecuadamente la respuesta de los elementos en el rango $[1, pos]$ para todo $pos = 0, 1, \ldots, n$, siendo la respuesta para $pos = 0$ el elemento neutro de la función $f$.

**Prueba:**

Notemos que el caso $pos = 0$ es trivial por la recursión `getPrefix`.

Para $pos > 0$ probaremos por inducción sobre la cantidad de bits prendidos de $pos$ que la respuesta es calculada correctamente:

1. Si $pos$ tiene un solo bit prendido, es una potencia de $2$, por lo que devolveremos $f(getPrefix(0), ft[pos]) = f(Neutro, ft[pos]) = ft[pos]$, que es la respuesta parcial de los elementos en el rango $[1, pos]$ por la naturaleza del arreglo $ft$.

2. Asumimos que para un $pos \leq n$ con $k$ bits prendidos la respuesta es correctamente calculada.

3. Sea $pos \leq n$ con $(k + 1)$ bits prendidos, entonces la recursión devolverá $f(getPrefix(pos - LSO(pos)), ft[pos])$, donde $ft[pos]$ tiene la respuesta parcial para el rango $[pos - LSO(pos) + 1, pos]$ y $pos - LSO(pos)$ tiene solo $k$ bits prendidos. Por hipótesis inductiva tendremos que $getPrefix(pos - LSO(pos))$ devuelve la respuesta correcta para el rango $[1, pos - LSO(pos)]$, así que $f(getPrefix(pos - LSO(pos)), ft[pos])$ obtiene la unión de las respuestas parciales de los rangos $[1, pos - LSO(pos)]$ y $[pos - LSO(pos) + 1, pos]$ dando como resultado $[1, pos]$.

Ya que la recursión da la respuesta correcta, podemos plantear una versión iterativa:

```C++
node getPrefix(int pos){
    node res = Neutro;
    while(pos > 0){
        res = f(ft[pos], res); // Notemos que el orden está invertido respecto a la recursión
        pos -= LSO(pos); // Es equivalente usar pos &= pos-1
    }
    return res;
}
```

Esta función iterativa da la misma respuesta que la recursiva gracias al orden de la función $f$ al actualizar $res$: Tendremos la invariante de que $res$ almacenará la respuesta de un sufijo de $[1, pos]$ y al final terminará con todo el rango.

## ¿Cómo modificar el BIT?

**Función sobreescribible (no es una definición conocida, solo es un nombre temporal que usaremos acá):** Función en la que cambiar de un valor $x$ a $y$ se puede realizar operando $x$ con algún valor $z$ de manera que $f(x,z) = y$ y además se debe cumplir que $f(a, y, c) = f(a, x, c, z)$.

Para entender bien a qué nos referimos con función *sobreescribible*, tomaremos como referencia a la función suma, la cual es *sobreescribible* e invertible.

* El cambiar el valor de la posición $pos$ de $a_{pos}$ a $a_{pos} + x$ implicar sumar $x$ a todas las posiciones que contengan $pos$ en su rango. Esta función es sobreescribible. Además, la consulta en rango será $getPrefix(r) - getPrefix(l - 1)$.

Entonces, si $f$ es sobreescribible nos bastará definir el valor de $z$ para modificar todas las respuestas parciales que contengan la posición a modificar. La pregunta ahora es ¿Cómo iterar sobre dichas posiciones de manera eficiente? Propondremos el siguiente algoritmo:

```C++
void update(int pos, node val){
    if(pos > n) return;
    ft[pos] = f(ft[pos], val);
    update(pos + LSO(pos), val);
}
```

Ahora deberemos probar la correctitud del algoritmo, verificaremos que dado un $1 \leq pos \leq n$ inicial, la secuencia generada por:

$$ a_{0} = pos $$
$$ a_{i} = a_{i - 1} + LSO(a_{i-1}) $$

**Teorema:** Para todos los elementos de la secuencia $a$ con primer elemento igual a $pos$ se da que $a_{i} - LSO(a_{i}) + 1 \leq pos \leq a_{i}$.

**Prueba (Por inducción):**

1. Es evidente que $pos - LSO(pos) + 1 \leq pos$ ya que $pos$ es positivo, por lo que $LSO(pos) \geq 1$ y $pos \leq pos$.

2. Asumamos que el elemento de posición $i$ cumple con $a_{i} - LSO(a_{i}) + 1 \leq pos \leq a_{i}$.

3. El elemento $a_{i + 1}$ es igual a $a_{i} + LSO(a_{i})$, es sencillo notar que como $a_{i}$ cumple con la propiedad, entonces $1 \leq pos \leq a_{i} \leq a_{i} + LSO(a_{i}) = a_{i + 1}$, por lo que $pos \leq a_{i+1}$. Por otro lado, debemos hallar una relación entre $LSO(a_{i})$ y $LSO(a_{i} + LSO(a_{i}))$. Ya que el $LSO(a_{i})$ es la máxima potencia de $2$ que divide a $a_{i}$ entonces $a_{i} = LSO(a_{i}) \cdot b$ donde $b$ debe ser impar. Entonces $LSO(a_{i} + LSO(a_{i})) = LSO(LSO(a_{i})\cdot b + LSO(a_{i})) = LSO(LSO(a_{i})(b + 1))$, pero como $b$ es impar, $b + 1$ debe ser par y por ende $LSO(a_{i})(b+1)$ es divisible por $2\cdot LSO(a_{i})$ como mínimo (puede ser incluso mayor dependiendo del valor de $b$). De esta manera notamos que $LSO(a_{i} + LSO(a_{i})) \geq 2\cdot LSO(a_{i})$ y podemos realizar la siguiente manipulación:

$$ 2 \cdot LSO(a_{i}) \leq LSO(a_{i} + LSO(a_{i})) $$

$$ LSO(a_{i}) - LSO(a_{i} + LSO(a_{i})) \leq - LSO(a_{i}) $$

$$ a_{i} + LSO(a_{i}) - LSO(a_{i} + LSO(a_{i})) + 1 \leq a_{i} - LSO(a_{i}) + 1 $$

Y por hipótesis inductiva tenemos que $a_{i} - LSO(a_{i}) + 1 \leq pos$, por lo que:

$$ a_{i} + LSO(a_{i}) - LSO(a_{i} + LSO(a_{i})) + 1 \leq a_{i} - LSO(a_{i}) + 1 \leq pos $$

Para concluir que $a_{i + 1} - LSO(a_{i + 1}) + 1 = a_{i} + LSO(a_{i}) - LSO(a_{i} + LSO(a_{i})) + 1 \leq pos \leq a_{i+1}$.

Ahora que tenemos que nuestra recursión actualiza adecuadamente, podemos plantear su versión iterativa:

```C++
void update(int pos, node val){
    while(pos <= n){
        ft[pos] = f(ft[pos], val);
        pos += LSO(pos);
    }
}
```

**Nota:** Otra función sobreescribible es cuando debemos modificar un elemento con el mínimo o máximo entre el valor actual y el nuevo valor. Al ser modificaciones monótonas, se pueden *sobreescribir* en las respuestas parciales, de ahí el nombre de este tipo de funciones.

## Yendo más allá: Modificación en rango para suma

Supongamos que deseamos modificar todos los elementos en un rango $[l, r]$ y sumarles $x$ a todos, con los conocimientos que tenemos hasta ahora esto tomaría $O(n\log{n})$ por el tener que modificar elemento por elemento. Sin embargo, plantearemos una forma de manejar **dichas modificaciones** (los BIT no almacenarán los elementos, sino sus variaciones) de manera eficiente:

Tendremos dos BIT $ft_{1}$ y $ft_{2}$ para manejar diferentes partes de la modificación. Notemos que si agregamos $x$ al rango $[l, r]$, entonces al realizar una consulta sobre los prefijos de los elementos debería tener resultados:

$$ getPrefix(i) = \left\{ \begin{array}{cc} 0 &i < l \\ x\cdot(i - (l - 1)) &l \leq i \leq r \\ x \cdot (r - l + 1) &r < i \end{array} \right. $$

Si intentamos cambiar ligeramente la forma de ver la función:

$$ getPrefix(i) = \left\{ \begin{array}{cc} 0\cdot i - 0 &i < l \\ x\cdot i - x\cdot(l - 1)) &l \leq i \leq r \\ 0\cdot i - (x\cdot (l - 1) - x\cdot r) &r < i \end{array} \right. $$

Notemos que el primer término de cada resultado posible depende del valor de $i$ y el coeficiente sería el resultado de agregar $x$ a la posición $l$ y $-x$ a la posición $r + 1$. Por otro lado, el segundo término sería el resultado de agregar $x \cdot (l - 1)$ a la posición $l$ y agregar $-x\cdot r$ a la posición $r + 1$. De esta manera tendremos que el BIT $ft_{1}$ almacenará el coeficiente del primer término y el $ft_{2}$ el segundo término, de manera que la consulta de la modificación en todo un prefijo es:

$$ getPrefixModification(pos) = pos \cdot getPrefix(ft_{1}, pos) - getPrefix(ft_{2}, pos) $$

La función $getPrefix$ fue extendida para recibir el BIT sobre el que se hace la consulta (en términos de implementación basta con colocar como argumento el identificador del BIT).

```C++
int ft[2][N];

void update(int id, int pos, int val){
    while(pos <= n){
        ft[id][pos] += val;
        pos += LSO(pos);
    }
}

int getPrefix(int id, int pos){
    int res = 0;
    while(pos > 0){
        res += ft[id][pos];
        pos -= LSO(pos);
    }
    return res;
}

void updateRange(int l, int r, int x){
    update(0, l, x);
    update(0, r + 1, -x);
    update(1, l, x * (l - 1)); // Cuidado con el overflow
    update(1, r + 1, - x * r); // Cuidado con el overflow
}

int getPrefixModification(int pos){
    return getPrefix(0, pos) * pos - getPrefix(1, pos);
}
```

Y de esta manera podemos sumar una constante en rango en $O(\log{n})$ ya que solo realizaremos 4 modificaciones de BIT.

## Problemas para practicar en clase

- [Inversion Count](https://www.spoj.com/problems/INVCNT/)
- [Horrible Queries](https://www.spoj.com/problems/HORRIBLE/)
- [K-query](https://www.spoj.com/problems/KQUERY/)
- [Mega Inversions](https://www.spoj.com/problems/TRIPINV/)
- [Supernumbers in a permutation](https://www.spoj.com/problems/SUPPER/)
- [Coder Ratings](https://www.spoj.com/problems/RATING/)

# BIT 2D

Para el caso multidimensional basta notar que podemos usar exactamente el mismo algoritmo pero de forma anidada tanto para consultas como para modificaciones sobre el arreglo $ft$, en el caso de una matriz de $n \times m$ para almacenar sumas tendríamos la variación:

```C++
void update(int x, int y, int val){
    for(int i = x; i <= n; i += LSO(i)){
        for(int j = y; j <= m; j += LSO(j)){
            ft[i][j] += val;
        }
    }
}

int getPrefix(int x, int y){
    int res = 0;
    for(int i = x; i > 0; i -= LSO(i)){
        for(int j = y; j > 0; j -= LSO(j)){
            res += ft[i][j];
        }
    }
    return res;
}

```

Notemos que ahora el "prefijo" es toda el área $1 \leq i \leq x, 1 \leq j \leq y$, por lo que tendríamos dicha suma de elementos como respuesta. Si deseáramos los elementos en un rango $x_{1} \leq i \leq x_{2}, y_{1} \leq j \leq y_{2}$ haríamos la siguiente consulta (usando principio inclusión-exclusión):

```C++
int query(int x1, int y1, int x2, int y2){
    return getPrefix(x2, y2) + getPrefix(x1 - 1, y1 - 1) - getPrefix(x1 - 1, y2) - getPrefix(x2, y1 - 1);
}
```


## Problemas para practicar en clase

- [Implementacion 2D](https://www.spoj.com/problems/MATSUM/)
- [Implementacion 2D (DP 2D tambien sirve)](https://codeforces.com/contest/835/problem/C)