# **Estructura Durocher RMQ**

## Definición del Problema RMQ (Range Minimum Query)

Dado un arreglo $A[1 \dots n]$ de $n$ elementos, se busca realizar $q$ consultas $RMQ(i, j)$ que busca devolver el **mínimo valor** en el subarreglo $A[i \dots j]$, es decir:

$$
\text{RMQ}(i, j) = \min \{ A[k] \mid i \leq k \leq j \}
$$

**Objetivo:** Preprocesar el arreglo $A$ para construir una estructura de datos que permita responder consultas RMQ en el menor tiempo posible, usando un espacio eficiente.


---

Basicamente el problema consiste en hallar rápidamente el valor mínimo en un subarreglo dado de un arreglo. Aunque es posible almacenar todas las respuestas posibles usando mucho espacio $O(n^2)$, la meta en este proyecto es lograr una solución que use **espacio lineal** $O(n)$ y permita consultas en **tiempo constante** $O(1)$, es decir se busca una pareja de complejidad espacio-tiempo $<O(n), O(1)>$, para ello usaremos una estructura de dato conocida como *Sparse Table*, que nos permite resolverlo en $<O(NlogN), \;O(1)>$, pero realizando una serie de modificaciones extras para que la complejidad logre ser lineal para el preprocesamiento. Pero primero veamos como es que funciona un Sparse Table.



## Sparse Table 

El *Sparse Table* es una estructura de datos eficiente para responder consultas de rango sobre un arreglo inmutable, especialmente **consultas idempotentes** como el mínimo, máximo o máximo común divisor.

La idea es precomputar los valores mínimos de subarreglos de longitud \$2^k\$ para cada posición $i$:

> $ST[i][k]$ almacena el mínimo del subarreglo $A[i,..., \;i + 2^{k} - 1]$.

Durante la consulta, se aprovecha la **idempotencia** de la operación mínima:

> \$ RMQ(l, r) = \min(\text{ST}\[l]\[k], \text{ ST}\[r - 2^k + 1]\[k]) \$
> , donde \$k = \lfloor \log\_2(r - l + 1) \rfloor\$

Esto nos permite cubrir cualquier rango usando **dos bloques de tamaño potencia de 2** que se solapan en el rango y dar respuesta en **\$O(1)\$**.



## Idea de Durocher
### Preprocesamiento en O(n)
**"Divison en bloques"**: 

Vamos a dividir el array en $B$ bloques tal que cada bloque sea de tamano $k$, por lo que tendriamos que $B = \lceil \dfrac{n}{k}\rceil$. Luego vamos a construir un nuevo array $b$ de tamano $B$, tal que cada elemento sea el minimo de cada bloque.

$$
b_{i} = \min \left\{ a_j \mid j \in [B \cdot i,..., \ B \cdot (i + 1)> \right\}
$$

Sobre este array vamos a construir un Sparse Table, lo que nos daria una complejidad de, $O(B \; logB)$. Si tomamos un tamano adecuado para que este preprocesamiento sea lineal, podriamos tomar $k = log(n)$, de modo que la complejidad seria.
$$
O(B\; log(B)) = O(\dfrac{n}{k} \; log(\dfrac{n}{k})) = O(\dfrac{n}{k} \; log(n) - log(k))) 
= O(\dfrac{n}{log(n)} \; (log(n) - log(log(n)))) 
\approx O(\dfrac{n}{\cancel{log(n)}} \; \cancel{log(n)})) 
= O(n)
$$

La idea con esto es que cada consulta $[l,\; r]$ ahora podemos plantearlo sobre en que bloque apunta l y r, y para los bloques completos de intermedios podemos utilizar este ST sobre b en $O(1)$. Sin embargo aun tenemos que manejar como tratar con las queries dentro de un mismo bloque.

**"Preprocesar cada par [l,r] en un bloque"**

Para esta seccion lo que se buscara hacer es buscar una forma de caracterizar cada secuencia de numeros para cada bloque en algun patron para luego precomputar cada par $(i, j)$ en $O(k^2)$, ese seria el costo para cada patron posible, pero ahora la pregunta es, cuantas en realidad hay, y como es que las podemos caracterizar?.

Para responder lo anterior es importante observar, que podemos representar un array segun su orden relativo como un *Cartesian Tree*, para ello basta con ejecutar su algoritmo de construccion basado en un stack que lo lograria hacer en $O(k)$.

<img src="img/cartesian_tree_array.png" width="400" />


```
ALGORITMO BuildCartesianTree(A)
    stack ← vacía

    PARA i DESDE 0 HASTA n-1 HACER
        SI stack esta vacía ENTONCES
            stack.push(i)
        SINO
            now ← pila.top()
            SI A[i] > A[now] ENTONCES
                R[now] ← i
                par[i] ← now
                stack.push(i)
            SINO
                last ← -1
                MIENTRAS stack no vacía Y A[i] < A[stack.top()] HACER
                    last ← stack.pop()
                FIN MIENTRAS
                SI last ≠ -1 ENTONCES
                    SI stack no vacía ENTONCES
                        p ← par[last]
                        R[p] ← i
                        par[i] ← p
                    FIN SI
                    L[i] ← last
                    par[last] ← i
                FIN SI
                stack.push(i)
            FIN SI
        FIN SI
    FIN PARA

    MIENTRAS stack no vacía HACER
        stack.pop()
    FIN MIENTRAS

    root ← índice i donde par[i] = -1

FIN ALGORITMO
```

Notemos que, según el algoritmo anterior, cada elemento es añadido y eliminado del stack una única vez. Por lo tanto, podemos asociar dos momentos para cada $a_i$:

* `(` `"push"`: Entrada de $a_i$ al stack 
* `)` `"pop"`: Salida de $a_i$ del stack

Para el ejemplo anterior, la secuencia resultante es: `()()(()(()())())`. Si prestamos aún más atención, podemos reconocer que estas secuencias corresponden a las conocidas *well-balanced bracket sequences* (secuencias de corchetes correctamente balanceadas). Además, se sabe que la cantidad de secuencias válidas de longitud $2n$ está dada por el $n$-ésimo número de Catalán:

$$
C_n = \frac{1}{n+1} \binom{2n}{n}
$$

Esto se debe a la forma en que se ejecuta el algoritmo, lo cual garantiza la formación de dichas secuencias. Cada *Cartesian Tree* determina una única secuencia, y a su vez, cada secuencia define un único *Cartesian Tree*, ya que los pasos de `push` y `pop` están explícitamente representados en la secuencia. Por lo tanto, conociendo esta correspondencia, podemos plantear un método para construir el *Cartesian Tree* a partir de una secuencia de bracks balanceada.

Entonces con esto ya podemos responder las preguntas planteadas anteriormente:
- **¿Como podemos caracterizar cada secuencia de numeros?** => Usando la codificacion de brackets para su respectivo Cartesian Tree-
- **¿Cuantos patrones distintos existen?** => El numero de patrones esta determinado por el numero de catalan, sin embargo esta expresion la podemos aproximar a otra expresion para manejar mejor los terminos de complejidad.

$$
C_n = \frac{1}{n+1} \binom{2n}{n} \approx \frac{4^n}{\sqrt{\pi} \, n^{3/2}} \leq 4^{n}
$$

Por lo tanto segun la expresion anterior y lo discutido anteriormente, podemos preprocesar cada uno de estos pares para cada patron en una complejidad de $O(4^{k} \; k^2)$, sin embargo buscamos que esto sea lineal o menos, anteriormente hemos tomado $k = log_2(n)$, para realizar el precomputo del Sparse Table en $O(n)$, sin embargo para este caso no nos servira de mucho ya que:

$$
O(4^{k}\; k^2) = O(4^{log(n)} \; log^2(n)) = O((2^{log(n)})^2 \; log^2(n)) = O(n^2 \; log^2(n)) 
$$

Aqui el valor optimo a elegir sera $k = \dfrac{1}{2}log_{4}(n)$, con esto verficaremos para ambos casos que sea lineal del todo, primero veamos que ocurre si reemplazamos con la expresion anterior:

$$
O(4^{k}\; k^2) = O(4^{\frac{1}{2} log_{4}(n)} \; log_{4}^{2}(n)) = O(n^{\frac{1}{2}}\; log_{4}^{2}(n)) = O(\sqrt{n} \; log_{4}^{2}(n)) \leq O(n)
$$

Por otro lado fijemonos si la precomputacion aun sigue siendo lineal al tomar este valor $k$
$$
O(B\; log_2(B)) = O(\dfrac{n}{k} \; log_2\dfrac{n}{k})
= O(\dfrac{n}{\frac{1}{2}log_{4}n} \; log_2(\dfrac{n}{\frac{1}{2}log_{4}n})) 
\approx O(\dfrac{n}{\frac{1}{2}log_{4}n} \; log_2n) 
= O(2n \dfrac{log(4)}{\cancel{log(n)}} \dfrac{\cancel{log(n)}}{log(2)})
= O(2n \; log_2(4))
= O(4n)
= O(n)
$$

Por lo tanto el valor $k = \frac{1}{2}log_4(n)$ es aceptable para nuestro algoritmo, logrando una complejidad lineal en procesamiento.

### Query en [l,r] en O(1)

Para cada $l$ y $r$ podemos mapear a que bloque usando una tabla de `id[j]` las cual nos dira a que bloque pertenece de modo que si se encuentran sobre el mismo bloque basta con obtener el patron ya preprocesado y consultar para el par $[l, r]$ en una tabla a la que llamaremos *lookup_table*:
- `lookup_table[l][r][mask]`: Indice $j$ en $[0,...\; k]$ tal que este es la posicion del valor minimo en el rango $[l,r]$ para el patron codificado con $mask$.

Sin embargo si los `id[l]` y `id[r]` caen en bloques distintos usaremos nuestro Sparse Table preprocesado sobre el array $b$, en $O(1)$ para los bloques intermedios, `ST.query(id[l] + 1, id[r] - 1)`, y realizar la query `[l', k - 1]`en el bloque de `id[l]` y otra query `[0, r']` en el bloque de `id[r]`. 

---

Por lo tanto siguiendo estos pasos podremos lograr una complejidad $<O(n), O(1)>$ si manejamos una cuidadosa implementacion.

### Implementacion en codigo y desafios encontrados

Importamos todas las librerias necesarias que usaremos, asi como algunas funciones auxiliares que usaremos mas adelante:

In [9]:
#include <iostream>
#include <vector>     
#include <algorithm>  
#include <climits>     
#include <cmath>        
#include <stack>      
#include <bitset>    
#include <cassert>  
#include <random>   
#include <chrono>    
using namespace std;

In [2]:
// Semilla para números aleatorios basada en la hora actual del sistema
mt19937 rnd(chrono::system_clock::now().time_since_epoch().count());

In [3]:
// Generador de numeros aleatorios siguiendo una distribucion uniforme
int random(int l, int r) {
    return uniform_int_distribution<int>(l, r)(rnd);
}

In [4]:
// Naive query
int brute(int l, int r, vector<int> &a) {
    assert(l <= r);
    int mn = INT_MAX;
    for (int k = l; k <= r; k++) 
        mn = min(mn, a[k]);
    return mn;
}

---

#### Sparse Table

In [5]:
struct SparseTable {
    vector<vector<int>> st;
    SparseTable() {}
    SparseTable(vector<int> &a) { // 0-indexed
        int n = a.size();
        int k = __lg(n) + 1;
        st.resize(n, vector<int>(k));
        // Inicializacion base del ST
        for (int i = 0; i < n; i++) st[i][0] = a[i];
        // Construyendo el sparse table en O(NlogN)
        for (int p = 1, d = 1; 2 * d <= n; p++, d <<= 1) { // ST[i][p] -> min: A[i, i + 2^p - 1]
            for (int i = 0; i + 2 * d <= n; i++) {
                st[i][p] = min(st[i][p - 1], st[i + d][p - 1]);
            }
        }
    }
    
    int query(int l, int r) { // O(1)
        if (l > r) return INT_MAX; 
        int k = __lg(r - l + 1);
        int d = (1 << k);
        return min(st[l][k], st[r - d + 1][k]);
    }
};

#### Desafio 01: Generar todas las secuencias de brackets validas
Para ello basta con ejecutar un algoritmo iterativo recorriendo cada mascara en una complejidad de $O(4^n)$, sin embargo una forma mas inteligente de hacerlo es usando un backtracking construyendolo paso a paso recorriendo solo realmente los estados que realmento nos interesa.

In [6]:
void back(int i, int sa, int mask, int n) {
    if (sa < 0 or sa > n) return;
    if (i == 2 * n) {
        if (sa) return;
        // Llegamos a una secuencia valida
        for (int i = 2 * n - 1; i >= 0; i--) {
            int bit = (mask >> i) & 1;
            cout << (bit ? '(' : ')');
        }
        cout << '\n';
        return;
    }
    back(i + 1, sa + 1, (mask << 1) | 1, n);
    back(i + 1, sa - 1, (mask << 1) | 0, n);
}

In [7]:
int n = 3;
cout << "Secuencias generadas:\n";
back(0,0,0,n);

Secuencias generadas:
((()))
(()())
(())()
()(())
()()()


#### Desafio 02: Construir el Cartesian Tree a partir de un array


In [10]:
struct CartesianTree {
    int n;
    int root;
    int mask;
    vector<int> L,R,par;  

    CartesianTree(vector<int> &a) {
        n = a.size();

        L.assign(n, -1);
        R.assign(n, -1);
        par.assign(n, -1);

        root = -1;
        mask = 0;

        build_from_array(a);
    }
    
    void build_from_array(vector<int> &a) {
        stack<int> st;
        for (int i = 0; i < n; i++) {
            if (st.empty()) {
                mask = (mask << 1) | 1;
                st.emplace(i);
                continue;
            }
            int now = st.top();
            if (a[i] > a[now]) {
                R[now] = i;
                par[i] = now;
                mask = (mask << 1) | 1;
                st.emplace(i);
            } else {
                int last = -1;
                do {
                    last = now;
                    mask = (mask << 1) | 0;
                    st.pop();
                    if (st.empty()) break;
                    now = st.top();
                } while(a[i] < a[now]);

                assert(last != -1);

                if (!st.empty()) {
                    int p = par[last];
                    R[p] = i;
                    par[i] = p;
                }

                L[i] = last;
                par[last] = i;

                mask = (mask << 1) | 1;
                st.emplace(i);
            }
        }

        while(!st.empty()) {
            mask = (mask << 1) | 0;
            st.pop();
        }

        for (int i = 0; i < n; i++) if (par[i] == -1) root = i;

        assert(root != -1);
    }

    void dbg() {
        cout << "root : " << root << endl;
        for (int i = 0; i < n; i++) {
            cout << i << " : " << L[i] << " " << R[i] << " " << par[i] << endl; 
        }
        cout << "mask: " << bitset<20>(mask) << " = " << mask << endl;
    }
};


[1minput_line_19:1:8: [0m[0;1;31merror: [0m[1mredefinition of 'CartesianTree'[0m
struct CartesianTree {
[0;1;32m       ^
[0m[1minput_line_16:3:8: [0m[0;1;30mnote: [0mprevious definition is here[0m
struct CartesianTree {
[0;1;32m       ^
[0m

Interpreter Error: 

In [None]:
vector<int> a = {93,84,33,64,62,83,63,58};
CartesianTree ct(a);
ct.dbg();

#### Desafio 03: Construir el Cartesian Tree a partir de una mascara


#### Desafio 04: Generar el LookupTable para cada patron


#### Desafio 05: Query de Durocher RMQ O(1)
