# Backtracking

## Objetivos
* Familiarizarse con encontrar soluciones recursivas
* Desarrollar el instinto para encontrar complejidades
* Entender la formación-recorrido del árbol de recursión
* Introducir la idea de memoization y prunning

## Problema motivacional
José recientemente leyó un post: ["42: The answer to life, the universe and everything"](https://www.independent.co.uk/life-style/history/42-the-answer-to-life-the-universe-and-everything-2205734.html '42') y se quedó impresionado de la cantidad de veces que suele aparecer este número. Ahora, él está tan aburrido que desea analizar todas las palabras cuyas letras *sumen* 42 y que tengan como máximo 7 letras, pero ha amanecido con mucha flojera por lo que te ha pedido ayuda con la generación de dichas palabras. 

**Nota:** José asigna a cada letra un número de la siguiente manera: (A -> 1, B -> 2, C -> 3, ...). Asigna el mismo número tanto a letra mayúsculas como minúsculas y solo acepta letras a-z (no incluye la ñ) en las palabras. Así, por ejemplo, la suma de las letra de "Hola" es 8 + 15 + 12 + 1 = 36


## Idea de la solución

Primero, notemos que como las mayúsculas y minúsculas tienen el mismo valor según José, entonces podemos trabajar únicamente con letras minúsculas.

Ahora, sea:
* $(S_k) = $ todas las posibles palabras de tamaño $k$.
* $s_k = $ un elemento arbitrario de $(S_k)$

Además, notemos que $k \leq sum (s_k) \leq 26 * k$

Entonces, sea $s$ una palabra cuyas letras sumen $42$, notamos que:

$$s \in S_2 \lor S_3 \lor \dots \lor S_7$$

Entonces, ahora nos proponemos en generar las palabras de $S_2, S_3, \dots, S_{7}$ y buscar aquellas palabras que sumen 42 para asi resolver el problema planteado.

Sin embargo, nos damos cuenta que $|S_{7}| = 26 ^ {7} = O(10 ^ {10})$

Pero, hay dos observaciones importantes respecto a las palabras que suman 42:

* Si $s$ es una palabra que suma 42, entonces cualquier permutación de sus elementos tambien suma 42
* Si $s$ suma más de 42, cualquier palabra que contenga a $s$ en cualquier orden también sumará más de 42

Entonces, podemos centrarnos en formar palabras

$$s = a_1a_2 \dots a_n \quad \mid \quad a_1 \leq a_2 \leq \dots \leq a_n$$

De manera que, si $sum (s) = 42$, entonces podemos usar *next_permutation* y formar todas sus permutaciones (notemos que cualquier palabra que sume 42 es una permutación de solo una palabra $s$ de la forma anterior).

Y si $sum (s) > 42$ entonces podriamos evitar seguir formando palabras que contengan a $s$.

Entonces, sea:

$S_{k}^{*} = \{s_k \in S_k \mid sum (s_k) = 42 \land s_k = a_1 a_2 \dots a_k \land a_1 \leq a_2 \leq \dots a_k \}$

Así, nuestra nueva complejidad sería $O(\displaystyle\sum_{k = 2}^{k = 7} \displaystyle\sum_{s_k^{*} \in S_k ^{*}} \text{# Permutaciones de } s_k^{*})$

Hallar tal complejidad lo veremos en más detalle cuando estudiemos Combinatoria.

Por ahora, como regla práctica podemos que con cada iteración las opciones de busqueda disminuyen en un número $t$ quedando así la complejidad $O(26 \times (26 - t) \times (26 - 2t) \times \dots \times (26 - 6t)$ y con $t = 3$ podemos obtener una buena aproximación.

Lo anterior, no es matemáticamente correcto. Sin embargo, en los concursos hay veces en las que se llega a algoritmos cuyas complejidades son laboriosas de hallar correctamente, por lo que, hallar aproximaciones o tener reglas prácticas suelen ser un buen recurso en esas situaciones. Pero, es mejor dejar esto como último recurso, siempre es preferible hallar la complejidad formalmente.

Para generar esos conjuntos de palabras nos damos cuenta que nos podemos apoyar en el paradigma de **Búsqueda completa** que hemos aprendido.

Es decir, se nos ocurre que podriamos utilizar alguno de estos temas:
* Fuerza bruta
* Bitmask
* Recursión

## Fuerza bruta

Con toda la explicación anterior podemos hacer el siguiente código:

```c++
#include <bits/stdc++.h>

using namespace std;

vector <string> ans;

int sum(string s) {
    int ret = 0;
    for (char ch : s) ret += ch - 'a' + 1;
    return ret;
}

void generate(string s) {
    do {
        ans.push_back(s);
    } while (next_permutation(begin(s), end(s)));
}

int main() {
    string s = "";
    for (char ch_1 = 'a'; ch_1 <= 'z'; ch_1++) {
        s += ch_1;
        for (char ch_2 = ch_1; ch_2 <= 'z'; ch_2++) {
            s += ch_2;
            if (sum(s) == 42) generate(s);
            if (sum(s) < 42) {
                for (char ch_3 = ch_2; ch_3 <= 'z'; ch_3++) {
                    s += ch_3;
                    if (sum(s) == 42) generate(s);
                    if (sum(s) < 42) {
                        for (char ch_4 = ch_3; ch_4 <= 'z'; ch_4++) {
                            s += ch_4;
                            if (sum(s) == 42) generate(s);
                            if (sum(s) < 42) {
                                for (char ch_5 = ch_4; ch_5 <= 'z'; ch_5++) {
                                    s += ch_5;
                                    if (sum(s) == 42) generate(s);
                                    if (sum(s) < 42) {
                                    	for (char ch_6 = ch_5; ch_6 <= 'z'; ch_6++) {
                                    		s += ch_6;
                                    		if (sum(s) == 42) generate(s);
                                    		if (sum(s) < 42) {
                                    			for (char ch_7 = ch_6; ch_7 <= 'z'; ch_7++) {
                                    				s += ch_7;
                                    				if (sum(s) == 42) generate(s);
                                    				s.pop_back();
                                    			}
                                    		}
                                    		s.pop_back();
                                    	}
                                    }
                                    s.pop_back();
                                }
                            }
                            s.pop_back();
                        }
                    }
                    s.pop_back();
                }
            }
            s.pop_back();
        }
        s.pop_back();
    }
    sort(begin(ans), end(ans));
	for (string ans_i : ans) cout << ans_i << endl;
    return (0);
}
```

Sin embargo, el código anterior tiene muchos puntos malos. Por ejemplo, qué pasa si se quiere resolver el mismo problema pero que ahora las palabras sumen un número distinto a 42 o que el tamaño máximo de las palabras permitidas sea distinto. Además, poner tantos fors anidados no se ven muy bien y es fácil equivocarnos dentro de algun for y es dificil detectar donde nos equivocamos.

![Hadouken](./pictures/hadouken.jpg 'Hadouken')

## Bitmask

Con bitmask se nos ocurre que podriamos tener una mascara que nos indique que letras utilizar y por cada máscara con como máximo 7 letras generar todos los posibles $s_k^{*}$ a partir de los cuales podriamos usar *next_permutation*. Sin embargo eso solo haría más complicado el código y ademas necesitariamos recorrer los $2 ^ {26} = O(10 ^ 8)$ máscaras. Por lo que descartamos este enfoque.

## Recursión

![Recursion](./pictures/recursive.jpg 'Recursion')

Tal y como aprendimos en el anterior tema **Recursión**, recordamos que para definir una solución recursiva necesitamos:
    
* Definir el estado que representa nuestro problema
* Definir los estados iniciales y finales
* Definir a que estados puedo ir desde un estado arbitrario

Con ello en consideración podemos obtener la siguiente solución.

```c++
#include <bits/stdc++.h>

using namespace std;

const int SUM = 42, MAX_LEN = 7;

int sum;
string word;
vector <string> ans;

void backtracking(char ch = 'a') {
    if (sum > SUM) return;
    if (sum == SUM and word.size() <= MAX_LEN) {
        do {
            ans.push_back(word);
        } while(next_permutation(begin(word), end(word)));
    }
    for (char nch = ch; nch <= 'z'; nch++) {
        sum += nch - 'a' + 1;
        word.push_back(nch);
        backtracking(nch);
        word.pop_back();
        sum -= nch - 'a' + 1;
    }
}

int main() {
    backtracking();
    sort(begin(ans), end(ans));
    for (string ans_i : ans) cout << ans_i << endl;
    return (0);
}

```

### Observaciones
* El uso de variables globales no es una práctica recomendada. Sin embargo, en programación competitiva, ya se ha vuelto una práctica muy común y al ser códigos cortos, de un solo archivo y codeados por una sola persona, el uso de variables globales no suele tener un mal impacto.
* Notemos que el estado de la recursión se define por (char ch, string word, int sum, vector <string>& ans); sin embargo, gracias al uso de variables globales solo usado (char ch).
* Observemos como este última solución es más fácil de entender que la primera. Además, esta solución es más flexible a cambios, optimizaciones y más.

Para entender mejor como funciona el código anterior analicemos el árbol de recursión que genera el problema anteior (Se explicará esto en la pizarra)

## "Definición"

Con el problema anterior nos dimos cuenta del enorme poder que tiene la recursión. Ahora, con el problema anterior y con lo aprendido en la clase anterior podemos decir que, en general hay 2 tipos de recursiones:

* La primmera es aquella en la que a partir de un estado *s* sabemos exactamente hacia que otros estados (*s'*) debemos ir para encontrar alguna respuesta que buscamos.
* La segunda es aquella en la que a partir de un estado *s* sabemos hacia que estados (*s'*) podemos ir, pero no sabemos a cual de ellos deberiamos ir asi que intentamos ir a todos. A este tipo de recursión llamamos *backtracking* y este es el tema que aprenderemos hoy.

Al ser la primera vez que vemos backtracking nos centraremos más en la practica y menos en la teoría. Ilustraremos el uso de esta técnica mediante 3 problemas más:

##  Subset sum problem

## N-queen problem

## Encontrando el patrón de acceso

Bibliografía:
* [Algorithms Jeff](http://jeffe.cs.illinois.edu/teaching/algorithms/notes/03-backtracking.pdf 'Algorithms')