# Clase 07

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2007%20-%20Dynamic%20Programming%20III.ipynb)

# Requisitos previos

* Programación Dinámica I y II
* Principio de Optimalidad de Bellman
* Bitmask

# Técnicas Avanzadas con DP

Ya hemos visto los problemas clásicos que usan solamente las características del DP para ser resueltos, ahora veremos algunos problemas que se resuelven usando DP con alguna otra técnica más para mejorar el tiempo de ejecución.

## DP con Bitmask

Debemos recordar el tema de Bitmask, en el cual usábamos los números en su representación binaria para expresar conjuntos u otros objetos que necesitáramos. Enfoquémonos en los conjuntos: Muchas veces uno debe realizar decisiones en base a un conjunto y luego añadir o quitar elementos, acciones que son sencillas de realizar usando bitmasks.

Esto quiere decir que nuestro DP podrá considerar tener como argumento de estado a algún bitmask para apoyarse. Veamos el primer ejemplo:

Dado $1 \leq n \leq 18$, calcular la cantidad de permutaciones de $[1,\ldots,n]$ tales que para todo $i=2,\ldots,n$ se cumpla que:

$$ (p_{i-1},p_{i}) = 1 $$

Donde $(a,b)$ es el MCD de $a$ y $b$.

Si usáramos fuerza bruta y `next_permutation` el algoritmo tendría una complejidad de $O(n\cdot n!)$, lo cual nos puede servir hasta $n = 10$, pero para valores más grandes se nos hace muy pesada la ejecución. 

A pesar de esto, podemos usar DP para calcular la cantidad de permutaciones que podemos armar dado que ya hemos armado una parte de la misma. Resolveremos el problema en 2 partes:

### 1ra Parte: Identificación de la recursión

Dado que hemos mencionado que el bitmask nos ayuda a representar conjuntos, ¿Qué tal si el bitmask nos ayuda a representar los elementos que aún no he puesto en mi permutación? Entonces podríamos plantear una recursión de la siguiente forma:

$$ DP(mask,pos) = \text{Cantidad de soluciones dado que ya colocamos }pos\text{ elementos y tenemos disponibles los que estan en }mask $$

Sin embargo, tenemos un problema ahora, necesitamos también el último término que colocamos para verificar que la condición de coprimalidad de elementos consecutivos se mantenga, así que le agregaremos un término extra $last$ que nos dará el último elemento que colocamos.

Una vez definida nuestra recursión, es sencillo notar la siguiente igualdad:

$$ DP(mask,pos,last) = \sum\limits_{(2^{j} \& mask) = 2^{j}, (j,last) = 1} DP(mask \oplus 2^{j},pos+1,j) $$
$$ DP(0,n,last) = 0 $$

Donde $\oplus$ es el Bitwise XOR y $\&$ es el Bitwise AND.

Esto quiere decir que tendremos $O(2^{n} n^{2})$ estados y cada uno lo manejamos en $O(n)$. Tendremos una complejidad de $O(2^{n} n^{3})$, pero esto no nos basta para resolver el problema.

### 2da Parte: Optimización de la solución

Realizaremos la siguiente observación para resolver finalmente el problema con una complejidad aceptable:

Dado que solamente me interesan los elementos que tengo disponibles y el último valor colocado, entonces no necesito la posición del elemento que agregaré. Además, en el caso que sí la necesitara, puedo obtener este valor en función a $n - |mask|$, donde $|m|$ es la cantidad de elementos de la máscara $m$.

Por lo anterior, quitamos el parámetro $pos$ y obtenemos una complejidad de $O(2^{n}n^{2})$.

### Traveling Salesman Problem

El Traveling Salesman Problem (TSP) es uno de los ejemplos más clásicos de DP con Bitmask, su enunciado es el siguiente:

Dado un grafo con $n$ nodos, cuyos costo de transición están definidos en una matriz $d$, tal que:

$$ d_{i,j} = \text{Costo de transportarse del nodo }i\text{ al nodo }j $$

Halle el ciclo de costo mínimo que pase por todos los nodos exactamente una vez. (Ciclo Hamiltoniano con menor costo).

Este problema se resuelve de una manera similar al anterior, debido a que para poder construir el ciclo necesitamos el último nodo que visitamos (con el fin de saber qué valor de $d$ tomar) y también los nodos que aún no han sido visitados.

**Observación 1:** Dado que lo que construiremos es un ciclo diferenciado (es de menor costo), no importa desde qué nodo empecemos, por lo que basta con empezar con el nodo $0$.

Entonces definiremos nuestra recursión:

$$ DP(mask,last) = \min\limits_{2^{j} \& mask = 2^{j}}{d_{last,j} + DP(mask\oplus 2^{j},j)} $$
$$ DP(0,last) = d_{last,0} $$

El caso base es cuando ya usamos todos los nodos y debemos volver al inicial, el cual ya definimos como el 0.

De manera similar al problema anterior, tenemos $O(2^{n}n)$ estados y cada uno lo manejamos en $O(n)$. Tendremos una complejidad de $O(2^{n}n^{2})$.


### Problemas para resolver en clase

- [Sherlock and Coprime Subset](https://www.hackerearth.com/practice/algorithms/dynamic-programming/bit-masking/practice-problems/algorithm/sherlock-and-coprime-subset/)

- [Rotate Columns (Easy Version)](https://codeforces.com/contest/1209/problem/E1)

- [Rotate Columns (Hard Version)](https://codeforces.com/contest/1209/problem/E2)

- [A Simple Task](https://codeforces.com/contest/11/problem/D)

### Material de referencia:

- [A little bit of classics: dynamic programming over subsets and paths in graphs](https://codeforces.com/blog/entry/337)

## DP sobre dígitos

El DP sobre dígitos es una manera particular de aplicar DP para construir un número dígito por dígito bajo ciertas condiciones. Los problemas más clásicos usando esta técnica se basan en el conteo de números en un rango $[a,b]$ que cumplan una restricción dada. Sin embargo, no es necesario crear un DP para cada tipo de rango (lo cual no solo es absurdo sino completamente ineficiente), sino que podemos cambiar el enfoque a:

$$ \sum\limits_{i=a}^{b}I[i] = \sum\limits_{i=0}^{b}I[i] - \sum\limits_{i=0}^{a}I[i] $$

Donde $I[i]$ es una función indicador de $i$ que toma $1$ cuando $i$ cumple con las restricciones y $0$ cuando no. 

Aprovechamos la naturaleza acumulativa de la solución para poder usar un mismo estilo de DP (desde $0$ hasta un valor $x$) aplicado sobre dos valores diferentes (el $a$ y $b$).

Veamos mejor con un ejemplo:

Dados $A$, $B$ y $K$, hallar todos los números en el rango $[A,B]$ tales que sean múltiplos de $K$ y su suma de cifras sea múltiplo de $K$. $(1 \leq A \leq B \leq 2^{31}, 0 < K < 10000)$

Para resolver este problema podemos usar la descomposición de $0$ a $x$ y restar los valores, pero eso nos lleva a tener que definir nuestra recursión.

Asumamos que tenemos un vector $v$ que contiene los dígitos de $x$ de la siguiente forma:

$$ v_{i} = \text{dígito de }x\text{ del máximo orden} - i $$

Esto quiere decir que para $x = 123$ el vector sería $v = \{1,2,3\}$, lo cual nos ayuda a armar una recursión con los siguientes pasos:

1) Necesitamos la posición del orden para saber cuándo terminar.

2) Necesitamos el residuo actual del número que estamos construyendo para saber el residuo del número final respecto a $K$.

3) Necesitamos el residuo actual de la suma de cifras del número para saber el residuo de la suma de cifras del número final respecto a $K$.

4) Necesitamos saber si nuestro número actual ya es menor que el límite o todavía no para saber qué posibles cifras podemos agregar.

Entonces tendremos una recursión con los siguientes parámetros:

$$ DP(pos,rnum,rsum,menor) : \text{Cantidad de formas de construir un número que ya tiene rnum, rsum y cumple con menor} $$

Donde $rnum$, $rsum$ y $menor$ son los equivalentes a los puntos $2$, $3$ y $4$ anteriormente mencionados.

Ahora, nuestro DP va a tener dos tipos de transición diferentes definidos por el valor de $menor$.

$$ DP(pos,rnum,rsum,1) = \sum\limits_{i=0}^{9} DP(pos+1,(10rnum + i) \% K, (rsum + i) \% K, 1) $$
$$ DP(pos,rnum,rsum,0) = \sum\limits_{i=0}^{v_{pos}} DP(pos+1,(10rnum + i) \% K, (rsum + i) \% K, i < v_{pos}) $$
$$ DP(len,0,0,menor) = 1 $$

Estas transiciones se justifican de la siguiente forma:

1) Si el número actual ya es menor, entonces cualquier dígito que le agregue a la derecha no lo hará mayor que el número actual, así que puedo usar cualquiera y el número seguirá siendo menor.

2) Si el número actual es igual (la unica otra opción si no es menor por la definición de la recursión), entonces solo puedo agregar dígitos que no lo vuelvan mayor, y el número será menor si y solo si el dígito que agregaré es menor que el dígito en esa posición del número original.

3) Si ya construí un número, solo debo devolver 1 si cumple con que $rnum = rsum = 0$.

Finalmente, consideramos la memoria que usaríamos:

$$ pos \in [0,len] $$
$$ rnum \in [0,K] $$
$$ rsum \in [0,K] $$
$$ menor \in [0,1] $$

Entonces tendríamos no solo una complejidad de $O(len\cdot K^{2}) = O(\log_{10}{MAX}\cdot K^{2})$ por cada DP (lo cual no es un problema, debido a que solo lo ejecutaremos 2 veces), pero con $K < 10000$ esto no nos permite pasar el tiempo límite ni cumplir con la memoria límite.

**Observación:** $rsum \in [0,9len]$, debido a que a lo mucho colocaremos $len$ dígitos 9, así que la suma no superará este valor.

Usando la observación consideraremos una complejidad de $O(\log_{10}^{2}{MAX}K)$, debido a que uno de los $K$ fue transformado a $O(\log_{10}{MAX})$. Con esto podemos resolver el problema con las restricciones de tiempo y memoria.

### Problemas para resolver en clase

- [Investigation](http://lightoj.com/volume_showproblem.php?problem=1068)

- [Ra-One Numbers](https://www.spoj.com/problems/RAONE/)

- [369 Numbers](https://www.spoj.com/problems/NUMTSN/)

- [Maximum Product](https://codeforces.com/gym/100886/problem/G)

- [Logan and DIGIT IMMUNE numbers](https://www.codechef.com/problems/DIGIMU)

