# Clase 06

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2006%20-%20Dynamic%20Programming%20II.ipynb)

# Requisitos previos

* Programación Dinámica I
* Principio de Optimalidad de Bellman

### Problemas Clásicos usando DP - Parte 2

#### 2D Range Sum

Para el caso de 2 dimensiones, el problema de 2D Range Sum se transforma de buscar el subarreglo con máxima suma de elementos a buscar la submatriz con máxima suma de elementos. 

De manera análoga al caso de 1 dimensión, si usamos fuerza bruta directa obtendríamos una complejidad de $O(n^{6})$, donde $n$ es el máximo de las dos dimensiones de la matriz original $A$.

Podemos usar principio inclusión-exclusión para obtener las sumas de todos los elementos desde el $(1, 1)$ al $(i, j)$ como extremos de una submatriz:

$$ ac[i][j] = A[i][j] + ac[i - 1][j] + ac[i][j - 1] - ac[i - 1][j - 1] $$

El primer término es debido a que debemos agregar obligatoriamente el valor $A[i][j]$ a la suma, los dos siguientes son la posición de arriba y la de la izquierda a la celda $(i, j)$, las cuales asumiremos como procesadas antes que $(i, j)$ (Así que iremos por $i$ ascendente y $j$ ascendente) y el último término lo restamos debido a que la submatriz desde $(1, 1)$ a $(i - 1, j - 1)$ la estaríamos agregando dos veces.

Podemos obtener $ac[i][j]$ en $O(n^{2})$, ahora debemos analizar cómo hallar la suma de una submatriz:

$$ suma(x_{1}, y_{1}, x_{2}, y_{2}) = ac[x_{2}][y_{2}] + ac[x_{1} - 1][y_{1} - 1] - ac[x_{1} - 1][y_{2}] - ac[x_{2}][y_{1} - 1] $$

El primer término es el total desde $(1, 1)$ a $(x_{2}, y_{2})$, al cual debemos restarle la celda arriba de $(x_{1}, y_{2})$ y la celda de la izquierda de $(x_{2}, y_{1})$; sin embargo, estaríamos restando la submatriz de $(1, 1)$ a $(x_{1} - 1, y_{1} - 1)$ dos veces, por eso equilibramos con el segundo término.

Como podemos obtener la suma de una submatriz en $O(1)$, podemos usar fuerza bruta para fijar cada submatriz posible y maximizar la respuesta, esto nos tomará $O(n^{4})$.

##### Mejorando la complejidad

Si bien la solución anterior suele ser suficiente en la mayoría de problemas, si necesitamos una mejora en la complejidad podemos notar lo siguiente:

*Si fijamos los dos extremos de una de las dimensiones, la suma de cada posición es fija y estaríamos resolviendo un problema en 1 dimensión*

Ahora podemos fijar los dos extremos de las filas $x_{1}$ y $x_{2}$ para que cada columna $j$ tenga un valor 

$$ b_{j} = \sum\limits_{i = x_{1}}^{x_{2}}A[i][j] $$

Finalmente, aplicamos el algoritmo $O(n)$ para 1D Range Sum sobre $b$ y maximizamos con la respuesta.

La complejidad final será de $O(n^{3})$ si usamos prefix sums por columnas para hallar $b_{j}$ en $O(1)$.

#### Longest Increasing Subsequence

El enunciado de este problema es el siguiente: Se tienen $n$ elementos que están sujetos a un orden parcial, se desea hallar la longitud de la subsecuencia ordenada más larga de todas.

La idea usando fuerza bruta tiene complejidad exponencial, así que no nos conviene usarla en absoluto. En cambio, consideraremos el siguiente enfoque, parecido al que usamos en 1D Range Sum:

Definimos la función $DP(i)$ como la longitud de la máxima subsecuencia que termina exactamente en la posición $i$, entonces esta función tiene la siguiente característica:

$$ DP(i) = \max\limits_{j < i, a_{j} \prec a_{i}}{\{f(j) + 1\}} $$

Donde $f(j)$ es una función tal que halla el mejor ajuste para que el resultado de $i$ sea óptimo.

Sin embargo, estas soluciones se pueden considerar como incrementales (es decir, se van agregando posibles elementos a la solución) y, por ello, el elemento nuevo no puede afectar a lo que se procesó en el pasado, así que son independientes. Recordemos que si los objetivos de optimización son independientes, entonces cada parte por sí sola es óptima: el problema cumple con el principio de optimalidad de Bellman.

Dado que el problema cumple con nuestro principio de optimalidad, podemos notar que $f = DP$ pues el $j$ *ignora* el futuro resultado de $i$ para procesarse a sí mismo. Finalmente llegamos a que:

$$ DP(i) = \max\limits_{j < i, a_{j} \prec a_{i}}{\{DP(j) + 1\}} $$

Lo cual puede ser implementado de diferentes maneras, siendo la menos eficiente un $O(n^{2})$. 

La versión recursiva se implementaría así:

```Python
def DP(i):
    if i == 0: return 1
    if vis[i]: return memo[i]
    ans = 1
    for j = 0 to i - 1:
        if a[j] < a[i]: ans = max(ans, 1 + DP(j))
    vis[i] = True
    memo[i] = ans
    return memo[i]
```

Para la versión iterativa debemos notar que para calcular $(i, j)$ necesitamos de $(i - 1, j)$, $(i, j - 1)$ y en el peor de los casos también de $(i - 1, j - 1)$. Respecto a $i$, dos posiciones nos señalan que debemos calcular por $i$ creciente, pues necesitamos la fila $i - 1$ antes de la $i$. Respecto a $j$, cuando estamos en la fila $i$, necesitamos de $(i, j - 1)$, lo que significa que debemos procesar por $j$ creciente también.

```Python
def DP():
    ans = 1
    memo[0] = 1
    for i = 1 to n - 1:
        memo[i] = 1
        for j = 0 to i - 1:
            if a[j] < a[i]: memo[i] = max(memo[i], 1 + memo[j])
        ans = max(ans, memo[i])
    return ans
```

##### Versión $O(n\log{n})$

La versión $O(n\log{n})$ a continuación no usa estructuras de datos, solamente se basa en búsqueda binaria para hallar la mejor posición en la que puede ir un valor $x$.

Definimos $L(i)$ como el menor valor posible $x$ tal que existe una secuencia creciente de longitud $i$ entre los valores ya procesados y su último término es $x$. Inicializaremos $L$ con $\infty$ para $i > 0$ y $L_{0} = -\infty$.

A medida que avanzamos en el arreglo $a$, colocaremos la posición $a_{i}$ en el mayor $j$ posible tal que $L_{j - 1} < a_{i}$, este valor lo podemos hallar usando búsqueda binaria, pues $L$ es no decreciente (¿Por qué?).

Ya que por cada posición usaremos una búsqueda binaria para hallar $j$, tendremos una complejidad final de $O(n\log{n})$.

#### Longest Common Subsequence

El enunciado de este problema es el siguiente: Se tienen dos cadenas $a$ y $b$ de longitudes $n$ y $m$, respectivamente; se desea dar la longitud de la subsecuencia de caracteres más larga que pertenezca a ambas cadenas.

Para resolver este problema ya ni es necesario pensar en la solución con fuerza bruta, dado que la más óptima de ellas igual tendrá complejidad exponencial. Esto nos obliga a analizar un poco más las características de la solución.

**Observación 1:** Al ser la respuesta una subsecuencia con la característica de que será la más larga de todas, entonces no hay diferencia entre procesar la respuesta de izquierda a derecha o de derecha a izquierda.

Supongamos que hemos analizado y procesado la respuesta para los caracteres del $i$ hasta el $n$ en $a$ y del $j$ hasta el $m$ en $b$, entonces notemos que la respuesta de los caracteres restantes no se ve afectada por los que ya están procesados (uno puede verlo como si hubiese eliminado dichos caracteres), por lo que la solución para los restantes debe ser óptima también. Lo anterior nos ayuda a probar que el problema cumple con el principio de optimalidad de Bellman.

Dado el análisis previo, podemos plantear la recursión para resolver el problema:

$$ DP(i,j) = \left\{ \begin{array}{cc} \max{\{DP(i-1,j), DP(i,j-1)\}} &a_{i} \neq b_{j} \\ 1 + DP(i-1,j-1) &a_{i} = b_{j} \end{array}\right. $$

La expresión en palabras de la función recursiva se puede lograr fácilmente debido a que nuestro predicado está bien definido:

La solución para los primeros $i + 1$ y los primeros $j + 1$ caracteres de $a$ y $b$ respectivamente tiene dos posibles casos: si los caracteres en dichas posiciones son diferentes, solo nos queda probar quitando alguno de los dos y tomar el valor máximo de las dos posibilidades; si los caracteres en dichas posiciones son iguales, nos conviene tomar a los dos y seguir con los demás (el hecho de que ya no se pruebe con quitar alguno de los dos caracteres es debido a que cualquiera de esos intentos no mejorará la respuesta final, por lo que es una transición innecesaria).

Finalmente, usando almacenamiento, podemos resolver el problema en $O(n^{2})$.

La versión recursiva se implementaría así:

```Python
def DP(i, j):
    if i == -1 or j == -1: return 0
    if vis[i][j]: return memo[i][j]
    ans = max(DP(i - 1, j), DP(i, j - 1))
    if a[i] == b[j]: ans = max(ans, 1 + DP(i - 1, j - 1))
    vis[i][j] = True
    memo[i][j] = ans
    return memo[i][j]
```

Para la versión iterativa debemos notar que para calcular $(i, j)$ necesitamos de $(i - 1, j)$, $(i, j - 1)$ y en el peor de los casos también de $(i - 1, j - 1)$. Respecto a $i$, dos posiciones nos señalan que debemos calcular por $i$ creciente, pues necesitamos la fila $i - 1$ antes de la $i$. Respecto a $j$, cuando estamos en la fila $i$, necesitamos de $(i, j - 1)$, lo que significa que debemos procesar por $j$ creciente también.

```Python
def DP():
    for i = 0 to n - 1:
        for j = 0 to m - 1:
            memo[i][j] = -inf
            if i > 0: memo[i][j] = max(memo[i][j], memo[i - 1][j])
            if j > 0: memo[i][j] = max(memo[i][j], memo[i][j - 1])
            if a[i] == b[j]: memo[i][j] = max(memo[i][j], 1 + memo[i - 1][j - 1])
    return memo[n - 1][m - 1]
```

#### Edit distance

El enunciado de este problema es el siguiente: Se tienen dos cadenas $a$ y $b$ de longitudes $n$ y $m$, respectivamente; uno puede aplicar las siguientes operaciones sobre la cadena $a$:

 - Eliminar un caracter bajo un costo $c_{e}$.
 - Insertar un caracter en cualquier posición bajo un costo $c_{i}$
 - Reemplazar un caracter bajo un costo $c_{r}$.
 
Se nos pide el costo mínimo con el que uno puede transformar a $a$ en $b$.

Al igual que en el problema de LCS, uno debe modelar la recursión considerando igualar los primeros $i + 1$ caracteres de $a$ con los $j + 1$ primeros caracteres de $b$ y analizar las transiciones correspondientes. Sea $DP(i, j)$ la respuesta para lo descrito anteriormente:

 - $(i - 1, j)$: Se borró el caracter en la posición $i$, así que hay un costo extra de $c_{e}$.
 - $(i, j - 1)$: Se insertó el caracter $b_{j}$ a la derecha de la posición $i$, así que hay un costo extra de $c_{i}$.
 - $(i - 1, j - 1)$: Se reemplazó el caracter $a_{i}$ con el caracter $b_{j}$, así que hay un costo extra de $c_{r}$.

Finalmente, podemos simplemente aplicar programación dinámica para hallar el mejor resultado de volver iguales los estados de las transiciones:

$$ DP(i, j) = \min{\{DP(i - 1, j) + c_{e}, DP(i, j - 1) + c_{i}, DP(i - 1, j - 1) + c_{r}\}} $$

La versión recursiva se implementaría así:

```Python
def DP(i, j):
    if i == -1: return c_i * (j + 1)
    if j == -1: return c_e * (i + 1)
    if vis[i][j]: return memo[i][j]
    ans = min([DP(i - 1, j) + c_e, DP(i, j - 1) + c_i, DP(i - 1, j - 1) + c_r])
    vis[i][j] = True
    memo[i][j] = ans
    return memo[i][j]
```

Para la versión iterativa ya sabemos que debemos iterar de manera similar al problema del LCS por tener las mismas características en los estados; sin embargo, indexaremos desde $1$ para poder considerar los casos $i = -1$ como $i = 0$:

```Python
def DP():
    for i = 0 to n: memo[i][0] = i * c_e
    for j = 0 to n: memo[0][j] = j * c_i
    for i = 1 to n:
        for j = 1 to m:
            memo[i][j] = min([memo[i - 1][j] + c_e, memo[i][j - 1] + c_i, memo[i - 1][j - 1] + c_r])
    return memo[n][m]
```

#### Matrix Chain Multiplication

El enunciado de este problema es el siguiente: Se tienen $n$ matrices $A_{i}$ definidas por sus dimensiones en un arreglo $p_{i}$, tal que $A_{i} \in \mathbb{R}^{p_{i}\times p_{i+1}}$, las cuales se quieren multiplicar usando la menor cantidad de operaciones posible. Esta forma óptima de multiplicación se debe obtener únicamente colocando paréntesis en donde convenga **sin reordenar** las matrices.

Para resolver este problema usando fuerza bruta debemos considerar que tenemos la posibilidad de colocar $\left\lfloor\frac{n+1}{2} \right\rfloor$ pares de paréntesis como máximo y que el resultado final debe ser una expresión correctamente balanceada. Esta cantidad de formas nos hace recordar a los números de Catalán, los cuales tienen un crecimiento asintótico de $O\left(\frac{4^{n}}{n^{\frac{3}{2}}\Pi}\right)$: para nada eficiente.

Sin embargo, podríamos analizar el problema con un estilo Divide and Conquer, considerando que si colocamos paréntesis para separar dos subsecuencias contiguas de la original, el problema se reduce a resolver ambas partes:

$$ A_{1}\cdot A_{2} \ldots A_{n} = (A_{1}\ldots A_{k})(A_{k+1}\ldots A_{n}) $$

En este momento, debemos considerar algunas cosas:

1) El separar la secuencia en dichas partes nos dice que eventualmente multiplicaremos dos matrices de $p_{1}\times p_{k+1}$ con una de $p_{k+1}\times p_{n+1}$, dándonos un peor costo de $p_{1}p_{k+1}p_{n+1}$ mediante la multiplicación trivial de matrices.

2) Luego de separar la secuencia, debemos resolver ambas partes de la *mejor manera* para que encajen con la solución eventual señalada en el punto 1, pero debemos notar que ambas soluciones son independientes entre sí y del valor generado por la división. Lo anterior nos sirve para probar que la resolución de ambas partes debe ser óptima y el problema cumple con el principio de Optimalidad de Bellman

Con el análisis anterior, podemos plantear una recursión simple:

$$ DP(L,R) = \max\limits_{L \leq k < R}{\left\{DP(L,k) + DP(k+1,R) + p_{L}p_{k}p_{R+1}\right\}} $$

Con $DP(i,i) = 0$, $\forall i = 1, \ldots, n$.

Y usando nuestra técnica de almacenamiento podemos implementar la solucion, cuya complejidad es de $O(n^{3})$.

La versión recursiva se implementaría así:

```Python
def DP(L, R):
    if L == R: return 0
    if vis[L][R]: return memo[L][R]
    ans = inf
    for k = L to R - 1:
        ans = min(ans, DP(L, k) + DP(k + 1, R) + p[L] * p[k] * p[R + 1])
    vis[L][R] = True
    memo[L][R] = ans
    return memo[L][R]
```

Mientras que para la versión iterativa debemos notar que para resolver $[L, R]$ debemos saber las respuestas de matrices de menor longitud $[l, r]$ ($R - L + 1 > r - l + 1$), así que iteraremos por tamaño creciente.

```Python
def DP():
    for i = 0 to n - 1:
        memo[i][i] = 0
    for l = 2 to n:
        for L = 0 to n - l:
            R = L + l - 1
            memo[L][R] = inf
            for k = L to R - 1:
                memo[L][R] = min(memo[L][R], memo[L][k] + memo[k + 1][R] + p[L] * p[k] * p[R + 1])
    return memo[0][n - 1]
```


### Reconstrucción de Soluciones

Para reconstruir las soluciones procesadas por DP, es necesario notar la naturaleza de las transiciones entre estados. Cada estado tiene un conjunto de transiciones que logran obtener una respuesta óptima (dependiendo del problema, podríamos elegir cualquiera o alguno con una característica especial), por lo que basta con almacenar la transición adecuada mediante una tabla extra (considerando la poca cantidad de opciones de transición por estado). Luego de almacenar las transiciones óptimas por estado, podemos recuperar la solución mediante una forma iterativa o incluso recursiva, que tendrá por complejidad $O(\text{longitud de la respuesta})$, siempre llamando desde el estado inicial de solución.

#### Ejemplo - Knapsack Problem

El algoritmo recursivo para resolver el problema de la mochila es el siguiente:

```Python
def Knapsack(pos,left):
    if pos == n: return 0
    if vis[pos][left]: return memo[pos][left]
    ans = Knapsack(pos + 1, left)
    if left >= w[pos]:
        ans = max(ans, v[pos] + Knapsack(pos + 1, left - w[pos]))
    vis[pos][left] = True
    return memo[pos][left] = ans
```

Y por cada estado tenemos la opción entre usar o no usar el elemento $pos$, así que solamente crearemos un arreglo booleano extra que mantenga $True$ si el elemento $pos$ fue tomado y $False$ si no lo fue.

```Python
def Knapsack(pos,left):
    if pos == n: return 0
    if vis[pos][left]: return memo[pos][left]
    ans = Knapsack(pos + 1, left)
    choice[pos][left] = False # Asumo que no me conviene tomarlo
    if left >= w[pos]:
        if ans < v[pos] + Knapsack(pos + 1, left - w[pos]): # Me conviene tomarlo
            ans = v[pos] + Knapsack(pos + 1, left - w[pos]) 
            choice[pos][left] = True # Actualizo la decision optima
    vis[pos][left] = True
    return memo[pos][left] = ans
```

Entonces podemos reconstruir la solución usando la siguiente función recursiva:

```Python
def KnapsackSolution(pos,left,ans):
    if pos == n: return
    if choice[pos][left]:
        ans.append(pos)
        left -= w[pos]
    KnapsackSolution(pos + 1, left, ans)
```

La cual tiene una complejidad de $O(n)$, pues solamente hay una transición en cada paso y la cantidad máxima de elementos es $O(n)$.

## Contest Corto de DP

* [GPC-UPC DP Short Contest](https://codeforces.com/group/Hz7jTE3LqO/contest/250369)