# Programación Dinámica

## Conocimientos Previos

- Recursión: Recordar que una recursión es una función que se llama a sí misma para procesar una solución, de forma que al menos uno de sus parámetros se acerque a un caso trivial (base).

- Backtracking: Recordar que el Backtracking es una forma de Búsqueda Completa que usa recursión para atravesar todos los posibles estados de un problema, pero usando criterios de corte para no analizar casos que no tienen sentido o beneficio para nuestras soluciones.

## Definición

**Programación Dinámica** es un paradigma de resolución de problemas, basado en la propiedad de subestructura óptima, cuyo fin es optimizar la complejidad temporal de un algoritmo aumentando la complejidad espacial de este, aprovechando que el espacio de búsqueda es lo suficientemente pequeño de acuerdo a lo necesitado. Por lo general se usa para resolver problemas de optimización: maximizar o minimizar una función en base a determinadas restricciones.

### ¿Qué se entiende por subestructura óptima?

La subestructura óptima se puede ver como que la solución de la transición de un estado hacia otros (recordemos que se forma un Grafo Dirigido Acíclico) tiene un valor asociado $f(u,v)$ (valor asociado de ir del estado $u$ al estado $v$), entonces para cualquier punto $i$ en el camino desde $u$ hasta $v$ se da que $f(u,i)$ es la solución óptima (depende del problema), al igual que $f(i,v)$.

Para analizarlo mejor, veamos un ejemplo:

#### Camino simple más corto de un nodo a otro

El problema clásico del camino más corto de un nodo $u$ a un nodo $v$ presenta subestructura óptima, puesto que si definimos $f(a,b)$ como la longitud del camino más corto del nodo $a$ a $b$, notaremos que para cada $i$ en el camino entre $a$ y $b$ se tiene que dar que:

$$ f(u,i) = \min\limits_{i\text{ esta en el camino u}\leadsto v}{w(u,p_{1},p_{2},\ldots,p_{k},i)} $$

Donde $w(u,p_{1},p_{2},\ldots,p_{k},i)$ es la función que calcula la longitud del camino $a\leadsto p_{1} \leadsto \cdots \leadsto i $.

Es sencillo notar que:

$$ f(u,v) = f(u,i) + f(i,v) $$

Esto es verdadero por el simple hecho de que para cualquier camino $(u,\ldots,y,\ldots,v)$ se dará que:

$$ f(u,y) + f(y,b) \leq w(u,\ldots,y) + w(y,\ldots,v) $$

Llegando a que deben ser ambos subcaminos los más cortos para que el camino en sí también lo sea.

#### Camino simple más largo de un nodo a otro

Ahora la pregunta es ¿El camino simple más largo tiene subestructura óptima? La respuesta es no, analicemos el siguiente ejemplo:

![](pictures/Grafo1.png)

Notemos que el camino simple más largo de $a$ a $d$ tiene longitud 2, siendo alguno de estos: 

$$ a \leadsto b \leadsto d \vee a \leadsto c \leadsto d $$

Sin embargo, el camino más largo de $a$ a $b$ es:

$$ a \leadsto c \leadsto d \leadsto b $$

Que tiene longitud 3, por lo que:

$$ f(a,d) \neq f(a,b) + f(b,d) $$

Concluyendo que no tiene subestructura óptima.

## Almacenamiento

En la definición, señalamos que la Programación Dinámica (DP a partir de ahora) "sacrifica" memoria por obtener mejor resultado en tiempo, ahora veremos un ejemplo para reconocer por qué se da esto.

Recordemos el problema de hallar el $n$-ésimo número de la sucesión de Fibonacci:

$$ F(n) = F(n-1) + F(n-2) $$

Si recordamos el arbol de recurrencia que se forma, notaremos que tiene una complejidad exponencial $O(\phi^{n})$. Pero es sencillo ver que hay valores $F(i)$ intermedios que siempre se repiten, por lo que repetimos cálculos innecesariamente. La solución a esto es el **Almacenamiento (*Memoization*)**.

Gracias al almacenamiento, nos basta almacenar un valor *dummy* inicial, que señale que la respuesta para este estado aun no ha sido procesada para ejecutar la solución; y en el caso que sí lo esté, devuelva la solución ya calculada.

Siendo esto así, marcamos los valores que evitaríamos volver a calcular para el caso $F(6)$

![](pictures/FiboGraph.png)

Los cuadrados señalan los estados que fueron visitados cuando ya se tenia la respuesta almacenada, por lo que simplemente se devolvieron sus soluciones, optimizando la solución del problema.

Las complejidades en los problemas que usan DP son calculadas de la siguiente manera, lo cual es muy lógico si recordamos que la estructura es un DAG:

$$ T(DP) = T(\text{Cantidad de estados})\cdot T(\text{Procesamiento por estado}) $$

En el caso de fibonacci obtendríamos algo de la siguiente manera:

```Cpp
long long f(int n){
    if(n <= 1) return n;
    if(F[n]!=dummy) return F[n];
    return F[n] = f(n-1)+f(n-2);
}
```

Donde el valor de $dummy$ es constante y por lo general un valor absurdo para la solución. Además $F[n]$ es un arreglo global donde se almacenarán las soluciones para cada estado (en este caso $fibo(n)$).

## Tipos de Programación Dinámica

Hay dos tipos de DP: Iterativo y Recursivo. Cada uno de estos métodos tiene sus ventajas y desventajas, y se deben aprovechar según convenga en el problema.

### DP Recursivo

El DP Recursivo es la versión más simple de DP, puesto que basta con tomar un Backtracking con elementos fácilmente asociables a una DAT o Estructura de Datos eficiente y aplicar el método de Almacenamiento (como vimos en el Fibonacci anterior). Un ejemplo para este tipo de problemas es el clásico **Problema de la Mochila 0-1**.

#### Problema de la Mochila 0-1

La estructura de Backtracking para que el Problema de la Mochila sea resuelto con una función que devuelva la máxima ganancia que se puede obtener sería algo así:

```Cpp
long long Knapsack(int pos, int left){
    if(pos == n){
        return 0; // Aca termina todo, devolvemos 0
    }
    if(w[pos] <= left){ // Si podemos tomar
        return max(v[pos]+Knapsack(pos+1,left-w[pos]),Knapsack(pos+1,left)); // Maximizamos
    }
    else return Knapsack(pos+1,left); // Unica opcion
}
```

Este algoritmo itera sobre todas las posibilidades válidas del problema, además sus parámetros son valores fácilmente asociables a una DAT (pueden ser usados como los índices de una matriz) y lo más importante de todo: Es fácil de pensar y sencilla de programar.

Ahora, debemos agregar solamente 1 paso a esta función para que se vuelva un DP recursivo: Almacenamiento, considerando que guardaremos las respuestas en una tabla $memo$ de $n\times C$ (para todas las posiciones posibles y capacidades posibles).

```Cpp
long long DPKnapsack(int pos, int left){
    if(pos == n){
        return 0;
    }
    if(memo[pos][left]!=dummy) return memo[pos][left];
    if(w[pos] <= left){
        return memo[pos][left] = max(v[pos]+DPKnapsack(pos+1,left-w[pos]),DPKnapsack(pos+1,left));
    }
    else{
        return memo[pos][left] = DPKnapsack(pos+1,left);
    }
}
```

Así logramos reducir una complejidad exponencial de $O(2^{n})$ a $O(nC)$. La respuesta nos la dará $DPKnapsack(0,C)$.

### DP Iterativo

El DP Iterativo es la versión un poco más complicada de pensar de manera directa, pero es igual de sencilla una vez se tiene suficiente experiencia con "invertir" el DP recursivo.

Una forma eficiente de obtener un DP iterativo es primero formar la recursión para un DP recursivo y luego analizar el flujo de la dirección de los estados, para saber qué estados dependen de cuáles y lograr identificar en qué orden se deben plantear las iteraciones.

Analicemos el problema de la mochila para reconocer cómo "invertir" un DP recursivo:

Consideremos un estado $DP(i,l)$, este se verá afectado por $DP(i+1,l)$ y $DP(i+1,l-w[pos])$ en el peor de los casos, lo que quiere decir que el flujo del primer parámetro es en aumento, mientras que el del segundo parámetro es en descenso. Lo que quiere decir que debemos invertir estas transiciones para llegar a la siguiente iteración:

```Cpp
for(int l=0; l<=C; i++) memo[n][l] = 0; // Casos base
for(int i=n-1; i>=0; i--){ // Invertimos el flujo de la posicion
    for(int l=0; l<=C; l++){ // Invertimos el flujo de la capacidad
        memo[i][l] = memo[i+1][l]; // No tomamos nada;
        if(w[pos] <= l) memo[i][l] = max(memo[i][l],v[pos]+memo[i+1][l-w[pos]); // Podemos tomar, maximizamos
    }
}
```

En este caso, la complejidad será la misma $O(nC)$, además la respuesta del problema estará almacenada en $memo[0][C]$. Este método es bastante bueno para hallar DP Iterativos, pero no es absoluto.

#### Ponga a prueba su criterio

Suponga que tiene un arreglo $C[n][n]$ que determinará los pesos de segmentos $A[i\ldots j]$, además necesita almacenar en un arreglo extra el valor de 

$$ F[i][j] = \max\limits_{i \leq x \leq y \leq j}{C[x][y]} $$

Determine cómo realizar el DP Iterativo de este problema, considerando que debe formar la tabla $F$.

### Comparación entre ambos tipos de DP

Hay diferencias considerables entre los dos tipos de DP, algunas de las más importantes son las siguientes:


|                DP Recursivo                |                    DP Iterativo                   |
|:------------------------------------------:|:-------------------------------------------------:|
|        No pasa por todos los estados       |             Pasa por todos los estados            |
|        Necesita de todos los estados       | Dependiendo, puede necesitar solo algunos estados |
|  Necesita inicializar la tabla con dummys  |     Necesita inicializar solo los estados base    |
| Puede generar RTE por la pila del programa |        No es sencillo pensar su estructura        |

### Compresión de memoria

La principal ventaja del DP Iterativo sobre el DP Recursivo es que se puede hacer **Compresión de memoria**, lo que implica que no es necesario usar todos los estados para calcular la respuesta final, solamente basta con algunos. Veamos el ejemplo del problema de la mochila:

$DP(i,l)$ podia ser modificado por $DP(i+1,l)$ y $DP(i+1,l-w[pos])$ en el peor de los casos, por lo que no podemos descartar ninguna capacidad, pero si notamos bien, el parámetro de posición se vuelve irrelevante una vez que lo aumentamos dos veces. Esto quiere decir que podemos mantener una matriz de $2\times C$ y la respuesta final la guardaremos en $memo[0][C]$. Ahora, la pregunta es: ¿Cómo podemos usar la matriz sin entrecruzar los datos, además de saber de qué estados venimos? Para este caso en particular, aprovecharemos la paridad de la posición para guardar su respuesta, así sabremos exactamente de qué fila estamos viniendo.

Para verlo mejor, basta con hacer el siguiente cambio:

```Cpp
for(int l=0; l<=C; i++) memo[n&1][l] = 0; // Casos base con paridad de n
for(int i=n-1; i>=0; i--){ // Invertimos el flujo de la posicion
    for(int l=0; l<=C; l++){ // Invertimos el flujo de la capacidad
        memo[i&1][l] = memo[(i+1)&1][l]; // No tomamos nada;
        if(w[pos] <= l) memo[i&1][l] = max(memo[i&1][l],v[pos]+memo[(i+1)&1][l-w[pos]); // Podemos tomar, maximizamos
    }
}
```
Obviamente la respuesta estará en $memo[0\&1][C] = memo[0][C]$ como señalamos anteriormente.

### Problemas Clásicos de DP

#### Rod Cutting

#### 1D Range Sum

#### 2D Range Sum

#### Longest Increasing Subsequence

#### Longest Commong Subsequence

#### Coin Change