# Ver la versión interactiva en https://algoritmos-rw.github.io/algo2_apuntes/TallerPD.slides.html !!!

# Programación Dinámica: or How I Learned to Stop Worrying and Love the Recurrencia

Código en https://algoritmos-rw.github.io/algo2_apuntes/TallerPD.ipynb

La programación dinámica es una _heurística_ de programación, una forma de pensar y encarar problemas. En los términos más básicos puede reducirse a **resolver un problema en base a los problemas anteriores.** 

## Cuando puedo usar PD?
* Superposición de problemas: La solución de un problema me sirve para resolver mi futuro problema.

  * Si no tengo esto, **no puedo** aplicar PD

## Cuando me conviene usar PD?
* Subestructura optima: La combinación de resultados óptimos para mis subproblemas me da el resultado total óptimo.

  * Si bien esto no es obligatorio, siempre esta bueno tener la solución óptima a un problema.

## Tipos de PD:
* Top Down (memoization): Empezando desde mi problema, cada vez que voy a utilizar un resultado anterior me pregunto si ya lo tengo guardado. Si no lo esta, lo genero y lo guardo en memoria

* Bottom Up (tabulation): Empezando desde el problema más chico posible, empiezo a iterar todos los problemas posibles 'para arriba'. Así, siempre voy a tener toda la información guardada (a costo de espacio). Una vez que llego al problema original, resuelvo teniendo en cuenta lo anterior. --> **Este es el visto en este taller**

## Pasos para resolver cualquier tipo de problema (Bottom Up)

Quiero sacar el factorial de 5. El factorial de 5 es 5 multiplicado al factorial de 4. El factorial de 4 es 4 multiplicado al factorial de 3... etc. 

La estrategia es la de guardar cada uno de esos resultados en una lista incremental (`DP`) donde cada elemento es la solución al problema en ese indice. Siguiendo el ejemplo, en `DP[1]` guardo el factorial de 1; en `DP[2]` guardo el factorial de 2; así, hasta llegar a `DP[5]`, que es el problema a resolver.



## Ecuación de recurrencia 

La ecuación de recurrencia se compone de dos partes

1. Valores Iniciales: Cuál es el problema más chico posible y cual es su solución? (En analogía a D&C, esto es 'el caso base')

2. Relacion de recurrencia: Como se relaciona una solución con las soluciones previas?

\begin{equation}
  DP[i]=\begin{cases}
    \text{Valores iniciales} & \text{if todo normal}.\\ \\
    \text{Relación de recurrencia} & \text{if condición}. 
  \end{cases}
\end{equation}

### Preguntas a hacerse:

* Cuales son mis valores iniciales/casos base? Cual es la forma en la que resuelvo el problema mas chico posible?
* Cuales son mis otros casos?
* Como defino entre ambos?

## Ejemplo: Factorial de x

### Puedo usar PD?

Si: el factorial de x depende del factorial de los anteriores a x.

### Ecuación de recurrencia

* Cual es mi caso base / valor inicial?
    * Factorial de 0 = 1
    * Factorial de 1 = 1
   
* Cuales son mis otros valores? 
    * Factorial de i = i * factorial de i-1
   
* Como defino entre ambos?
    * Si i = 0 o i = 1 --> valor inicial
    * Si i > 1 --> valor no inicial

\begin{equation}
  DP[i]=\begin{cases}
    1 & \text{if i == 0 || i == 1}.\\ \\
    i * DP[i-1] & \text{if i > 1}.
  \end{cases}
\end{equation}

In [1]:
def factorial(x):
    dp = [None] * (x+1)
    for i in range(len(dp)):
        if i == 0 or i == 1:
            dp[i] = 1
        if i > 1:
            dp[i] = dp[i-1] * i
    print(dp)
    return dp[x]

factorial(5)

[1, 1, 2, 6, 24, 120]


120

**Complejidad: $O(n)$** 

## Código -> Creo, recorro, resuelvo, devuelvo

1. Creo una lista (o diccionario) del tamaño de problemas que voy a tener donde guardo los resultados.

    * Tengo un arreglo de longitud n --> Tengo n problemas

    * Tengo que resolver como hacer algo la 5ta vez --> Tengo 5 problemas

2. Recorro mis problemas.

3. Resuelvo mis problemas, con mi ecuacion de recurrencia.

4. Devuelvo lo pedido.

## Problema 0: Buscar el máximo de un arreglo

### Ecuación de recurrencia

* Cual es mi caso base? 
    * Mi problema más chico: Un arreglo de longitud 1
        * Maximo de [3] es 3
        * Maximo de [4] es 4
        
    **Caso base: DP[0] = arr[0]**
    
    
* Cuales son mis otros casos?
    * El elemento anterior a mi es mas grande que yo
    <br>**Caso no base: DP[i] = DP[i-1]**

    * Soy mas grande que mi elemento anterior
    <br>**Caso no base: DP[i] = arr[i]**
    
    
* Como defino entre ambos?
    * Si estoy en el primer elemento/lista de largo 1 -- > Caso base
    * Si no --> Caso no base

\begin{equation}
  DP[i]=\begin{cases}
    arr[0] & \text{if i==0}.\\ \\
    arr[i] & \text{if arr[i] > DP[i-1]}.\\ \\
    DP[i-1] & \text{if DP[i-1] > arr[i]}.
  \end{cases}
\end{equation}

In [1]:
def maximo(arr):
    dp = [0] * len(arr)                 #Creo
    dp[0] = arr[0]                      #Seteo Valor inicial
    for i in range(len(dp)):            #Recorro
        if arr[i] > dp[i-1]:
            dp[i] = arr[i]
        if dp[i-1] > arr[i]:
            dp[i] = dp[i-1]             #Resuelvo
    print(dp)
    return dp[-1]                       #Devuelvo

maximo([1])
maximo([1,5,2])
maximo([1,5,2,3,-2,21,10,3])

[1]
[1, 5, 5]
[1, 5, 5, 5, 5, 21, 21, 21]


21

**Complejidad: $O(n)$** 

## Tips y cuidados!!

* El caso base suele ser 0, 1, infinito, o el arreglo mismo

* Es mucho más facil si inicializo directamente en mi caso base, y evitar ese if extra

    ```
    Si el caso base es el arreglo mismo: dp = copy.copy(arr)
    Si el caso base es 0: dp = [0] * len(arr)
    Si el caso base es 1: dp = [1] * len(arr)
    Si el caso base es infinito: dp = [math.inf] * len(arr)
    ```       

* Muchas veces puedo reescribir mi ecuacion de recurrencia, ya que solo pregunto quien es más grande/chico

    * Ej, buscando el máximo: 
    
        ```
        Si el caso base es mayor al problema anterior:
            resultado = caso base
        Si no:
            resultado = caso no base
        ```
    
    Puede ser escrito como:
    
        ```resultado = maximo(actual, anterior)```

* Ojo! No siempre tengo que devolver el último resultado:
    * Encontrar la maxima ganancia para 100 ventas --> Me piden el resultado en 100
    * Encontrar la maxima ganancia para cualquier venta, hasta 100 --> Me piden el maximo de mis resultados
    
* La devolucion suele ser: `min(dp), max(dp), dp[-1], dp[0], dp[n]`

In [3]:
from copy import copy
def maximo_refactorizado(arr):
    dp = copy(arr)                          #Creo
    for i in range(1,len(dp)):              #Recorro
        dp[i] = max(dp[i],dp[i-1])          #Resuelvo
    return dp[-1]                           #Devuelvo

maximo_refactorizado([1,5,2,3,-2,21,10,3])

21

---
---

## Problema 1: Fibonacci

> Se llaman números de Fibonacci a aquellos que forman parte de la sucesión infinita de números naturales donde cada número se calcula sumando los dos anteriores a él. 

Esta sucesión fue descrita por Fibonacci como la solución a un problema de cría de conejos: 

> “Cierto hombre tiene una pareja de conejos juntos en un lugar cerrado y desea saber cuántos son creados a partir de este par en un año cuando, de acuerdo a su naturaleza, cada pareja necesita un mes para envejecer y cada mes posterior procrea otra pareja” 

\begin{equation}
  DP[i]=\begin{cases}
    1 & \text{if $i==0$ or $i==1$}.\\ \\
    DP[i-1]+DP[i-2] & \text{else}.
  \end{cases}
\end{equation}

In [4]:
def fibonacci(n):
    dp = [1] * n
    for i in range(2,len(dp)):
        dp[i] = dp[i-1]+dp[i-2]
    return dp

fibonacci(10)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

**Complejidad: $O(n)$** 

## Problema 2a: Longest Increasing Subsequence (LIS)

> Dado un arreglo, encontrar la longitud del mayor subarreglo incremental (no necesariamente contiguo). 

Por ejemplo: `LIS([1,-1, 4, 5, 3])` --> Devuelve 3, que es la longitud del subarreglo `[1,4,5]`

\begin{equation}
  DP[i]=\begin{cases}
    DP[j]+1 & \text{if existe DP[j] (con $j=0,..,i$) mas grande que DP[i]}.\\ \\
    1 & \text{else}
\end{cases}
\end{equation}

In [5]:
def LIS(arr):
    dp = [1] * len(arr)
    for i in range(len(dp)):
        for j in range(i):
            if arr[j] < arr[i]:
                dp[i] = max(dp[i],dp[j]+1)
    print(dp)
    return max(dp)


LIS([1,-1,4,5,3])

[1, 1, 2, 3, 2]


3

**Complejidad: $O(n^2)$** 

## Problema 2b: Longest Contiguous Increasing Subsequence

> Dado un arreglo, encontrar la longitud del mayor subarreglo incremental contiguo. 

Por ejemplo: `LCIS([1, 8, 4, 2, 1])` --> Devuelve 2, que es la longitud del subarreglo `[1,8]`

\begin{equation}
  DP[i]=\begin{cases}
    DP[i-1]+1 & \text{if \(i \neq 0\) && \(arr[i-1]<arr[i]\) }.\\ \\
    1 & \text{else}
\end{cases}
\end{equation}

In [6]:
def LCIS(arr):
    dp = [1] * len(arr)
    for i in range(1,len(dp)):
        if arr[i-1]<arr[i]: 
            dp[i] = max(dp[i],dp[i-1]+1)
    print(dp)
    return max(dp)

LCIS([1, 8, 4, 2, 1])

[1, 2, 1, 1, 1]


2

**Complejidad: $O(n)$** 

## Problema 3: Mayor suma de subarreglo contiguo incremental
    
> Dado un arreglo, encontrar el valor maximo posible para la suma de un subarreglo contiguo (ventana) incremental

Ej: sumatoria_ventana_incremental([3,-1,-5,6,7,3,-9]) da 13 (de sumar [6,7])

\begin{equation}
  DP[i]=\begin{cases}
    DP[i-1]+DP[i] & \text{if \(DP[i-1]+DP[i]>DP[i]\) && \(arr[i-1]<arr[i]\)}. \\ \\
    arr[i] & \text{else}.
\end{cases}
\end{equation}

In [7]:
def sumatoria_ventana_incremental(arr):
    dp = copy(arr)
    for i in range(len(dp)):
        if arr[i-1] <= arr[i]:
            dp[i] = max(dp[i-1]+dp[i],dp[i])
    print(dp)
    return max(dp)

sumatoria_ventana_incremental([3,-1,-5,6,7,3,-9])

[3, -1, -5, 6, 13, 3, -9]


13

**Complejidad: $O(n)$** 

## Problema 4: El problema del cambio

> Dado un arreglo de valores de monedas, y un valor N, encontrar la menor cantidad de monedas necesarias para representar N.

Ej: Para 4 pesos y monedas de 1, 2 y 3, la solucion es 2: dar dos monedas de 2. Para 3 pesos, la solucion es 1, solo dar la moneda de 3 .

\begin{equation}
  DP[i]=\begin{cases}
    1 & \text{if moneda de i existe}. \\
    \infty & \text{if i mayor a todas las monedas}. \\ \\
    \text{\(min(DP[i-m]+1)\)} & \text{else} \\ \text{con m en lista de monedas}.
\end{cases}
\end{equation}



In [8]:
from math import inf

def cambio(arr, n):
    dp = [inf]*(n+1)
    for i in range(n+1):
        for moneda in arr:
            if i == moneda:
                dp[i] = 1
            if i > moneda:
                dp[i] = min(dp[i], dp[i - moneda] + 1)
    return dp[n]

print(cambio([1,2,3], 3))
print(cambio([1,2,3], 4))

1
2


**Complejidad: $O(n * len(arreglo)$** 

## Problema 5: Cortando una Soga

>Dada una soga de n centimetros y un arreglo de a cuanto se puede vender cada soga mas chica que ella, encontrar la mayor ganancia que puedo obtener de vender la soga, teniendo en cuenta que puedo cortarla todas las veces que quiero.

Por ejemplo: Para una soga de 4 centimetros con precios `[1,5,8,9,10,17,17,20]`, el valor máximo que puedo obtener es 10, cortandola en 2 y vendiendo dos sogas de 2cm cada una.

\begin{equation}
  DP[i]=\begin{cases}
    DP[i-j-1]+precios[j] & \text{if \(DP[i-j-1]+precios[j] > arr[i]\)} \\ & \text{con j entre 0 e i }. \\ \\
    arr[i] & \text{else} \\ & \text{(ya que toda soga la puedo vender por su precio original)}.
\end{cases}
\end{equation}

In [9]:
def cortar_soga(precios,n):
    dp = copy(precios[:n])
    for i in range(n):
        for j in range(i):
            dp[i] = max(dp[i],precios[j]+ dp[i-j-1])
    #print(dp)
    return dp[-1]

cortar_soga([1,5,8,9,10,17,17,20],4)

10

**Complejidad: $O(n^2)$** 

## Matrices: Problemas con dos parametros o más

Hasta ahora solo hicimos problemas donde se tenga en cuenta un solo parametro. Es por eso que veníamos trabajando con lista de resultados. Cual es mi solución en 1, en 2, en 3... en i. Pero, y si tengo dos parametros variables? Cual es mi solución en i,j?

\begin{equation}
  DP(i,j)=\begin{cases}
    ... & ... \\
    ... & ...
\end{cases}
\end{equation}

## Problema 6: Subset Sum

> Dada una lista de números y un número n, devolver verdadero si existe un subconjunto que sume exactamente n.

Ej: Puedo sumar 9 con el arreglo `[1,3,2,5,7]` ? Si, porque puedo sumar 2 + 7 o 1+3+5. 

Primero, hago una matriz de n columnas y l filas (l siendo la longitud del arreglo). Esto representara lo siguiente:

|   Arreglo   | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
|-------------|---|---|---|---|---|---|---|---|---|
| [1]         |   |   |   |   |   |   |   |   |   |
| [1,3]       |   |   |   |   |   |   |   |   |   |
| [1,3,2]     |   |   |   |   |   |   |   |   |   |
| [1,3,2,5]   |   |   |   |   |   |   |   |   |   |
| [1,3,2,5,7] |   |   |   |   |   |   |   |   |   |

Esta matriz la poblaremos de Verdaderos o Falsos, dependiendo de si el arreglo de la fila puede sumar el número de la columna. Para esto, diseñamos nuestra ecuación de recurrencia. Notemos que hay varios casos.

* Si la lista actual contiene al número, entonces puedo sumar a el --> Verdadero (`[1,3]` puede sumar 3)
* Si la lista anterior a mi pudo sumar al número, entonces la lista actual tambien puede --> Verdadero (Como `[1,3]` puede sumar 3, `[1,3,2]` también)
* Si le saco el último a la lista y puedo sumar al número menos el sacado --> Verdadero (`[1,3,2]` puede sumar 5, ya que `[1,3]` puede sumar 5-2)

\begin{equation}
  DP(i,j)=\begin{cases}
    True & \text{if j en la fila i}. \\
    True & \text{if dp[i-1][j] == True (la fila anterior en la misma columna) }. \\
    True & \text{if la fila anterior en la columna j-arreglo[i] == True }. \\
    False & \text{else}.
\end{cases}
\end{equation}



Eventualmente, nos quedara la siguiente matriz:

|   Arreglo   | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
|-------------|---|---|---|---|---|---|---|---|---|
| [1]         | T | F | F | F | F | F | F | F | F |
| [1,3]       | T | F | T | T | F | F | F | F | F |
| [1,3,2]     | T | T | T | T | T | T | F | F | F |
| [1,3,2,5]   | T | T | T | T | T | T | T | T | T |
| [1,3,2,5,7] | T | T | T | T | T | T | T | T | T |

Y finalmente, devolvemos lo pedido. Analogamente a cuando devolviamos el último valor de nuestra lista (`DP[n]`), ahora devolvemos el valor de abajo a la derecha de nuestra matriz, es decir, `DP[l,n]`. En este ejemplo, verdadero.

In [28]:
def subset_sum(arr,n):
    columnas = n + 1
    filas = len(arr) + 1
    dp = [[False] * columnas for i in range(filas)]
    for i in range(filas):
        for j in range(columnas):
            if not arr[:i] or j == 0: continue
            if arr[i-1] == j:
                dp[i][j] = True
            if dp[i-1][j] == True:
                dp[i][j] = True
            if dp[i-1][j-arr[i-1]] == True:
                dp[i][j] = True
    display(dp)
    return dp[len(arr)][n]
    
subset_sum([1,3,2,5,7],9)

[[False, False, False, False, False, False, False, False, False, False],
 [False, True, False, False, False, False, False, False, False, False],
 [False, True, False, True, True, False, False, False, False, False],
 [False, True, True, True, True, True, True, False, False, False],
 [False, True, True, True, True, True, True, True, True, True],
 [False, True, True, True, True, True, True, True, True, True]]

True

**Complejidad: $O(\text{elementos en matriz})== O(suma * len(arreglo))$** 


**Complejidad: $O(\text{elementos en matriz})== O(suma * len(arreglo))$** 

Cuando una complejidad depende del *valor numérico* de la entrada, como en este caso de la suma, tiene una complejidad *pseudo-polinómica* (siempre y cuando sea complejidad polinómica, obviamente). 

Esto es en contraste a cuando se depende de la *longitud* de la entrada, por ejemplo cuando se recorre un arreglo de n elementos enteros, técnicamente se habla de los n\*sizeof(int) bytes que se usan para representarlo.

También, este problema es NP-Completo (tanto NP como NP-Hard), ya que su verificación puede hacerse en tiempo polinómico pero no su resolución (NP) y porque se puede demostrar que todos los problema NP pueden ser reducidos a este (NP-Hard).

Finalmente, y recalcando la importancia de diferenciar entre un *problema* y un *algoritmo*, un problema NP-completo con un algoritmo pseudo-polinómico como este se considera un algoritmo **debilmente NP-completo**.