# Programación dinámica

Sé, desde hace un largo tiempo, que la programación dinámica es un tema importante para las competencias de programación. Sin embargo, nunca llegué a entender el tema y hoy voy a tratar de profundizar en él a medida que explico la solución ofrecida en el libro.

## Claves de la programación dinámica:
Al parecer hay dos claves para encontrar y elaborar un algoritmo de programación dinámica.
* Subproblemas / recursividad
* Memoria


Al momento de resolver un problema debes preguntarte si puedes encontrar la solución a través de resolver un problema más pequeño repetidas veces. Para ser sincero, esto me recuerda mucho a la solución [Greedy](https://es.wikipedia.org/wiki/Algoritmo_voraz), en este tipo de soluciones tomas una decisión eficaz una y otra vez esperando que esto resuelva el problema. Curiosamente hoy trataremos un problema que falla al aplicar soluciones Greedy.

Como ya dije, nunca interioricé programación dinámica, pero creo que puedo explicar la solución de este problema.

### Dar un cambio con el mínimo número de monedas
El problema consiste en dar un cambio usando el mínimo número de monedas. Si usamos las monedas clásicas del dolar: [1, 5, 10, 25, 50], es relativamente fácil obtener una solución usando Greedy.

In [11]:
monedas = [1,5,10,25,50]
cambio = 80
min_monedas = []
while(cambio>0):
    for i in range(len(monedas)-1,-1,-1):
        if(monedas[i]<=cambio):
            min_monedas.append(monedas[i])
            cambio -= monedas[i]
            break
print(min_monedas)

[50, 25, 5]


In [13]:
monedas = [1,5,10,25,50]
cambio = 45
min_monedas = []
while(cambio>0):
    for i in range(len(monedas)-1,-1,-1):
        if(monedas[i]<=cambio):
            min_monedas.append(monedas[i])
            cambio -= monedas[i]
            break
print(min_monedas)

[25, 10, 10]


En los ejemplos de arriba podemos ver que la solución Greedy funciona. Simplemente usamos la moneda más grande que podamos tomar, una y otra vez. En el primer ejemplo queremos un cambio de 80 centavos. Entonces, ponemos una moneda de 50, nos sobra 30, ponemos una moneda de 25 y una de 5. La respuesta es: $50,25,5$.

Tomamos la decisión de elegir la moneda más grande una y otra vez, eso caracteriza a Greedy. Sin embargo, esta solución falla si usamos otras monedas.

In [14]:
monedas = [1,3,4]
cambio = 6
min_monedas = []
while(cambio>0):
    for i in range(len(monedas)-1,-1,-1):
        if(monedas[i]<=cambio):
            min_monedas.append(monedas[i])
            cambio -= monedas[i]
            break
print(min_monedas)

[4, 1, 1]


Greedy me dice que el mínimo número de monedas es 3: $4,1,1$. Esto está mal, la respuesta correcta es: $3,3$. Entonces, cómo podemos hacer para encontrar el mínimo número de monedas.

### Resolviendo subproblemas
El análisis que se lleva en el libro es el siguiente, primero identificamos el problemas con una función: $f(x)$. Para esta función analizamos las soluciones de valores pequeños.
* monedas = [1,3,4]
* f(0) = 0
* f(1) = 1 [1]
* f(2) = 2 [1,1]
* f(3) = 1 [3]
* f(4) = 1 [4]
* f(5) = 2 [1,4]
* f(6) = 2 [3,3]
* f(7) = 2 [3,4]
* f(8) = 2 [4,4]

Aquí la cosa se pone más imaginativa, porque el libro nos dice que deberíamos ser capaces de encontrar un patrón de recursividad al ver estas respuestas. De alguna forma, la solución de $f(x)$ depende de soluciones anteriores. Por ejemplo, $f(7)$ depende de $f(4)$. EL libro hace un gran salto y nos dice que el secreto está en que cada solución depende de la primera moneda que elijas.

En $f(7)$, si eliges empezar con una moneda de $3$, debes obtener la solución de $1+f(7-3)$. Quitas $3$ del cambio por  la moneda que ya elegiste y sumas $1$ por la misma razón, ya estás usando una moneda.  
$f(7)=1+f(4) = 1+1=2$

Entonces, acabamoos de encontrar un subporblema que puede resolverse de forma recursiva. Debemos resolver $f(x) = 1+f(x-m)$. La función se llama a sí misma, pero con un valor inferior de acuerdo a la moneda con la que decidamos empezar.

### Ganando eficiencia con memoria
Ahora que ya encontramos la solución recursiva, debemos hacer que el algoritmo sea más eficiente. En un concurso de programación hay miles de casos de prueba. Si debes resolver una función recursiva una y otra vez, el algoritmo es muy lento. Así que, para evitar ejecutar la misma acción una y otra vez, almacenamos los valores de las funciones menores que ya hemos resuelto. El primer valor a almacenar sería $f(0)=0$, porque necestias cero monedas para un cambio de 0. Para 1 sería: $f(1)=f(0)+1=0+1=1$. Y cada vez que resolvemos estos problemas vamos almacenando las respuestas para no tener que volver a calcularlas.

In [3]:
# solcuión de programación dinámica

#asumo que las monedas se dan al inicio del problema
monedas = input().split()
for i,moneda in enumerate(monedas):
    monedas[i] = int(moneda)
    
print(monedas)

#número de casos de prueba
T = int(input())
print(T) #para que permanezca en el notebook

#aquí es importante leer las restricciones del problema
#cuál es el valor máximo que puede tomar el cambio
#en este caso asumiré que el valor máximo del cambio es 100
cambio_maximo = 100

#creo una lista llena de 101 para la memoria
memoria = [cambio_maximo+1]*(cambio_maximo+1)

#Debo almacenar la primera moneda de la solución
primera_moneda = [cambio_maximo+1] * (cambio_maximo+1)

#genero todas las posibles respuestas hasta f(cambio_máximo)
memoria[0] = 0
primera_moneda[0] = 0
for cambio in range(1,cambio_maximo+1):
    for moneda in monedas:
        #memoria[cambio] = 101 al empezar
        if(cambio-moneda>=0 and (memoria[cambio-moneda]+1<memoria[cambio])):
            #aquí esta la solución de subproblemas
            memoria[cambio] = memoria[cambio-moneda]+1
            primera_moneda[cambio] = moneda

#casos de prueba
for i in range(T):
    cambio = int(input())
    print(cambio)
    #simplemente debo imrpimir el valor ya calculado
    print(memoria[cambio])
    
    #la primera moneda de cada solución se va restando
    while(cambio>0):
        print(primera_moneda[cambio],end=' ')
        cambio -=  primera_moneda[cambio]
    print()
    
    

[1, 3, 4]
3
6
2
3 3 
10
3
3 3 4 
7
2
3 4 


Usando las monedas [1, 3, 4] este algoritmo es capaz de retornar el número mínimo para $f(6)= 2$ [3, 3], $f(10) = 3$ [3, 3, 4] y $f(7)=2$ [3, 4]

Como te abrás dado cuenta, la complejidad de este algoritmo es de $O(N \times{M})$ siendo N el cambio máximo y M el número de monedas disponibles.

El secreto de la eficiencia de este algoritmo está en la memoria, ya que por sí solo, $O(N \times{M})$ no es muy eficiente. Espero que a medida que avancemos en el libro encontremos mejores ejemplos para programción dinámica.

### La primera moneda
Un último asunto que necesito explicar es por qué almaceno la primera moneda. Si tengo la primera moneda entonces puedo repetir el algoritmo $1+f(cambio-moneda)$.  
La primera moneda para resolver $f(10)$ es 3, entonces almaceno esa moneda y le resto al cambio. La primera moneda para resolver $f(7)$ es 3, este 3 ya debería estar almacenado y le resto 3 al cambio. Finalmente, la primera y única moneda para resolver f(4) es 4. Así logro imprimir los valores de las monedas usadas para obtener 10 [3, 3, 4].