In [1]:
import numpy as np
import sys
import math
import itertools

# Programación dinámica

## 3.1 Introducción

La Programación Dinámica (PD), al igual que divide y vencerás (D&C, por sus siglas en inglés), resuelve problemas recursivamente, dividiéndolos en subproblemas y combinando sus soluciones.

Ahora bien, la naturaleza de los subproblemas que estos 2 métodos resuelven, son fundamentalmente distintas y, por lo tanto, la forma de resolverlos, también.
Como ya se ha dicho, los subproblemas de D&C son **disjuntos**. Por ejemplo, en _merge sort_ se divide un problema correspondiente a una lista de tamaño `n`, en 2 subproblemas de tamaño `n/2` que pueden ser resueltos independientemente y que serán utilizados para formar la solución al problema original.

Esta aproximación no daría la respuesta correcta a un problema que se resuelve por PD, como el de hallar el camino más rápido entre 2 puntos. Un clásico problema de optimización que usaremos de ejemplo y en el que nos abstraeremos de valores numéricos.

<img src="grilla.png" alt="mm" style="width: 1600px;"/>

Si se dividiera el problema original (**A4-D1**) en, por ejemplo, 2 subproblemas como pueden ser: **A4-C2** y **C2-D1**, la combinación de las soluciones óptimas a estos subproblemas, no será necesariamente la solución óptima al problema original, ya que existe la posibilidad que para ir de A4 a D1, no tenga q pasar por la celda C2. 

Será entonces que subidividimos mal al problema? Vemos que la solución pasa por C1, entonces quizás había que dividir **A4-D1** en **A4-C1** y **C1-D1**, pero, cómo podríamos haber sabido que el camino óptimo correspondía a la conjunción de esos 2 caminos? Tampoco podíamos descartar que pase por la celda **D2**, y por lo tanto subidividir el problema **A4-D1** en **A4-D2** y **D2-D1**.

En realidad, las 3 subidivisiones son necesarias. Para hallar el camino más rápido (camino óptimo), **A4-D1** es necesario hallar los caminos óptimos **A4-C1**, **A4-C2** y **A4-D2** (subproblemas **C1**, **C2**, **D2**), y luego ver cual de esos caminos es el más rápido, el de menor costo, es decir, el óptimo.

Notar que en este cálculo se debería agregar el costo de la celda D1, pero como éste es el mismo para las 3 vías (ya que todas terminan en D1), este costo no cambia la decisión.

Luego, al buscar el camino óptimo entre estas 3 posibilidades haremos lo mismo, recursivamente, hasta el caso base, al igual que en D&C. Verdad?

<img src="1_grilla.png" alt="mm" style="width: 1600px;"/>

Ahora vemos que no sólo tenemos que obtener 3 subproblemas para luego resolver el problema original, sino que estos subproblemas no son independientes. Para resolver **C1** y **D2**, debemos resolver **C2**. Y también hay 1 subproblema de **C2** q será necesario p/ resolver **C1** y otro para **D2**. Los subproblemas están superpuestos. 

Si resolvieramos los subproblemas así como se nos presentan, estaríamos repitiendo cálculo. De nuevo, esto no ocurre en un algoritmo de D&C como _merge sort_, donde el ordenamiento de una porción de una lista, no contiene información alguna, ni depende, del ordenamiento de otra porción de la lista.

<img src="1_tree.png" alt="mm" style="width: 1200px;"/>

Este árbol continua hasta llegar al caso base **A4**, que representa el camino óptimo para llegar a **A4** desde **A4**, lo cual es una trivialidad, pero ésto no nos sorprende ya que así son los casos base.

#### Subproblemas de borde

Cabe también aclarar que no todo subproblema depende de la resolución de 3 subproblemas. Para llegar a las celdas de los bordes (columna **A** o fila **4**), solo hay un camino posible. Estos subproblemas no representan casos base en nuestra función recursiva, ya que su solución depende de un subproblema anterior (y que también es un subproblema de borde), pero por ser esta dependencia directa y única, la solución a estos subproblemas de borde es directa. Esta aclaración es importante ya que es común encontrar subproblemas de borde en algoritmos de PD.

-------------

## 3.2 Características de los problemas que se pueden resolver por PD

PD aplica en problemas de **cálculo**, como el cálculo del número de Fibonacci que vimos en la Unidad 1 y
también en problemas de decisión, como el problema _subset-sum_, que veremos más adelante.
Pero la principal aplicación de los algoritmos de PD es la optimización. Por eso de aquí en adelante asumiremos que tratamos con problemas de optimización y que sus respuestas son el costo óptimo (o _score_ óptimo) y una solución óptima.

### Subestructura óptima

Un problema tiene subestructura óptima si la solución óptima a sus subproblemas puede ser utilizada para obtener la solución óptima al problema original.
En el ejemplo anterior, cada subproblema dependía de 3 subproblemas anteriores (o posteriores, depende de como se lo vea), y la solución al subproblema original es la solución a uno de los subproblemas, más el paso adicional de ir desde una celda anterior a la que corresponde al subproblema actual.

El ordenamiento de una lista no tiene subestructura óptima. En _merge sort_, luego de ordenar las 2 mitades de una lista, el ordenamiento final no proviene de elegir alguna de las mitadas o de simplemente concatenar las 2 medias listas ordenadas. La solución final requiere una etapa de combinación, una intercalación de elementos. Esa necesidad de una combinación (etapa de _combine_), es lo que previene a los algoritmos que se resuelven por D&C, ser resueltos por PD.

Las diferencias entre problemas que tienen subestructura óptima son sutiles, y nos llevará tiempo reconocerlas. No sólo es necesario que un problema se pueda dividir en subproblemas, sino también es necesario que la solución de alguno de estos subproblemas sea parte de la solución del problema original, o visto al revés, que la solución del problema original contenga a (o dependa de) la solución de uno de sus subproblemas

### Superposición de subproblemas

Esta es la segunda característica que estos problemas presentan y ya vimos un ejemplo de esta superposición. 

Es esta característica la que permite el ahorro de cómputo de un algoritmo de PD, frente a uno bruto (_naive_) y la forma de evitar el recálculo de un mismo subproblema es mediante la utilización de una **estructura de datos** que almacene los resultados de los subproblemas para su posterior utilización. 

Esta estructura de datos contendrá las respuestas a todos los subproblemas, desde el caso base, hasta el problema original. Y el orden en el que un algoritmo de PD se propone llenar esta estructura de datos permite clasificarlo en 2 tipos de algoritmos de PD:  _top-down_ con memoización y _bottom-up_.

Estos algoritmos avanzan por el árbol de subproblemas en sentidos opuestos, y si bien veremos esta clasificación dentro del marco de PD, ésta aplica a todos los algoritmos que puedan expresarse con una función recursiva [citation needed]

## 3.3 Dos tipos de algoritmos de PD

### _top-down_ con memoización

Estos algoritmos empiezan proponiéndose la resolución del problema original y luego van determinando, recursivamente, que subproblemas tienen que resolverse para resolver el subproblema original hasta llegar a un caso base, a partir del cual desanudan el camino, resolviendo cada subproblema.

Volviendo al ejemplo inicial, este algoritmo se propone, en primer lugar, resolver el problema de hallar el camino óptimo **A4-D1**, luego lo divide en subproblemas hasta proponerse la resolución del caso base: hallar el camino óptimo **A4-A4**.

Este procedimiento es propio de cualquier algoritmo recursivo (recordar _merge-sort_), lo que diferencia a los algoritmos de PD es el uso de la memoización.

#### memoización

Es el almacenamiento de valores óptimos y soluciones óptimas (es decir, resultados), de los subproblemas para posterior reutilización en la resolución de otro subproblema.

En cierta forma, es la respuesta intuitiva a la superposición de problemas de PD. Si un subproblema puede ser utilizado para resolver posteriores subproblemas, entonces lo natural es resolverlo y luego almacenar la respuesta en un _cache_ para posterior reutilización, como figura abajo.

Así, se inicializará una **estructura de datos** vacía con 1 elemento para cada subproblema. A cada subproblema resuelto su respuesta será almacenada en el lugar que le corresponda. Asimismo, cada vez que el algoritmo se proponga resolver un problema, intentará primero encontrar su respuesta en esta estructura de datos y así ahorrarse el recómputo.
El primer elemento de la estructura de datos en llenarse corresponderá al caso base, y el último a la respuesta del problema original.

### _bottom-up_

Estos algoritmos empiezan proponiéndose la resolución del subproblema más reducido, el trivial: el caso base. Luego reutiliza el resultado de este para resolver el siguiente subproblema y luego ambos resultados para resolver el siguiente, y así continua hasta llegar al problema orignal y resolverlo, al igual que con los anteriores subproblemas, reutilizando las respuestas anteriores.

Volviendo al ejemplo inicial, este algoritmo se propone, en primer lugar, resolver el problema de hallar el camino óptimo **A4-A4**, luego avanza con los siguientes subproblemas hasta proponerse la resolución del problema original: hallar el camino óptimo **A4-D1**. 

Una vez que se la conoce, esta aproximación parece ser la más natural de las 2.

Al empezar con el caso base y luego continuar con los subproblemas más pequeños hasta llegar al subproblema más grande (el original), estos algoritmos se aseguran tener todas las respuestas necesarias para resolver cada subproblema que se les presenta. 
Es decir, el primer subproblema que se proponen es el caso base y éste no requiere ninguna respueta anterior por su trivialidad. 
El segundo subproblema que se les presente, cualquiera sea éste, solo requiere la respuesta al caso base. El tercero, utilizará la respuesta de alguno de estos 2 subproblemas anteriores, y así continua. 
Esto podemos verlo en el ejemplo inicial.

#### advertencia

Nótese que las aproximaciones _top-down_ y _bottom-up_ varían en el orden en el que se **proponen** resolver los subproblemas y no en el orden de resolución de subproblemas. En ese caso, ambos resuelven de la misma y única posible manera: desde el caso base, hasta el problema original.

Las diferencias están en el sentido en el que avanzan por el árbol de subproblemas y en la forma de explorarlo: los _top-down_ lo hacen en profundidad y los _bottom-up_ lo hacen a lo ancho. Veremos más sobre esto de "profundidad y ancho" en siguientes clases.

<img src="2_tree.png" alt="mm" style="width: 2000px;"/>

## 3.4 _subset sum_

Apliquemos todos estos conceptos abstractos en un ejemplo bien concreto. 
Este es un problema de decisión, por lo que no hay costos ni soluciones óptimas.
Más bien buscamos una decisión correcta y una solución correcta.

Dada una lista de números naturales `conjunto` y un número natural `suma`, determinar si existe un subconjunto dentro de `conjunto` cuya sumatoria sea igual a `suma`.

Veamos un ejemplo simple:

In [2]:
conjunto = [3, 20, 1, 12, 5, 2]
suma = 8

Es fácil ver que el subconjunto `[3, 5]` suma `8` y por lo tanto es una solución del problema.

Notar que este es un problema de decisión, debemos determinar si algo es posible o no (V o F). Entonces, lo que en optimización llamamos solución óptima, en este caso sería una solución correcta y en vez de un valor óptimo, tendríamos un valor que debe ser correcto. Por ejemplo, `[1, 5]` también es una solución, pero es incorrecta, ya que su valor `6`, es incorrecto.

También notamos una característica que suele aparecer en los problemas de optimización, la multiplicidad de soluciones correctas posibles. `[1, 5, 2]` es otra solución correcta, ya que suma el valor correcto, `8`. Nótese que puede haber varias soluciones correctas, pero el valor correcto es único. Ya vimos el fenómeno análogo en problemas de optimización, distintas soluciones óptimas, pero un único valor óptimo, ya que si existe un máximo(mínimo), necesariamente éste es único, sino no sería el máximo (mínimo).

-----------

## 3.5 Solución exhaustiva de _subset sum_ 

Ya que tenemos un ejemplo, vamos a empezar por un paso que no es estrictamente necesario, pero suele ser útil: pensaremos un algoritmo bruto que resuelva este problema.

Y el algoritmo más simple para este problema, es el que realiza todas las sumas posibles entre los números del conjunto, hasta hallar la combinación de elementos (subconjunto), correcta:

In [3]:
def subset_sum_bruto(conjunto, suma):
    for i in range(0, len(conjunto)+1):
        for subconjunto in itertools.combinations(conjunto, i):
            if sum(subconjunto) == suma:
                print("Match. Subconjunto: ", subconjunto)
                return
    print("No hay match.")
    return

No es necesario entender esta función. Mejor aún, ni la lean, ya que estoy rompiendo una de las reglas de la clase (no utilizar librerías mágicas de Python).

Veamos si funciona:

In [4]:
subset_sum_bruto(conjunto, suma)

Match. Subconjunto:  (3, 5)


Funciona, y si bien no encuentra todas las respuestas, nos devuelve el valor correcto (match), y la solución correcta (Subconjunto). Probá variando el valor de `suma` para ver distintos resultados.

Veamos que hace exactamente este algoritmo.

Genera todos los subconjuntos posibles y los evalua uno por uno. Para nuestro ejemplo, ésta sería una descripción de los subconjuntos posibles:

<img src="3_tree.png" alt="mm" style="width: 2000px;"/>

Como el tamaño del conjunto (`N`) es de 6, existen 7 tamaños posibles de subconjuntos, desde el subconjunto con 0 elementos, al que se le llama **conjunto vacío** ($\{ \varnothing \}$), hasta el subconjunto que en realidad es el conjunto original (`{3, 20, 1, 12, 5, 2}`). Nótese la utilización de `{}` para denotar un conjunto.

Nótese también que el número de subconjuntos disponbles para cada tamaño. El conjunto vacío y el conjunto de tamaño original son necesariamente únicos. Los subconjuntos de tamaño de unidad `n=1` son tantos como elementos haya en el conjunto original ($6$). El número de subconjuntos de tamaño 2 es $15$, hay $20$ subconjuntos de tamaño 3, $15$ también de 4 y $6$ de tamaño 5. Ya veremos en clase como obtener estos tamaños de subconjuntos rápidamente.

Lo que está haciendo este algoritmo es hacer un corte en el conjunto original y separándolo en el subconjunto que podría sumar el valor buscado y el subconjunto descartado. Éste último no aparece en la figura por razones de claridad y espacio, pero podemos describirlo aqui:

* si el subconjunto evaluado es el vacío, entonces el descartado es el conjunto completo,
* si el subconjunto evaluado es el conjunto completo, entonces el descartado es el conjunto vacío,
* si el subconjunto evaluado es el $\{3\}$, entonces el descartado es el subconjunto ${20, 1, 12, 5, 2}$,
* si el subconjunto evaluado es el $\{3, 12\}$, entonces el descartado es el subconjunto ${20, 1, 5, 2}$,
* etc.

Notamos algunas características de esta función exhaustiva:

* cada problema resulta en una solución posible (el subconjunto), en un un valor (la suma de los elementos del conjunto) y siempre compara ese valor con el `suma` original.
* Hay problemas contenidos dentro de otros problemas más grandes. El conjunto ${3, 20, 1, 12, 5, 2}$ (cuando `n=6`), incluye, entre otros, a los conjuntos ${3, 20}$ y $5, 2$, que ya habían aparecido anteriormente y que también están incluidos en subconjuntos de tamaño 3, 4 y 5 que no aparecen en la figura.
* Hay mucho cálculo repetido e innecesario.

A lo largo de esta descripción, nos hemos cuidado de usar el término **problemas** en vez de **subproblemas**. Este árbol de problemas, es el árbol que explora una algoritmo _naive_ exhaustivo. No es un árbol de subproblemas obtenidos por PD.

-------------

## 3.6 Subproblemas de _subset sum_

Debemos conformar verdaderos subproblemas con subestructura óptima y para eso hay que determinar las variables que caracterizan a un subproblema. Debemos clarificar que es un subproblema para que al momento de programar podamos capturar estos conceptos en términos de variables.

En el ejemplo inicial, el problema era optimizar el camino de la celda **A4** a **D1** y este problema contenía a los subproblemas de optimizar el camino de **A4** a **D2**, de **A4** a **C1** y de **A4** a **C2**. Inmediatamente nos dimos cuenta que la celda inicial, **A4**, aparecía siempre y no diferenciaba a los subproblemas y los empezamos a llamar por su celda destino. Y estas celdas destino están compuestas por una letra y un número que identifican la fila y la columna en que se ubican. Eso mismo llevado a pseudocódigo (o código), sería una tabla donde se almacenan los subproblemas y a las tablas las indexamos con 2 números naturales. Esos 2 números naturales caracterizan a los subproblemas.

Volvamos a _subset-sum_. Tenemos una lista y un número natural como entradas. 
Aparentemente cada subproblema estaría dado por un subconjunto de cierto tamaño y un número natural al que tengo que llegar, pero en realidad no necesito el subconjunto, sino sólo su tamaño. 
Así como en el ejemplo anterior la celda de inicio era constante, el conjunto total también lo es. 
Así que sólo manteniendo un índice que indique de cuantos elementos dispongo y un números naturales que me indique el número al que debo sumar, me alcanza.

Y cómo progresan estos subproblemas? 
En nuestro ejemplo original el problema se caracteriza por `n = 6` (se dispone de todo el conjunto) y `suma = 8`, cada subproblema si un elemento forma parte del subconjunto sumado o el subconjunto descartado. A cada paso buscará determinar un elemento del subconjunto que resulta en el valor `suma = 8` original. 
Preguntarse, sucesivamente, si un elemento es necesario para obtener el valor `suma` final, equivale al siguiente árbol:

<img src="4_tree.png" alt="mm" style="width: 2000px;"/>

Conviene tomarnos el tiempo para entender este recorte del árbol. Notar que nos ahorramos varis subproblemas en el medio y desembocamos en 2 subproblemas particulares:
* El subproblema `n-6, suma - v[0] - v[1] - v[2] - v[3] - v[4] - v[5]`. Corresponde al uso del subconjunto que contiene todos los elementos para buscar obtener el número `suma`. Es el conjunto completo.
* El subproblema `n-6, suma`. Corresponde a descartar todo el conjunto para buscar obtener el número. Es el conjunto vacío

----------

## 3.7 Solución recursiva de _subset sum_ 

Ahora si, empezaremos la construcción de nuestra algoritmo y 
lo haremos empezando con algoritmos que sólo devuelvan la respuesta correcta y postergaremos la construcción de la solución correcta.
En la primer Unidad mencionamos al pasar que esta estrategia es la correcta. Ya veremos que diseñar el algoritmo que devuelva la solución correcta es lo más laborioso.
Una vez que tengamos nuestro diseño inicial, modificarlo o extenderlo para construir la solución correcta será una tarea relativamente sencilla.

Esquematizaremos nuestra solución recursiva de una manera similar a una recurrencia, sólo que ésta vez no expresaremos complejidades, sino que instrucciones

$$ subset\_sum(v, n, suma) = 
 \begin{cases}
\textbf{True}, \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad  \text{if} \ suma == 0
\newline
\textbf{False}, \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad  \text{if} \ n == 0 \ \& \ suma \neq 0
\newline
subset\_sum (v, n-1, suma - v[n] ) \quad \| \quad subset\_sum (v, n-1, suma ), \quad \ \text{if} \ n > 0
\end{cases} $$

Siendo este un problema de decisión, la respuesta correcta es un `V` o `F`, por lo tanto lo que hacemos es bifurcarnos a cada paso 
(como muestra el árbol de subproblemas anterior), hasta encontrar una serie de restas que lleven a `suma` hacia exactamente 0, 
lo que implica que los numeros restados, cuando sumados, resultarán en el valor de `suma`.
En caso de que se hayan agotado todos los elementos del set (ya sea que se hayan incluido o no en la resta), y no se haya llegado a un valor nulo de `suma`, entonces se devuelve un `F`, indicando que esa combinación particular no resulta en `suma`.

A medida que se desanuden las llamadas recursivas, los booleanos se propagarán "hacia arriba", y si alguna combinación ha resultado en `suma`, su `V` se propagará (gracias al `or`), hasta la llamada inicial.

`n==0` sería el caso base "original", el que garantiza que la recurrencia termine. 
Hay otro caso base, `suma==0`, que sólo se ejecuta cuando se puede alcanzar el valor `suma` y
que corta la recurrencia de manera temprana.

Veamos que el código Python es una transcripción directa de la recursiva:

In [5]:
def subset_sum_recursivo(conjunto, n, suma):
 
    # Casos base
    if (suma == 0):
        return True
    if (n == 0):
        return False
 
    # Caso recursivo
    # Uso n-1 por 0-index de Python
    return subset_sum_recursivo(conjunto, n-1, suma - conjunto[n-1]) or subset_sum_recursivo(conjunto, n-1, suma)

In [6]:
conjunto = [3, 20, 1, 12, 5, 2]
suma = 8

In [7]:
subset_sum_recursivo(conjunto, len(conjunto), suma)

True

In [8]:
suma = 0
subset_sum_recursivo(conjunto, len(conjunto), suma)

True

Pues claro, ese `V` corresponde al conjunto vacío.

In [9]:
suma = sum(conjunto)
subset_sum_recursivo(conjunto, len(conjunto), suma)

True

Y ese debería corresponder al conjunto entero.

In [10]:
suma = sum(conjunto) + 1
subset_sum_recursivo(conjunto, len(conjunto), suma)

False

Justo como esperábamos.

Tenemos subestructura óptima, pero tenemos también superposición de subproblemas? 
Bueno, la debilidad de este ejemplo es que la superposición de problemas es un poco difícil de ver y en casos reducidos suele no haber repetición de calculo alguna.
Un ejemplo reducido con repetición de cálculo sería el siguiente:

In [11]:
conjunto = [1, 2, 3, 20, 30, 50]
suma = 54

Tanto en la rama en que se incluya a `50` y se excluye a `20` y `30`, como en la que se incluye a `20` y `30` y se excluye a `50`, se llega a la mistma instancia:

In [12]:
conjunto = [1, 2, 3]
suma = 4

Definitivamente puede haber repetición de calculo y cuanto más grande sea el conjunto inicial y más alto el valor de `suma`, más chances habrá de que terminemos con subproblemas repetidos.
Y acá diseñamos algoritmos capaces de lidiar con mucha información.

Decidamos entonces, que estructura de datos nos conviene para almacenar los resultados parciales, las respuestas a los subproblemas.

--------

## 3.8 Solución _top-down_ de _subset sum_ (memoización)

La identidad de la estructura de datos está dada por las variables que caracterizan a los subproblemas. 
En este caso, hay 2 números naturales que caracterizan a los subproblemas por lo que utilizaremos una tabla.

Esta tabla tendrá tantas filas como elementos tenga `conjunto` y `suma` columnas. 
El número de filas es necesario, pero el numero de columnas suele ser sobredimensionado,
ya que no todos los valores posibles de `suma` apareceran en los subproblemas, salvo que
`conjunto` esté compuesto enteramente por `1`s.

Es necesario también que la estructura de datos esté inicializada de tal manera que sea fácilmente determinable si un subproblema fue resuelto y su resultado almacenado.
Para eso inicializamos la tabla con `None`s.

In [13]:
tabla = np.repeat(None, suma * len(conjunto)).reshape(len(conjunto), suma)

In [14]:
def subset_sum_topdown(conjunto, n, suma, tabla):
 
    # Casos base
    if (suma == 0):
        return True
    if (n == 0):
        return False
    # Agrego este caso base por necesidad, para no indexar `tabla` con un número negativo.
    if (suma < 0):
        return False
 
    # De nuevo, resto 1 por 0-indexing de python.
    if (tabla[n-1, suma-1] != None):
        return tabla[n-1, suma-1]
 
    # Caso recursivo
    # Uso n-1 por 0-index de python
    return subset_sum_topdown(conjunto, n-1, suma - conjunto[n-1], tabla) or subset_sum_topdown(conjunto, n-1, suma, tabla)

Comprobemos que el comportamiento sea idéntico a la función recursiva:

In [15]:
conjunto = [3, 20, 1, 12, 5, 2]
suma = 8

tabla = np.repeat(None, suma * len(conjunto)).reshape(len(conjunto), suma)
subset_sum_topdown(conjunto, len(conjunto), suma, tabla)

True

In [16]:
suma = 0
tabla = np.repeat(None, suma * len(conjunto)).reshape(len(conjunto), suma)

subset_sum_topdown(conjunto, len(conjunto), suma, tabla)

True

In [17]:
suma = sum(conjunto)
tabla = np.repeat(None, suma * len(conjunto)).reshape(len(conjunto), suma)

subset_sum_topdown(conjunto, len(conjunto), suma, tabla)

True

In [18]:
suma = sum(conjunto) + 1
tabla = np.repeat(None, suma * len(conjunto)).reshape(len(conjunto), suma)

subset_sum_topdown(conjunto, len(conjunto), suma, tabla)

False

Ahora si, estamos de condiciones de recorrer el árbol de subproblemas en sentido inverso.

--------

## 3.9 Solución _bottom-up_ de _subset sum_ 

El código de este algoritmo es totalmente distinto a los anteriores, aunque conceptualmente es similar.

La tabla también es distinta, tiene una columna y una fila extras ya que ahora almacenamos los casos base en la `tabla`, cosa que antes no hacíamos; los casos base eran capturados antes de evaluar y almacenar datos en la estructura de datos `tabla`. Esto es una decisión de diseño. Podríamos mantener una `tabla` del mismo tamaño y agregar los `if`s de los casos bases dentro del doble bucle `for`, pero esto es más engorroso.

In [19]:
def subset_sum_bottomup(conjunto, n, suma):

    # la tabla de bottom-up tiene 1 fila y 1 columna extras para acomodar los casos base.
    tabla = np.repeat(None, (suma+1) * (len(conjunto) + 1)).reshape(len(conjunto) + 1, suma + 1)
    
    # P/ simplificar
    n = len(conjunto)
    
    # Relleno los casos base
    for j in range(1, suma+1):
        tabla[0, j] = False
    for i in range(0, n+1):
        tabla[i, 0] = True
             
    # Ahora si, obtengo las soluciones a todos los subproblemas
    for j in range(1, suma + 1):
        for i in range(1, n+1):
            if j < conjunto[i-1]:
                tabla[i, j] = tabla[i-1][j] # SUMA SE HIZO < 0. ME PASÉ DE TABLA.
            else:
                tabla[i, j] = (tabla[i-1][j] or tabla[i - 1][j-conjunto[i-1]])
                
    return tabla[n, suma]

Primero, comprobemos que el comportamiento visible sea idéntico al de las anteriores funciones:

In [20]:
conjunto = [3, 20, 1, 12, 5, 2]
suma = 8
subset_sum_bottomup(conjunto, len(conjunto), suma)

True

In [21]:
suma = 0
subset_sum_bottomup(conjunto, len(conjunto), suma)

True

In [22]:
suma = sum(conjunto)
subset_sum_bottomup(conjunto, len(conjunto), suma)

True

In [23]:
suma = sum(conjunto) + 1
subset_sum_bottomup(conjunto, len(conjunto), suma)

False

Ahora, para entender este algoritmo, vamos a tener que visualizar la tabla que convenientemente llamamos `tabla`.

Así se ve la tabla luego de la línea `4`. Los espacios vacíos representan el valor `None`. Ésta vez, los `None` no son necesarios, por el orden en el que el algoritmo bottom-up responde los subproblemas.

<img src="1_tabla.png" alt="mm" style="width: 1200px;"/>

Así se ve la tabla en la línea `16`, justo antes de que empiece a llenarla.

<img src="2_tabla.png" alt="mm" style="width: 1200px;"/>

Y esta es la tabla final, con la respuesta al problema original resaltada en amarillo

<img src="3_tabla.png" alt="mm" style="width: 1200px;"/>

----------

## 3.10 Pasos en la solución de un algoritmo de PD

Resumiremos ahora los pasos llevados a cabo para diseñar un algoritmo _bottom-up_ de PD para resolver el problema de _subset-sum_. 
Estos pasos son generalizables al diseño de algoritmos de PD.

0. Pensar un algoritmo _naive_ que resuelva el problema de manera exhaustiva. No es necesario pasarlo a papel.
1. Determinar que variables caracterizan a un subproblema, es decir, diferencian un subproblema de otro. Éstas aparecerán como argumentos de nuestra función.
2. Diagramar un árbol de subproblemas. Podemos saltar subproblemas intermedios, pero escribir el problema original, los primeros subproblemas y los últimos (casos base), para asegurarnos que los tenemos bien claros. En este punto decidiremos cuantos subproblemas contiene cada subproblema. En _subset-sum_ fueron 2. En el ejemplo inicial, fueron 3.
3. Escribir la recursión que explore este árbol de subproblemas, con sus casos base y su caso recursivo. A veces conviene pensar en los casos base primero. Esta función sólo debe retornar el valor óptimo.
4. Pasar esta recursiva a pseudocódigo. Esta función sólo debe retornar el valor óptimo.
5. Definir una estructura de datos para memoización y agregarla a la función recursiva para obtener nuestro algoritmo _top-down_. Esta función sólo debe retornar el valor óptimo.
6. Utilizar esta misma estructura de datos para el algoritmo _bottom-up_.
7. Construir, a partir de la estructura de datos, la solución óptima.

### Construcción de la solución óptima

El último paso lo dejaremos para las clases prácticas. Veremos que este puede llevarse a cabo de 3 maneras:
* modificando código de la solución original, 
* agregando una función extra que reutilice la estructura de datos para obtener la solución óptima a partir de los valores óptimos de los subproblemas,
* en algunas ocasiones, ambas aproximaciones deben llevarse a cabo para poder construir la solución óptima.

-------------------

## 3.11 Conclusión

* diferencia entre subproblemas disjuntos y subproblemas que contienen a otros subproblemas,
* **subestructura óptima**, **superposición de subproblemas**,
* pasos de PD: **recursiva**, **estructura de datos**, **top-down**, y **bottom-up**,
* advertencia respecto a leer de cualquier página de internet,
* recuerden leer el Cormen: **p(359-403)**,
* Responder cuestionario de campus.

--------------------

### Contenidos a explicar durante la práctica

1. construcción de la solución óptima
2. complejidades de algoritmos de _subset sum_: recursiva, _top down_ y _bottom up_
3. coeficiente binomial
4. conjunto de partes (_power set_)
5. problema binario de la mochila en PD
6. complejidad pseudopolinomial
7. impacto (constante) de las llamadas recursivas de los _top down_ en su tiempo de ejecución y ventajas de estos frente a los _bottom up_ cuando no es necesario calcular todos los subproblemas
8. optimizaciones espaciales sobre la estructura de datos