<a href="https://colab.research.google.com/github/RodolfoFigueroa/madi2022-1/blob/main/1_Algoritmos_voraces.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En esta sesión veremos varios ejemplos de algoritmos tipo greedy, algunos serán correctos y otros no, con tal de ir ejercitando la habilidad para poder determinar cuándo un algoritmo de este tipo es correcto o no.

**Ejemplo 1.** Consideremos monedas con valores $1, 2, 5, 10$. Dado un entero positivo $n$, ¿cómo podemos encontrar el menor número de monedas con el que podemos sumar $n$?

Un algoritmo greedy sería en cada momento, considerar el mayor valor que es menor o igual a $n$, y usar esa moneda, continuando con este proceso con el valor que resulta de restarle a $n$ el valor de la moneda usada.

Veamos una implementación de esto:

In [None]:
coins = [1,2,5,10]

def min_coins(n):
  max_idx = len(coins) - 1
  cnt = 0
  while(n > 0):
    if(coins[max_idx] <= n):
      cnt += n//coins[max_idx]
    n = n% coins[max_idx]
    max_idx -= 1
  return cnt

print(min_coins(100))
print(min_coins(27))
print(min_coins(75))

10
4
8


Parece que nuestro algoritmo es correcto, ¿cómo demostrar que en efecto lo es? Muchas veces podemos proceder por contradicción o por inducción para demostrar la correctitud de una algoritmo greedy.

Procederemos por inducción. Como caso base consideramos todos los enteros del 1 al 10, para los cuales es fácil ver que nuestro algoritmo sí nos da el menor número de monedas posible. Nuestra hipótesis de inducción será que el algoritmo cumple con darnos la menor cantidad de monedas posible para todo $k \leq n$. Veamos que la afirmación es cierta para $n+1$. Como ya vimos que es cierto para todo entero positivo menor o igual a $10$, podemos suponer que $11 \leq n+1$. 
Veamos que necesitamos usar al menos una moneda de $10$.

Si no usamos monedas de $10$, notemos que no podemos:
-   Usar dos monedas de $5$.
-   Usar dos monedas de $1$.
-   Usar tres monedas de $2$.

Con todo esto, tenemos que el mayor valor que podemos alcanzar es $1 \cdot 1 + 2 \cdot 2 + 1 \cdot 5 = 10$, por lo que para un valor mayor o igual que $11$, necesitamos al menos una moneda de $10$. Entonces, usamos la moneda de $10$, y llegamos a que el algoritmo sí nos da el menor número de monedas posible para $n+1$, pues nos lo da para $n+1 - 10$.

Con esto hemos probado que el algoritmo greedy para esta distribución de monedas nos dice el menor número de monedas posible, ¿será cierto para cualquier destribución de monedas?

Como es de esperarse, no. Hay diferentes cosas que pueden suceder para que el algoritmo no nos dé el menor número de monedas necesario.
*   Puede suceder que exista $n$ tal que no se pueda formar con las monedas disponibles. Por ejemplo, si $\{3, 7\}$ son las posibles denominaciones de las monedas, no se puede formar el número $11$.
*   También puede suceder que sí exista forma de llegar al número deseado, pero que nuestro algoritmo no nos diga correctamente el menor número de monedas necesarias, un ejemplo de esto es tener monedas con denominaciones $\{1, 4, 7, 8, 10\}$ y queremos formar el número $15$, siguiendo el algoritmo greedy se seleccionarán una moneda de $10$, otra de $4$ y otra de $1$, sin embargo, es posible usar menos monedas, seleccionando una de $8$ y otra de $7$.

¿Se puede dar un algoritmo que siempre funcione independientemente de las denominaciones de las monedas? En efecto se puede, usando programación dinámica es posible garantizar encontrar la respuesta independientemente de las denominaciones (¿cómo hacemos esto?). Esto ilustra algo que es también bastante usual: si un algoritmo greedy no funciona, se puede encontrar una forma de resolver el problema usando programación dinámica, esto no es una regla pero suele ser bastante común.


**Ejemplo 2.** Dada una lista $L$ de $n$ números reales, encontrar una permutación de la lista tal que la suma $$\sum_{i = 0}^{n-1}L[i]*i$$ tenga el mayor valor posible.

¿Cuál sería un algoritmo greedy para resolver este problema? Una de las primeras ideas que podemos considerar es justamente ordenar los elementos de $L$ de menor a mayor, pues de este modo, los elementos más grandes tendrán mayor peso. Veamos que su implementación es bastante inmediata:

In [None]:
L = [-1, 5, -4, 0, 9]

L.sort()
print(L)

[-4, -1, 0, 5, 9]


¿Es correcto nuestro algoritmo? Sí, para esto basta con recordar la desigualdad de reacomodo (https://en.wikipedia.org/wiki/Rearrangement_inequality) que nos garantiza que en efecto esta es la permutación que estamos buscando.

Algo que podemos destacar de los algoritmos anteriores, es que su mayor dificultad consiste en probar su correctitud, pues su implementación resulta bastante sencilla, este suele ser el caso con los algoritmos de este tipo.

**Ejemplo 3.** Se tienen $n$ cajas, cada una con cierta cantidad de dinero, y con un temporizador tal que una vez que se llegue al tiempo marcado por el temporizador, después de un minuto el dinero de la caja se empieza a quemar y no se puede recuperar nada de lo que había en esa caja. Se sabe que todos los temporizadores tienen un tiempo menor a una hora, y están dados en minutos (sin fracciones de minuto). Sabiendo el tiempo que marcan los temporizadores, y que sacar el dinero de una caja toma un minuto exactamente, determina un algoritmo que permita saber la mayor cantidad de dinero que se puede recuperar.

Un primer algoritmo greedy para resolver el problema podría ser ordenar las cajas de mayor a menor valor, e ir seleccionando las de mayor valor primero, descartando únicamente aquellas que ya no sea posible agarrar por la restricción de tiempo. ¿Es este algoritmo correcto?


Una forma de verificar la correctitud de algoritmos de este estilo es pensar en casos de prueba 'extremos'. ¿Qué pasa si se tienen cajas con valores $10, 1, 1$, con tiempos $20, 0, 0$? Nuestro algoritmo nos garantizaría tener únicamente el dinero de la caja con valor $10$, sin embargo, es posible sumar $11$.

¿Cómo arreglamos el algoritmo? Notemos que podemos 'postergar' las cajas que se queman más tarde. ¿Qué pasa si pensamos el problema al revés? Es decir, trataremos de ir seleccionando cajas, de la última que va a agarrar hasta la primera. Nos apoyaremos en una cola de prioridad PQ. Iteramos sobre los minutos (de mayor a menor), para cada minuto $t$, agregamos a PQ el valor de aquellas cajas que se queman en el tiempo $t$, y sumamos el mayor valor dentro de PQ. ¿Esto sí nos garantiza tener el mayor valor posible? Sí, y esto lo podemos probar por contradicción, suponiendo que la última caja que se toma no es la de mayor valor posible en ese momento en la cola de prioridad.

Veamos una implementación del algoritmo mencionado.

In [None]:
# 4 4
# 1000 1
# 2000 2
# 500 2
# 1200 0

from queue import PriorityQueue

Boxes = [(1,1000), (2,2000), (2,500), (0, 1200)] #(b,a) indica que el valor de la caja es a, y se empieza a quemar en el minuto b
Boxes.sort(reverse = True)
T = Boxes[0][0]

pq = PriorityQueue()
val = 0
idx = 0
for i in range(T,-1,-1):
  while(idx < len(Boxes) and Boxes[idx][0] == i):
      pq.put(-Boxes[idx][1])
      idx += 1
  if(not pq.empty()):
    val -= pq.get()
print(val)

4200


**Ejemplo 4.** Antes habíamos visto ejemplos relacionados con gráficas de intervalos, donde lo que nos importaba era considerar las intersecciones de los intervalos por parejas. Consideremos ahora el siguiente problema: dado un conjunto de intervalos $[a_1, b_1], [a_2, b_2], \dots, [a_n,b_n]$, encuentra un subconjunto de intervalos tal que cualesquiera dos no se intersecten, y que el subconjunto tenga la mayor cantidad de elementos posible.

Un posible algoritmo sería considerar ordenar los intervalos según su longitud, de menor a mayor, e ir considerando los itnervalos, checando que no se vayan intersectando. ¿Es este algoritmo correcto? Consideremos el siguiente ejemplo: $[0,10], [12,20], [9,14]$. Siguiendo el algoritmo propuesto, se tendría que al ordenar los intervalos por longitud se tienen $[9,14], [12,20], [0,10]$, entonces se metería $[9,14]$ al subconjunto, sin embargo ya no se podrían meter más conjuntos. Notemos que este subconjunto no tiene la mayor cantidad posible, pues $[12,20], [0,10]$ tiene dos elementos que no se intersectan.

¿Qué pasa si ordenamos los intervalos según su extremo derecho? Ordenamos de menor a mayor, según el extremo derecho de los intervalos. Vamos iterando sobre la lista, y si nos encontramos con un intervalo tal que no se intersecta con los anteriores del subconjunto lo agregamos. ¿Este algoritmo funciona? Notemos que en el ejemplo previo sí obtenemos un subconjunto con la mayor cantidad de elementos posible. Probemos primero la correctitud de este algoritmo.

Supongamos que el algoritmo anterior no nos da un acomodo óptimo. Sean $I = \{i_1, i_2, \dots, i_m\}$, $J = \{j_1, j_2, \dots, j_k\}$ los acomodos que nos dan el algoritmo voraz y el acomodo óptimo, respectivamente (entonces $k > m$). Podemos suponer, sin pérdida de generalidad que si $x < y$ entonces el extremo derecho de $j_x$ es menor que el de $j_y$, y lo mismo con $i_x, i_y$. Sea $t$ el primer índice tal que $i_t \neq j_t$. Dado que $i_1 = j_1, i_2 = j_2, \dots, i_{t-1} = j_{t-1}$, se tiene que el extremo derecho de $j_t$ es mayor que el de $i_t$ (por cómo construimos $I$), por lo que en $J$ podemos cambiar a $j_t$ por $i_t$. Continuando con este proceso llegamos a que podemos suponer que $I \subset J$, de donde se concluye que $I$ debe ser igual a $J$, por cómo se construye $I$. 

Veamos que como nuestro algoritmo involucra un ordenamiento, se tiene una complejidad en tiempo de al menos $O(n \; logn)$. La siguiente implementación cumple con esta complejidad:


In [None]:
L = [(7, 15), (1,8), (1, 4), (5, 8), (9, 10), (3, 7), (6,8)]

L.sort(key=lambda x: x[1]) # Ordena los elementos según su segunda entrada

ans = [L[0]]
for i in range(1, len(L)):
  if(L[i][0] > ans[-1][1]): # Si el extremo izquierdo es mayor que el derecho del último
    ans.append(L[i])
print(ans)

[(1, 4), (5, 8), (9, 10)]


**Ejercicios.**


1.   Determina si el algoritmo descrito en el ejercicio 1 (el de las monedas) funciona si tenemos monedas con denominaciones potencias de $3$, es decir, si $\{3^n | n \in \mathbb{N}_{0}\}$ es el conjunto de denominaciones de las monedas. Desmuestra su correctitud e implementa el respectivo código en caso afirmativo o da un contraejemplo en caso negativo.
2.   Dadas dos listas con $n$ enteros cada una, $L_1, L_2$ una operación permitida es seleccionar un elemento de $L_2$ y sumarle o restarle $1$. Describe un algoritmo que permita encontrar el menor número de operaciones permitidas para que $L_1$ y $L_2$ tengan los mismos números (no necesariamente en el mismo orden), prueba su correctitud e implementa el algoritmo.



*Ejercicio 1.* Aquí va tu demostración o tu contraejemplo, según sea el caso.

In [None]:
# Aquí va el código del algoritmo, en caso de haber obtenido una respuesta afirmativa

*Ejercicio 2.* Aquí va la descripción y prueba de correctitud de tu algoritmo.

In [None]:
# Aquí va la implementación del algoritmo descrito en la celda anterior