 # Heaps
 
* Un heap es un árbol binario cuasicompleto.
* Un min heap es un heap $T$ que cumple la propiead de min heap para cada nodo $T'$ de $T$ 
$$
\text{info}(T') < \min \left[ \text {info} \left( \text {izq} (T') \right), \text{info} \left( \text{der}(T’) \right) \right] 
$$
Por tanto el elemento más pequeño está en la raíz.

* Un *Heap* es una estructura recursiva: todo sub-árbol del *Heap* es a su vez un *Heap*.

* Hay dos principales primitivas dinámicas en min heaps:
    * `extract` extrae el elemento más pequeño del min heap, e.i., el de la raíz
    * `insert` inserta un nuevo elemento en el min heap
    
* Ambas permiten implementaciones eficientes si el min heap está almacenado en una lista.

## Heaps implementado con una lista

* Supongamos un heap con $n$ elementos amlacenando en una lista con indices $0, \ldots,  n-1$
* Los hijos izquierdo y derecho del nodo en el índice $i$ son $2 \cdot i+1$ y  $2 \cdot i+2$ respectivamente
* El padre del nodo en el indice i es $(i-1)//2$


**Ejemplo:**
<pre>    
            5                                 2
          /     \                           /     \
        10       15                        6        3
       /                                 /  \     /   \  
      30                              10     8   7     5
      
    [5, 10, 15, 30]                [2, 6, 3, 10, 8, 7, 5] 
    
 </pre>

## Procedimiento Heapify

* El procedimiento clave para procesar min heaps es la función `heapify()` que dado un nodo se asegura que el subárbol desde ese nodo es un min heap.

* **Importante** Para poder aplicar el procedimiento `heapify()` sobre la ráiz de un árbol, tanto el sub-árbol izquierdo como el derecho deben ser min Heaps. 

* El procedimiento *heapify()* cuando se aplica sobre un nodo $i$ compara su valor con el de sus hijos, se intercambia con el de menor valor y vuelve a aplicar el procedimiento *heapify()* hasta que se detiene, bien porqué tiene un valor menor que sus hijos o bien porqué llega a una hoja.  

             20                                4
          /     \                           /     \
        5        4           ==>          5        10
       / \      /  \                     /  \     /   \  
      9   6    10   15                 9     6   20    15
      
  

In [28]:
_left   = lambda i : 2*i+1
_right  = lambda i : 2*i+2
_parent = lambda i:  (i-1)//2  

def heapify (h, i):
    ''' Version 1'''
    
    exchange = True  
    
    while exchange:
        
        minimum = i
        l = _left(i)
        r = _right(i)
        
        # if there are childs, get the minimum 
        if l < len(h) and h[i] > h[l]:
            minimum = l
        if r < len(h) and h[r] < h[minimum]:
            minimum = r
        
        # exchange i with the minimum
        if  minimum != i:
            h[i], h[minimum] = h[minimum], h[i]
            i = minimum
            exchange = True
        else:
            exchange = False


# Driver programm
h = [20, 5, 4, 9, 6, 10, 15]

heapify (h, 0)
print(h)


[4, 5, 10, 9, 6, 20, 15]


In [29]:
def _heapify (h, i):
    ''' Version 2 (transparencias)'''
    while 2*i+1 < len(h):
        n_i = i
        
        if h[i] > h[2*i+1]:
            n_i = 2*i+1
        if 2*i+2 < len(h) and h[i] > h[2*i+2] and h[2*i+2] < h[n_i]:
            n_i = 2*i+2

        if n_i > i:
            h[i], h[n_i] = h[n_i], h[i]
            i = n_i
        else:
            return

# Driver programm
h = [50, 7, 10, 13, 14, 17]

_heapify (h, 0)
print(h)



[7, 13, 10, 50, 14, 17]


* El coste de heapify es claramente $O(\text{prof} (h)) = O(\log n) $

**Ejercicio:** Proporciona una versión recursiva de `heapfy()`

## Extraer la raíz de un min-Heap

* Para extraer la raíz:
    * Eliminamos el nodo raíz
    * Movemos el último nodo a la raíz
    * Aplicamos `heapify()` desde la nueva raíz

             4                                 5
          /     \                           /     \
        5        10           ==>          6       10
       / \      /  \                     /  \     /     
      9   6    20   15                 9     15  20
      
  

In [None]:
def minheap_extract(h:list):
    ''''Remove and return the root. Raise KeyError if empty.'''
    if len(h) == 0:
        raise IndexError('Empty heap')
    
    root = h[0]
    
    # swapp the root with the last node
    h[0] =  h[len(h)-1]
    
    h.pop()
    heapify (h, 0)
    
    return root

##### Drive programm

h = [4, 5, 10, 9, 6, 20, 15]
heapify(h, 0)
print(f'Heap: {h}')

print (minheap_extract(h))
print(f'Heap despues de extraer: {h}')



* El coste de la extracción claramente es $O(\log n)$

## Insertar un nuevo nodo en un min-Heap

In [31]:
def minheap_insert (h:list, k): 
    ''' version 1'''
    
    h.append (k)
    j = len(h) - 1   #ultima posicion de la lista 
    
    # procedimiento heapifyup
    while j > 0 and h[_parent(j)] > h[j]:
        h[_parent(j)], h[j] = h[j], h[_parent(j)]
        j = _parent(j)


def _minheap_insert(h:list, k):
    '''version 2 (transparencias)'''
    h += [k]
    j = len(h) - 1
    while j > 0 and h[(j-1) // 2] > h[j]:
        h[(j-1) // 2], h[j] = h[j], h[(j-1) // 2]
        j = (j-1) // 2     
        
        
# Drive programm
h = [50, 7, 10, 13, 14, 25]    #lista no es un heap
_heapify(h, 0)                  # Construyo el heap
print(f'Heap: {h}')

key = 1
_minheap_insert (h, key)       # inserto la llave en la lista     
print(f'Heap despues de insertar la llave {key}: {h}')

Heap: [7, 13, 10, 50, 14, 25]
Heap despues de insertar la llave 1: [1, 13, 7, 50, 14, 25, 10]


* El coste de la insercción claramente es $O(\log n)$

## Construyendo un Heap

* Si el contenedor del heap (i.e., la lista) estuviese vacío, podemos inseratr elementos *uno a uno* mediante llamadas sucesivas a la función `heap_insert()` 

In [32]:
h=[] #contenedor de los elementos del heap
minheap_insert (h, 10)
minheap_insert (h, 0)
minheap_insert (h, 7)
h

[0, 10, 7]

* Sin embaro, suponga que ya se dispone de la lista con los elementos y se desea *organizarlos* en un minHeap. Tenemos dos posibilidades. Ambas son *in-place*, i.e, no requieren de memoria adicional:
    * `minheap_build()` utiliza el procedimiento `heapify()`. Empezando desde el padre del último nodo de la lista invocamos iterativamente al procedimiento `heapify(h, i)` decrementando el índice del nodo $i$ en cada iteración.  
    * `_minheap_build()`utiliza un procedimiento equivalente a `minheap_insert()` empezando desde el nodo raíz e intercambiándose con su padre el *nodo va subiendo* por el heap hasta que o bien tiene un valor mayor que su padre o bien llega a la raíz del árbol.

In [1]:
def minheap_build (l:list) -> list:
    ''' utiliza heapify'''
    
    j = _parent(len(l)-1)  #índice del padre del ultimo nodo 

    while j >-1:
        _heapify (l, j)
        j -= 1
    return l

# Driver programm

l =  minheap_build ([10, 9, 7, 2, 4, 5, 8, 1])
print(f'Heap: {l}')

NameError: name '_parent' is not defined

             10                                1
          /     \                           /     \
        9        7           ==>           2       5
       / \      /  \                     /  \     /  \     
      2   4    5    8                   9    4   7    8
     /                                 /  
    1                                 10

In [34]:
def _minheap_build (l:list) ->list:
    ''' Utiliza heapifyup'''
    
    def heapifyup (h, j):
        while j > 0 and h[_parent(j)] > h[j]:
            h[_parent(j)], h[j] = h[j], h[_parent(j)]
            j = _parent(j)
    
    for i in range(len(l)):
        heapifyup (l, i)
    return l


##### Driver programm
l = _minheap_build ([10, 9, 7, 2, 4, 5, 8, 1])
print(f'Heap: {l}')   


Heap: [1, 2, 5, 4, 7, 9, 8, 10]


             10                                1
          /     \                           /     \
        9        7           ==>           2       5
       / \      /  \                     /  \     /  \     
      2   4    5    8                   4    7   9    8
     /                                 /  
    1                                 10

* Notad como los dos procedimientos para construir un min-heap **no** producen los mismos resultados.
 

# Colas de Prioridad (PQ)

* Son colas con las primitivas estándar `insert`, `remove`,.... pero donde:
    * Cada elemento tiene asociada una prioridad que determina su lugar en la PQ después de la inserción
    * Supondremos que los valores más pequeños tienen una prioridad más alta
    * `insert(x)` situa x *después* de los elementos en la PQ con menor prioridad y *antes* aquellos con mayor prioridad
        * **Cuidado:** *Antes* y *después* no deben *entenderse en el sentido de que los elementos deban estar ordenados dentro de la PQ*. Lo fundamental es asegurar que cada vez que se extraiga un elemento se extraiga el de mayor prioridad de los almacenados en la cola. 
    * `remove()` extrae el elemento de menor prioridad manteniendo la prioridad de los demás elementos

## PQ sobre Heaps

* Conceptualmente construimos un *min-heap* donde cada nodo (objeto) es un par: contiene su prioridad y un enlace a sus datos.
* Construimos un *min-heap* de acuerdo a las prioridades de los objetos
* Las primitivas de PQ invocan a las de *min-heap*
    * `insert()` realiza la insercción en el *min-Heap*
    * `remove()` elimina la raíz del *min-Heap*

In [35]:
pq_insert = minheap_insert
pq_remove = minheap_extract
pq_build = minheap_build

#Driver programm

x = (5, "write code")
y = (7, "release product")
z = (4, "create test")
w = (2, "write spec")


pq = pq_build([x[0], y[0], z[0]])
print(pq)

pq_insert (pq, w[0])               
print(pq)
               
pq_remove (pq)
print (pq)


[4, 7, 5]
[2, 4, 5, 7]
[4, 7, 5]


# Temas avanzados (**)

__(**) NO OBLIGATORIOS__  **Sólo** si tienes curiosidad y tiempo, recuerda que tienes otras asignaturas!!.

## Heap de objetos (Items)

*Referencia introduccción POO: *Introduction to Computation and Programming Using Python with Application to 
Computational Modeling and Understanding Data*, J. Guttag, Chapter 10 

* El problema con el planteamiento anterior es que *rompemos* los objetos al desligar la prioridad de los datos de su información. En realidad **no** tenemos un Heap de objetos sino un un *heap de prioridades de objetos*. Si extrayésemos una prioridad del minHeap tendríamos que buscar a que objeto corresponde esa prioridad.  

* Ahora queremos construir un *minHeap* en el que sus nodos sean *objetos (pares)* y no enteros. Para ello los objetos deben ser *objetos ordenables*, i.e, dados dos objetos cualesquiera deben poder compararse y decidir cual de ellos es menor. ¿Cómo podemos hacerlo? 
Una posibilidad es considerar a los objetos como pares con una *llave o clave* y un *valor* (llave, valor). 
Los objetos se compararán por el valor de su *llave*: dados dos objetos el menor será aquel cuya clave es menor. 
Es decir debemos *redefinir (sobrecargar)* el operador de comparación $<$.

   En Python podemos construir tales objetos definiendo una clase e incorporando el método mágico `__lt__()`. En este caso hemos definido la clase `Item` con dos variable privadas `__key` y `__value`. 
    
   En [pythontutor](https://pythontutor.com/render.html#code=_parent%20%3D%20lambda%20i%3A%20%20%28i-1%29//2%20%20%0A%0Adef%20_heapify%20%28h,%20i%29%3A%0A%20%20%20%20'''%20Version%202%20%28transparencias%29'''%0A%20%20%20%20while%202*i%2B1%20%3C%20len%28h%29%3A%0A%20%20%20%20%20%20%20%20n_i%20%3D%20i%0A%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20if%20h%5Bi%5D%20%3E%20h%5B2*i%2B1%5D%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20n_i%20%3D%202*i%2B1%0A%20%20%20%20%20%20%20%20if%202*i%2B2%20%3C%20len%28h%29%20and%20h%5Bi%5D%20%3E%20h%5B2*i%2B2%5D%20and%20h%5B2*i%2B2%5D%20%3C%20h%5Bn_i%5D%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20n_i%20%3D%202*i%2B2%0A%0A%20%20%20%20%20%20%20%20if%20n_i%20%3E%20i%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20h%5Bi%5D,%20h%5Bn_i%5D%20%3D%20h%5Bn_i%5D,%20h%5Bi%5D%0A%20%20%20%20%20%20%20%20%20%20%20%20i%20%3D%20n_i%0A%20%20%20%20%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20return%0A%0Adef%20minheap_build%20%28l%3Alist%29%20-%3E%20list%3A%0A%20%20%20%20'''%20utiliza%20heapify'''%0A%20%20%20%20%0A%20%20%20%20j%20%3D%20_parent%28len%28l%29-1%29%20%20%23%C3%ADndice%20del%20padre%20del%20ultimo%20nodo%20%0A%0A%20%20%20%20while%20j%20%3E-1%3A%0A%20%20%20%20%20%20%20%20_heapify%20%28l,%20j%29%0A%20%20%20%20%20%20%20%20j%20-%3D%201%0A%20%20%20%20%20%20%20%20%20%20%20%0A%0Aclass%20Item%3A%0A%20%20%20%20'''Lightweight%20composite%20to%20store%20heap%20items.'''%0A%20%20%20%20%20%20%20%20%0A%20%20%20%20def%20__init__%28self,%20key%3Aint,%20value%3Astr%29%3A%0A%20%20%20%20%20%20%20%20'''Inicializa%20un%20objeto%20como%20un%20par%20%28llave%3Aint,%20valor%3AString%29'''%0A%20%20%20%20%20%20%20%20self._key%20%3D%20key%0A%20%20%20%20%20%20%20%20self._value%20%3D%20value%0A%20%20%20%20%0A%20%20%20%20def%20__lt__%28self,other%29%3A%0A%20%20%20%20%20%20%20%20'''Los%20objetos%20se%20comparan%20por%20el%20valor%20de%20su%20llave'''%0A%20%20%20%20%20%20%20%20return%20self._key%20%3C%20other._key%0A%20%20%20%20%0A%20%20%20%20def%20__str__%28self%29%3A%0A%20%20%20%20%20%20%20%20'''Consideramos%20que%20el%20valor%20de%20los%20objetos%20son%20cadenas%20de%20caracteres'''%0A%20%20%20%20%20%20%20%20return%20f'%28%7Bself._key%7D,%20%7Bself._value%7D%29'%0A%20%20%20%20%0A%20%20%20%20def%20__repr__%28self%29%3A%0A%20%20%20%20%20%20%20%20'''...'''%0A%20%20%20%20%20%20%20%20return%20str%28self%29%0A%20%20%20%20%20%20%20%20%0A%23%23%23%20Driver%20Programm%0A%0Ax%20%3D%20Item%2814,'Eduardo'%29%0Ay%20%3D%20Item%2810,%20%22Carlos%22%29%0A%0A%23%20Como%20cualquier%20objeto%20de%20Python,%20los%20items%20los%20podemos%20guardar%20en%20un%20contenedor%0Al%20%3D%20%5Bx,%20y%5D%0A%0A%23%20Podemos%20construir%20un%20Heap%0Aminheap_build%20%28l%29&cumulative=false&curInstr=40&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) se ha incluído una ejecución simplificada del *programa driver*.

In [42]:
class Item:
    '''Lightweight composite to store heap items.'''
        
    def __init__(self, key:int, value:str):
        '''Inicializa un objeto como un par (llave:int, valor:String)'''
        self._key = key
        self._value = value
    
    def __lt__(self,other):
        '''Los objetos se comparan por el valor de su llave'''
        return self._key < other._key
    
    def __str__(self):
        '''Consideramos que el valor de los objetos son cadenas de caracteres'''
        return f'({self._key}, {self._value})'
    
    def __repr__(self):
        '''...'''
        return str(self)

    
### Driver Programm

x = Item(5, "write code")
y = Item(7, "release product")
z = Item(4, "create test")
w = Item(2, "write spec")


# Los items son objetos ordenables. La comparación se hace a través de las claves 
print(f'x: {x}, y:{y}')
print(f'¿Es x < y?  {x<y}') 


# Podemos construir un Heap con los items
l = minheap_build ([x, y,  z, w])
print(f'Despues de construir el min Heap: {l}')

minheap_extract(l)
print(f'Despues de extraer: {l}')


x: (5, write code), y:(7, release product)
¿Es x < y?  True
Despues de construir el min Heap: [(2, write spec), (5, write code), (4, create test), (7, release product)]
Despues de extraer: [(4, create test), (5, write code), (7, release product)]


* Podemos construir la cola de prioridad exactamente igual que antes enlazando las funciones de la cola de prioridad con las del Heap

In [37]:
pq_insert = minheap_insert
pq_remove = minheap_extract
pq_build = minheap_build

pq = pq_build([x, y, z])
print(pq)

pq_insert (pq, w)               
print(pq)
               
pq_remove (pq)
print (pq)

[(5, Simone), (10, Carlos), (14, Eduardo)]
[(1, Jose), (5, Simone), (14, Eduardo), (10, Carlos)]
[(5, Simone), (10, Carlos), (14, Eduardo)]


## Cola de prioridad como una clase (**)

Referencia: *Data Structures and Algorithms in Python*, M. Goodrich et. al.  


* Un planteamiento muy habitual es definir una clase para la cola de prioridad en la que el Heap es la estructura de datos que utilizamos para guardar los elementos de la PQ.

In [38]:
class PriorityQueue:
    '''......'''
    def __init__(self, *tupla:Item):
        # Estructura de datos para implementar la PQ 
        self._h = list(tupla)
        
        self._size = len(self._h)
        
        minheap_build (self._h)
            
    def extract(self):
        return minheap_extract(self._h)
    
    def insert(self, obj):
        return minheap_insert (self._h, obj)
    
    def __len__(self):
        return self._size
    
    def __str__(self):
        return str(self._h)
    
    def __iter__(self):
        return iter(self._h)
        
              
x, y, z = Item(5,"write code"), Item(7,"release product"), Item(2, 'write spec')      

pq = PriorityQueue(x, y)    
print(pq)

pq.extract()
print(pq)

pq.insert(Item(4, "create test"))
print(pq)

print(len(pq))

for i in pq:
    print(i)

[(5, write code), (7, release product)]
[(7, release product)]
[(4, create test), (7, release product)]
2
(4, create test)
(7, release product)


* Si has investigado por la web, te habrás dado cuenta que el módulo `heapq` implementa *Heaps*. Podemos cambiar nuestra implementación de PQ para que utilice las funciones de este módulo.

In [39]:
import heapq as hp

x, y, z = Item(5,"write code"), Item(7,"release product"), Item(2, 'write spec')   

# Prueba de las funciones de heapq
h = []
hp.heappush(h, x)
hp.heappush(h, y)
hp.heappush(h, z)
print(h)

[(2, write spec), (7, release product), (5, write code)]


In [40]:
class PriorityQueueHeapq:
    '''......'''
    def __init__(self, *lista:Item):
        self._h = []
        self._size = len(lista)
        
        # inserta los objetos en la lista
        for obj in lista:
            hp.heappush (self._h, obj)
            
    def extract(self):
        return hp.heappop(self._h)
    
    def insert(self, obj):
        return hp.heappush (self._h, obj)
    
    def __len__(self):
        return self._size
    
    def __str__(self):
        return str(self._h)
    
    def __iter__(self):
        return iter(self._h)
        
# Driver programm              
            
pq = PriorityQueueHeapq(x, y)    
print(pq)

pq.extract()
print(pq)

pq.insert(z)
print(pq)

print(len(pq))

for i in pq:
    print(i)

[(5, write code), (7, release product)]
[(7, release product)]
[(2, write spec), (7, release product)]
2
(2, write spec)
(7, release product)
