 # Heaps
 
* Un heap es un árbol binario cuasicompleto.
* Un min heap es un heap $T$ que cumple la propiead de min heap para cada nodo $T'$ de $T$ 
$$
\text{info}(T') < \min \left[ \text {info} \left( \text {izq} (T') \right), \text{info} \left( \text{der}(T’) \right) \right] 
$$
Por tanto el elemento más pequeño está en la raíz.

* Un *Heap* es una estructura recursiva: todo sub-árbol del *Heap* es a su vez un *Heap*.

* Hay dos principales primitivas dinámicas en min heaps:
    * `extract` extrae el elemento más pequeño del min heap, i.e., el de la raíz
    * `insert` inserta un nuevo elemento en el min heap
    
* Ambas permiten implementaciones eficientes si el min heap está almacenado en una lista de Python.

## Heaps implementado con una lista

* Supongamos un heap con $n$ elementos amlacenando en una lista con indices $0, \ldots,  n-1$
* Los hijos izquierdo y derecho del nodo en el índice $i$ son los nodos de índices $(2 \cdot i+1)$ y  $(2 \cdot i+2)$ respectivamente
* El padre del nodo en el indice i es $(i-1)//2$

**Ejemplo:**
<pre>    
            5                                 2
          /     \                           /     \
        10       15                        6        3
       /                                 /  \     /   \  
      30                              10     8   7     5
      
    [5, 10, 15, 30]                [2, 6, 3, 10, 8, 7, 5] 
    
 </pre>

**Ejemplo:**
<pre>    
              12                                
          /         \                          
        20          29                       
       /   \        /   \                      
      34    38      44   32     
    /   \   /  \
  46    52  73  65

    [12, 20, 29, 34, 38, 44, 32, 46, 52, 73, 65]    
    
 </pre>

## Procedimiento Heapify (Min Heaps)

* El procedimiento clave para procesar min heaps es la función `heapify()` que dado un nodo se asegura que el subárbol desde ese nodo es un min heap.

* **Importante** Para poder aplicar el procedimiento `heapify()` sobre la ráiz de un árbol, tanto el sub-árbol izquierdo como el derecho deben ser min Heaps. 

* El procedimiento `heapify()` cuando se aplica sobre un nodo $i$ compara su valor con el de sus hijos, se intercambia con el de menor valor y vuelve a aplicar el procedimiento `heapify()` hasta que se detiene, bien porqué tiene un valor menor que sus hijos o bien porqué llega a una hoja.

<html>
  <pre>
             20                               <span style="color:red">4</span> 
          /     \                           /     \
        5        4           ==>          5         <span style="color:red">10</span> 
       / \      /  \                     /  \     /   \  
      9   6    10   15                 9     6  <span style="color:red">20</span>     15
  </pre>
</html>

In [2]:
def _left(i: int) -> int:
    '''left child index'''
    return 2*i+1

def _right(i: int) -> int:
    '''right child index'''
    return 2*i+2

def _parent(i: int) -> int:
    '''parent index'''
    return (i-1)//2  


def heapify (h, i):
    ''' Versión 1'''
    
    exchange = True  
    
    while exchange:
        
        minimum = i
        l = _left(i)
        r = _right(i)
        
        # if there are childs, get the minimum 
        if l < len(h) and h[i] > h[l]:
            minimum = l
        if r < len(h) and h[r] < h[minimum]:
            minimum = r
        
        # exchange i with the minimum
        if  minimum != i:
            h[i], h[minimum] = h[minimum], h[i]
            i = minimum
        else:
            exchange = False


# Driver programm
h = [20, 5, 4, 9, 6, 10, 15]

heapify (h, 0)
print(h)

[4, 5, 10, 9, 6, 20, 15]


In [3]:
def _heapify (h, i):
    ''' Versión 2 (transparencias)'''
    while 2*i+1 < len(h):
        n_i = i
        
        if h[i] > h[2*i+1]:
            n_i = 2*i+1
        if 2*i+2 < len(h) and h[i] > h[2*i+2] and h[2*i+2] < h[n_i]:
            n_i = 2*i+2

        if n_i > i:
            h[i], h[n_i] = h[n_i], h[i]
            i = n_i
        else:
            return

# Driver programm
h = [50, 7, 10, 13, 14, 17]

_heapify (h, 0)
print(h)

[7, 13, 10, 50, 14, 17]


* El coste de heapify es claramente $O(\text{prof} (h)) = O(\log n) $

  **Ejercicios Adicionales:** \
    1) Proporciona una versión recursiva de `heapify()` para min heaps \
    2) Proporciona una versión de `heapify()` para max heaps \
    3) Proporciona una versión recursiva de `heapify()` para max heaps 

## Insertar un nuevo nodo en un min-Heap


In [10]:
def minheap_insert (h:list, k): 
    ''' Versión 1'''
    
    h.append(k)
    j = len(h) - 1   #ultima posicion de la lista 
    
    # procedimiento heapifyup
    while j > 0 and h[_parent(j)] > h[j]:
        h[_parent(j)], h[j] = h[j], h[_parent(j)]
        j = _parent(j)


def _minheap_insert(h:list, k):
    '''Versión 2 (transparencias)'''
    h += [k]                              # concateno dos listas
    j = len(h) - 1                        # ultima posición de la lista
    while j > 0 and h[(j-1) // 2] > h[j]:
        h[(j-1) // 2], h[j] = h[j], h[(j-1) // 2]
        j = (j-1) // 2     
        
        
# Driver programm
h = [50, 7, 10, 13, 14, 25]               # lista no es un heap
_heapify(h, 0)                            # Construyo el heap
print(f'Heap inicial: {h}')

key = 1
minheap_insert (h, key)                  # inserto key en la lista     
print(f'Heap despues de insertar {key}: {h}')

Heap inicial: [7, 13, 10, 50, 14, 25]
Heap despues de insertar 1: [1, 13, 7, 50, 14, 25, 10]


## Construyendo un Heap

* Si el contenedor del heap (i.e., la lista) estuviese vacío, podemos insertar elementos *uno a uno* mediante llamadas sucesivas a la función `minheap_insert()`. En el siguiente ejemplo se construye un heap insertando sucesivamente los elementos, $10, 0, 7$ 

In [5]:
h=[]                      # contenedor de los elementos del heap
minheap_insert(h, 10)    # Se inserte el elemento 10 
minheap_insert(h, 0)
minheap_insert(h, 7)
h

[0, 10, 7]

* Sin embargo, suponga que ya se dispone de la lista con los elementos y se desea *organizarlos* en un minHeap. *A priori* tenemos dos posibilidades. Ambas son **_in-place_**, i.e, **no requieren memoria adicional**:
    * `minheap_build()` utiliza iterativamente el procedimiento `heapify()`. Empieza desde el padre del último nodo de la lista y se invoca iterativamente el procedimiento `heapify(h, i)` decrementando el índice del nodo $i$ en cada iteración.  
    * `_minheap_build()`utiliza un procedimiento equivalente a `minheap_insert()`. Empezando desde el nodo raíz e intercambiándose con su padre, el *nodo va subiendo* por el heap hasta que o bien tiene un valor mayor que su padre o bien llega a la raíz del árbol.

In [12]:
def minheap_build (l:list):
    ''' utiliza heapify'''
    
    j = _parent(len(l)-1)  #índice del padre del ultimo nodo 

    while j >-1:
        _heapify (l, j)
        j -= 1
   
# Driver programm

l = [10, 9, 7, 2, 4, 5, 8, 1]
print(f'Tabla inicial: {l}')
minheap_build (l)
print(f'Heap: {l}')

Tabla inicial: [10, 9, 7, 2, 4, 5, 8, 1]
Heap: [1, 2, 5, 9, 4, 7, 8, 10]


In [15]:
def _minheap_build(l:list):
    ''' Utiliza heapifyup 
        Este procedimiento NO debe usarse
    '''
    
    def heapifyup(h, j):
        while j > 0 and h[_parent(j)] > h[j]:
            h[_parent(j)], h[j] = h[j], h[_parent(j)]
            j = _parent(j)
    
    for i in range(len(l)):
        heapifyup (l, i)
        

##### Driver programm
l = [10, 9, 7, 2, 4, 5, 8, 1]
print(f'Tabla inicial: {l}')
_minheap_build (l)
print(f'Heap: {l}') 

Tabla inicial: [10, 9, 7, 2, 4, 5, 8, 1]


Heap: [1, 2, 5, 4, 7, 9, 8, 10]


* Notad como los dos procedimientos para construir un min-heap **no** producen los mismos resultados.
* ¿Cúal es el coste de los dos procedimientos? Ambos procedimientos requieren $O(\log n)$ para *recolocar* cada uno nodo en su posición final. Al haber $n$ nodos, $O(n \log n)$. Sin embargo hay una **gran diferencia** entre ambos procedimientos. En `minheap_build` la mayoría de los nodos que tienen que ejecutar el procedimiento `heapifyDown`están situados lejos de la raíz. Por tanto, el número de veces que se ejecuta la recurrencia hasta recolocar el nodo en el Heap es bajo, recuerda que el nodo *desciende por el árbol*. Sin embargo en `_minheap_ build` los nodos se insertan *por el fondo* y tienen que recolocarse  con el procedimiento `heapifyUp` *ascendiendo desde abajo*. La mayoría de los nodos que se insertan están lejos de la ráiz y, en consecuencia, hay que ejecutar muchas veces la recurrencia del procedimiento.

    Por ejemplo, suponga el **peor caso**: crear un min-Heap *in-place* a partir de una lista decreciente, i.e.,  ordenada de mayor a menor. Si el número de elementos de la lista es $n =2^4- 1 = 15$, el árbol binario completo tendrá 4 niveles. En el procedimiento `minheap_build`se ejecutarían 11 movimientos de nodos mientras que en `_minheap_ build` serían 40.
 
     Es decir, que aunque ambos procedimientos *parecen* tener el mismo coste $O(n \log n)$ este **no** es un límite ajustado para minheap_build  _(no tight)_. De hecho, cuando se consideran las diferentes alturas de los nodos, es fácil, demostrar que  el coste de `minheap_build` es $O(n)$ (Cormen et al.). Por tanto, debe **usarse solo** este procedimiento para construir el Heap.