 # Heaps
 
* Un heap es un árbol binario cuasicompleto.
* Un min heap es un heap $T$ que cumple la propiead de min heap para todo nodo $T'$ de $T$ 
$$
\text{info}(T') < \min \left[ \text {info} \left( \text {izq} (T') \right), \text{info} \left( \text{der}(T’) \right) \right] 
$$
Por tanto el elemento más pequeño está en la raíz.

* Un *Heap* es una estructura recursiva: todo sub-árbol del *Heap* es a su vez un *Heap*.

* Hay dos principales primitivas dinámicas en min heaps:
    * `extract` extrae el elemento más pequeño del min heap, i.e., el de la raíz
    * `insert` inserta un nuevo elemento en el min heap
    
* Ambas permiten implementaciones eficientes si el min heap está almacenado en una lista de Python.

# Heaps implementado con una lista como Estructura de Datos

* Supongamos un heap con $n$ elementos amlacenando en una lista con indices $0, \ldots,  n-1$
* Los hijos izquierdo y derecho del nodo en el índice $i$ son los nodos de índices $(2 \cdot i+1)$ y  $(2 \cdot i+2)$ respectivamente
* El padre del nodo en el indice i es $(i-1)//2$


**Ejemplo:**
<pre>    
            5                                 2
          /     \                           /     \
        10       15                        6        3
       /                                 /  \     /   \  
      30                              10     8   7     5
      
    [5, 10, 15, 30]                [2, 6, 3, 10, 8, 7, 5] 
    
 </pre>
        

**Ejercicio**

¿Que ventajas tiene utilizar como Estructura de datos para implementar un Heap una lista (array) y no una lista enlazada de nodos como utilizaste el año pasado para implementar un árbol binario?

# Procedimiento heapify_down()

* El procedimiento clave para procesar min heaps es la función `heapify_down()` que, aplicada sobre un nodo, garantiza que el subárbol con raíz en ese nodo cumpla la propiedad de min heap.

* **Importante** Para poder aplicar el procedimiento `heapify_down()` sobre un determinado nodo, tanto su sub-árbol izquierdo como el derecho deben ser Heaps. 

* El procedimiento `heapify_down()` cuando se aplica sobre un nodo $i$ compara su valor con el de sus hijos, se intercambia con el de menor valor y vuelve a aplicar el procedimiento `heapify()` sobre el nodo intercambiado hasta que se detiene, bien porqué ya tiene un valor menor que sus hijos o bien porqué el nodo es un nodo hoja.  

             20                                4
          /     \                           /     \
        5        4           ==>          5        10
       / \      /  \                     /  \     /   \  
      9   6    10   15                 9     6   20    15
      
  

In [23]:
from typing import List, Any

def _left(i: int) -> int:
    ''' Devuelve el indice del hijo izquierdo del nodo i'''
    return 2*i+1

def _right(i: int) -> int:
    ''' Devuelve el índice del hijo derecho del nodo i '''
    return 2*i+2

def _parent(i: int) -> int:
    ''' Devuelve el indice del padre del nodo i '''
    return (i-1)//2  

def heapify_down(h: List, i: int) -> None:
    ''' Restaura la propiedad de min-heap desde el índice i hacia abajo. 
    Version iterativa 1'''
    
    exchange = True      
    while exchange:
        minimum = i
        l = _left(i)
        r = _right(i)
        
        # if there are childs, get the minimum 
        if l < len(h) and h[i] > h[l]:
            minimum = l
        if r < len(h) and h[r] < h[minimum]:
            minimum = r
        
        # exchange the node i with the minimum node
        if  minimum != i:
            h[i], h[minimum] = h[minimum], h[i]
            i = minimum
            exchange = True
        else:
            exchange = False

In [8]:
# Driver program
# H no es heap, pero el sub-árbol izquierdo y el derecho del nodo raiz son Heaps
h = [20, 5, 4, 9, 6, 10, 15]

heapify_down(h, 0)
print(h)

[4, 5, 10, 9, 6, 20, 15]


In [16]:
def heapify_down(h: List, i: int) -> None:
    ''' Version iterativa 2 (transparencias)'''
    while 2*i+1 < len(h):
        n_i = i
        
        if h[i] > h[2*i+1]:
            n_i = 2*i+1
        if 2*i+2 < len(h) and h[i] > h[2*i+2] and h[2*i+2] < h[n_i]:
            n_i = 2*i+2

        if n_i > i:
            h[i], h[n_i] = h[n_i], h[i]
            i = n_i
        else:
            return

# Driver programm
h = [50, 7, 10, 13, 14, 17]

heapify_down(h, 0)
print(h)

[7, 13, 10, 50, 14, 17]


**Ejercicio**

Muestra que el coste del procedimiento  `heapify_down()`es claramente $O(\text{prof} (h)) = O(\log n) $

**Solución**

1. **Coste de las operaciones dentro del bucle**  
   - En cada iteración se calculan los índices `left` y `right` con multiplicaciones y sumas: coste **O(1)**.  
   - Se realizan comparaciones entre enteros (`heap[left] < heap[smallest]`, etc.): cada una es coste **O(1)**.  
   - La asignación de `minimum` es coste **O(1)**.  
   - En caso de ser necesario, el intercambio de dos elementos del array también es coste **O(1)**.  

   Por lo tanto, **cada iteración del bucle tiene coste constante O(1)**.

2. **Número de iteraciones del bucle**  
   - El bucle `while` avanza desde el nodo `i` hacia abajo en el heap, siguiendo siempre el hijo más pequeño.  
   - En el peor caso, el nodo se desplaza desde la raíz hasta una hoja.  
   - La altura máxima de un heap binario de tamaño `n` es:  

   $$
     h = \lfloor \ln (n) \rfloor
   $$

   - Por tanto, el número máximo de iteraciones es $O(\ln n)$$.

3. **Coste total del procedimiento**  
   - Cada iteración cuesta **O(1)**.  
   - El bucle se ejecuta como máximo **O(log n)** veces.  

   Así, el coste total es:

   $$
   T(n) = O(1) \cdot O(\ln n) = O(\ln n)
   $$

**Conclusión**:  
El procedimiento `Heapify_down()` en un min-heap tiene coste $O(\ln n)$ en el peor caso, porque en cada nivel del heap solo se hacen un número constante de operaciones, y como máximo se recorre la altura del heap.


  **Ejercicio:** Proporciona una versión recursiva de `heapfy()`

# Extraer la raíz de un min-Heap

* Para extraer la raíz:
    * Guardamos la ráiz del Heap
    * Substituir el nodo raíz por el último elemento del Heap
    * Eliminar el último elemento del heap
    * Aplicamos el procedimiento `heapify_down()` desde la nueva raíz

             4                                 5
          /     \                           /     \
        5        10           ==>          6       10
       / \      /  \                     /  \     /     
      9   6    20   15                 9     15  20
      
  

In [25]:
from typing import List, Any

def minheap_extract(h: List) -> Any:
    ''''Remove and return the root. Raise KeyError if empty.'''

    n = len(h)
    if n == 0:
        raise IndexError('Empty heap')
    
    min_value = h[0]
    
    # copy the last node on the root
    h[0] =  h[n - 1]
    
    h.pop()
    heapify_down(h, 0)
    
    return min_value

In [None]:
##### Drive program

h = [4, 5, 10, 9, 6, 20, 15]
heapify(h, 0)
print(f'Heap: {h}')

print (minheap_extract(h))
print(f'Heap despues de extraer: {h}')

Heap: [4, 5, 10, 9, 6, 20, 15]
4
Heap despues de extraer: [5, 6, 10, 9, 15, 20]


* El coste de la extracción claramente es $O(\log n)$

# Insertar un nuevo elemento en un min-Heap

Supongamos que disponemos de un Heap y se desea insertar un nuevo elemento. El procedimiento sería el siguiente: 

In [40]:
def minheap_insert(h: List, k: Any) -> None: 
    ''' Procedimiento para insertar un elemento en un min Heap '''
    h.append(k)
    j = len(h) - 1   # ultima posicion de la lista 
    
    while j > 0 and h[j] < h[_parent(j)]:
        h[j], h[_parent(j)] =  h[_parent(j)], h[j]
        j = _parent(j)

In [88]:
# Drive program

h = [50, 7, 10, 13, 14, 25]    # lista no es un heap
heapify_down(h, 0)             # Construyo el heap
print(f'Heap: {h}')

key = 1
minheap_insert(h, key)       # inserto la llave en la lista     
print(f'Heap despues de insertar la llave {key}: {h}')

Heap: [7, 13, 10, 50, 14, 25]
Heap despues de insertar la llave 1: [1, 13, 7, 50, 14, 25, 10]


El bucle _while_ amenudo se denota como procedimiento `heapify_up()`

In [86]:
def heapify_up(h: List, i:int):
    p = _parent(i)
    if i == 0 or h[i] > h[p]:
        return
    h[i], h[p] = h[p], h[i]
    heapify_up(h, p)

def minheap_insert(h: List, k: Any) -> None: 
    h.append(k)
    j = len(h) - 1   #ultima posicion de la lista 
    
    heapify_up(h, j)

* El coste de la insercción claramente es $O(\ln n)$

# Construyendo un Heap

Si el contenedor del heap (es decir, la lista subyacente) está inicialmente vacío y los elementos llegan de manera incremental —por ejemplo, a través de un flujo de datos o de forma interactiva—, la estructura puede construirse insertando cada elemento de forma individual mediante llamadas sucesivas a la función `heap_insert()`.

Como hemos visto en esta estrategia, cada inserción coloca el nuevo elemento en la última posición de la lista y posteriormente ejecuta el procedimiento `heapify_up()` para restaurar la propiedad de heap. 
El coste de una única inserción es $O( \ln ⁡n)$ ya que, en el peor caso, el elemento recién añadido puede ascender hasta la raíz. Por tanto, construir un heap completo de 
$n$ elementos a través de este método incremental requiere un coste total de  $O(n \cdot \ln ⁡n)$

Este procedimiento resulta natural cuando los datos no están disponibles de antemano (por ejemplo, en flujos de entrada continuos) y, en tales situaciones, constituye el mecanismo estándar de construcción de la estructura. Sin embargo, cuando la colección completa de elementos está disponible desde el principio, hay otras estartegias más eficientesO(n).

In [178]:

h=[] # Se inicializa una lista vacía como EdD para contener los elementos del Heap

for element in [10, 1, 7, 0]:    # itero sobre el flujo de datos
    minheap_insert(h, element)
    print(f'Estado del Heap tras insertar {element}: {h}')

Estado del Heap tras insertar 10: [10]
Estado del Heap tras insertar 1: [1, 10]
Estado del Heap tras insertar 7: [1, 10, 7]
Estado del Heap tras insertar 0: [0, 1, 7, 10]


Sin embargo, suponga que ya se dispone de la lista con los elementos y se desea *organizarlos* en un minHeap. *A priori* tenemos dos posibilidades. Ambas son *in-place*, i.e, no requieren de memoria adicional:

* `minheap_build()` utiliza el procedimiento `heapify_down()`. Empezando desde el padre del último nodo de la lista invocamos iterativamente al procedimiento `heapify_down(h, i)` decrementando el índice del nodo $i$ en cada iteración.  

In [143]:
def minheap_build(h: List) -> None:
    ''' Utiliza heapify_down. Coste O(n) '''
    
    parent_last_node = _parent(len(h)-1)  # índice del padre del ultimo nodo 

    for j in range(parent_last_node, -1, -1):
        heapify_down(h, j)
        print(f'Evolucion de la lista tras procesar el node de indice {j}: {h}') 

In [74]:
# Driver program

l = [10, 9, 7, 2, 4, 5, 8, 1]
minheap_build(l)
print(f'Heap: {l}')

Evolucion de la lista tras procesar el node de indice 3: [10, 9, 7, 1, 4, 5, 8, 2]
Evolucion de la lista tras procesar el node de indice 2: [10, 9, 5, 1, 4, 7, 8, 2]
Evolucion de la lista tras procesar el node de indice 1: [10, 1, 5, 2, 4, 7, 8, 9]
Evolucion de la lista tras procesar el node de indice 0: [1, 2, 5, 9, 4, 7, 8, 10]
Heap: [1, 2, 5, 9, 4, 7, 8, 10]


             10                                1
          /     \                           /     \
        9        7           ==>           2       5
       / \      /  \                     /  \     /  \     
      2   4    5    8                   9    4   7    8
     /                                 /  
    1                                 10

* `minheap_build_insert()`utiliza un procedimiento equivalente a `minheap_insert()`.  Empezando desde el nodo raíz invocamos iterativamente el procedimiento `minheap_insert()`: intercambiándose con su padre, el *nodo va subiendo* por el heap hasta que o bien tiene un valor mayor que su padre o bien llega a la raíz del árbol.

In [99]:
def minheap_build_insert(l:list) -> list:
    ''' Utiliza heapifyup. Coste O(n log n)'''
    
    for i in range(len(l)):
        heapify_up(l, i)
        print(f'Evolucion de la lista tras procesar el node de indice {i}: {l}') 
        
    return l


##### Driver program
l = minheap_build_insert([10, 9, 7, 2, 4, 5, 8, 1])
print(f'Heap: {l}')   


Evolucion de la lista tras procesar el node de indice 0: [10, 9, 7, 2, 4, 5, 8, 1]
Evolucion de la lista tras procesar el node de indice 1: [9, 10, 7, 2, 4, 5, 8, 1]
Evolucion de la lista tras procesar el node de indice 2: [7, 10, 9, 2, 4, 5, 8, 1]
Evolucion de la lista tras procesar el node de indice 3: [2, 7, 9, 10, 4, 5, 8, 1]
Evolucion de la lista tras procesar el node de indice 4: [2, 4, 9, 10, 7, 5, 8, 1]
Evolucion de la lista tras procesar el node de indice 5: [2, 4, 5, 10, 7, 9, 8, 1]
Evolucion de la lista tras procesar el node de indice 6: [2, 4, 5, 10, 7, 9, 8, 1]
Evolucion de la lista tras procesar el node de indice 7: [1, 2, 5, 4, 7, 9, 8, 10]
Heap: [1, 2, 5, 4, 7, 9, 8, 10]


             10                                1
          /     \                           /     \
        9        7           ==>           2       5
       / \      /  \                     /  \     /  \     
      2   4    5    8                   4    7   9    8
     /                                 /  
    1                                 10

Notad como los dos procedimientos para construir un min-heap **no** producen la misma distribución de los nodos en el árbol.

**¿Cuál es el coste de los dos procedimientos? (razonamiento intuitivo)**

En ambos casos, _recolocar_ un nodo en su posición final dentro del heap cuesta, en el peor caso, $O(\ln n)$. 
Si asumimos ingenuamente que cada uno de los $n$ nodos requiere ese coste, obtendríamos una complejidad $O(n \ln n)$.

Sin embargo, existe una **diferencia fundamental** entre los dos enfoques:
* Teniendo en cuenta que en un árbol binario completo, la mayoría de los nodos se encuentran en los niveles inferiores (aproximadamente la mitad son hojas, un cuarto son padres de hojas, etc.), 
en el procedimiento `minheap_build()`, la mayor parte de los nodos que ejecutan la operación recursiva `heapify_down()` se encontrarán lejos de la raíz. Como `heapify_down()` hace que el nodo descienda por el árbol, el número de pasos necesarios para recolocar un nodo, **en promedio,** es reducido.
* En cambio, en el procedimiento `minheap_build_insert()` los elementos se insertan desde el fondo y deben recolocarse con `heapify_up()`. Como este procedimiento hace que el nodo ascienda hacia la raíz, la mayoría de los nodos recorrerán muchos niveles hasta alcanzar su posición correcta.

**Ejemplo en el peor caso**

Supongamos que queremos construir un min-Heap _in-place_ a partir de una lista estrictamente decreciente (ordenada de mayor a menor).  
Si el número de elementos es
$$
n = 2^4 - 1 = 15,
$$
el árbol binario completo tendrá 4 niveles. 

* Con `minheap_build()` bastan **11 movimientos de nodos**.
* Con `minheap_build_insert()` se requieren **40 movimientos de nodos**.

**Conclusión**

Aunque ambos métodos parecen tener un coste $O(n \log n)$, el procedimiento 
`minheap_build() aprovecha la distribución de los nodos en el árbol para reducir el trabajo real, alcanzando así una complejidad óptima de $\Theta(n)$.

**Demostración rigurosa (Ref Cormen et al.)**

Sea $n$ el número de elementos y $h=\lfloor\log_2 n\rfloor$ la altura del heap (nivel de la raíz = 0). Para un nodo en el nivel $i$ (con $i=0,\dots,h$) la máxima distancia que puede bajar `heapify_down()` es $h-i$. En un árbol binario completo, el número de nodos en el nivel $i$ es a lo sumo $2^i$. Por tanto, una cota superior para el coste total $T(n)$ es
$$
T(n)\le \sum_{i=0}^{h} \big(\text{nodos en nivel }i\big)\cdot\big(\text{coste por nodo}\big)
\le \sum_{i=0}^{h} 2^i (h-i).
$$

Realizamos el cambio de variable $j=h-i$. Entonces $i=0,\dots,h$ corresponde a $j=h,\dots,0$ y
$$
\sum_{i=0}^{h} 2^i (h-i)
= \sum_{j=0}^{h} 2^{\,h-j}\, j
= 2^{h}\sum_{j=0}^{h} j\cdot 2^{-j}.
$$

Consideramos la suma infinita conocida
$$
S=\sum_{j=0}^{\infty} j\cdot 2^{-j}.
$$
Para $|x|<1$ se tiene $\sum_{j=0}^{\infty} x^j = \dfrac{1}{1-x}$. Derivando con respecto a $x$:
$$
\sum_{j=1}^{\infty} j x^{j-1} = \frac{1}{(1-x)^2}
\quad\Rightarrow\quad
\sum_{j=1}^{\infty} j x^{j} = \frac{x}{(1-x)^2}.
$$
Tomando $x=\tfrac12$ se obtiene
$$
S=\sum_{j=1}^{\infty} j\left(\tfrac12\right)^j = \frac{\tfrac12}{(1-\tfrac12)^2} = 2.
$$
(el término $j=0$ es cero, por lo que la suma desde $0$ o desde $1$ coincide).

Como la suma finita está acotada por la suma infinita,
$$
\sum_{j=0}^{h} j\cdot 2^{-j} \le \sum_{j=0}^{\infty} j\cdot 2^{-j} = 2.
$$
Por tanto
$$
T(n) \le 2^{h}\cdot 2 = 2^{h+1}.
$$

Finalmente, por la definición de $h=\lfloor\log_2 n\rfloor$ sabemos que $2^h \le n < 2^{h+1}$. Entonces
$$
T(n) \le 2^{h+1} \le 2n.
$$
Esto demuestra que $T(n)=O(n)$. Como además \texttt{build\_heap} debe al menos leer todos los elementos una vez, se sigue que su coste es $\Theta(n)$.

**Conclusión**

El algoritmo `build_heap()` que aplica el procedimiento `heapify_down()` desde el último padre hasta la raíz tiene coste $\Theta(n)$. Nosotros hemos demostrado $T(n)\le 2n$.

**Ejercicio:**

Implemente un primitiva que modifique el valor de un determinado nodo del Heap

In [138]:
def minheap_modify_key(h: List, i: int, new_value: Any) -> None:
    ''' Modifica el valor del elemento en la posición i de un min-heap
        y restaura la propiedad de heap
    '''
    old_value = h[i]
    h[i] = new_value
    
    if h[i] < old_value:
         # Puede violar con el padre → subir
        heapify_up(h, i)
    elif h[1] > old_value:
        # Puede violar con los hijos → bajar
        heapify_down(h, i)

In [122]:
# Driver program

h = [1, 2, 5, 4, 7, 9, 8, 10]

if False:
    i = 0
    new_value = 100

if True:
    i = len(l) - 1
    new_value = 0

modify_key(h, i, new_value)
print(f'new_value: {new_value}, {h}')

new_value: 0, [0, 1, 5, 2, 7, 9, 8, 4]


# Algoritmo K-Select

# Colas de Prioridad (PQ)

* Son colas con las primitivas estándar `build()`, `insert()`, `remove()`, ... etc pero donde:
    * Cada elemento tiene asociada una prioridad que determina su lugar en la PQ después de la inserción
    * Supondremos que los valores más pequeños tienen una prioridad más alta
    * `insert(x)` situa x *después* de los elementos en la PQ con menor prioridad y *antes* aquellos con mayor prioridad
        * **Cuidado:** *Antes* y *después* **no** debe *entenderse en el sentido de que los elementos deban estar ordenados dentro de la PQ*. Lo fundamental es asegurar que cada vez que se extraiga un elemento se extraiga el de mayor prioridad de los almacenados en la cola. 
    * `remove()` extrae el elemento de menor prioridad manteniendo la prioridad de los demás elementos

## PQ sobre Heaps

* Conceptualmente construimos un *min-heap* donde cada nodo (objeto) es un par: contiene su prioridad y un enlace a sus datos.
* Construimos un *min-heap* de acuerdo a las prioridades de los objetos
* Las primitivas de PQ invocan a las de *min-heap*
    * `insert()` realiza la insercción en el *min-Heap*
    * `remove()` elimina la raíz del *min-Heap*

**Implementación _sencilla_ de la Cola de prioridad**

Teniendo en cuenta que en Python el operador $<$ está definido para tuplas, cada objeto de la cola de prioridad será una tupla cuyo primer elemento será la prioridad. 

In [135]:
pq_insert = minheap_insert
pq_remove = minheap_extract
pq_build = minheap_build
pq_modify = minheap_modify_key

# Driver program

x = (5, "write code")
y = (7, "release product")
z = (4, "create test")
d = (6, "run text")


# Creamos una cola de prioridad con los elementos
pq = [x, y, z, d]
pq_build(pq)
print(pq)

# insertamos un nuevo elemento en la cola
w = (2, "write spec")
print(f'Insert in the pq: {w}')
pq_insert(pq, w)               
print(pq)

# Eliminamos un objeto de la cola
element = pq_remove(pq)
print(f'Remove: {element}')
print(pq)


Evolucion de la lista tras procesar el node de indice 1: [(5, 'write code'), (6, 'run text'), (4, 'create test'), (7, 'release product')]
Evolucion de la lista tras procesar el node de indice 0: [(4, 'create test'), (6, 'run text'), (5, 'write code'), (7, 'release product')]
[(4, 'create test'), (6, 'run text'), (5, 'write code'), (7, 'release product')]
Insert in the pq: (2, 'write spec')
[(2, 'write spec'), (4, 'create test'), (5, 'write code'), (7, 'release product'), (6, 'run text')]
Remove: (2, 'write spec')
[(4, 'create test'), (6, 'run text'), (5, 'write code'), (7, 'release product')]



# Temas avanzados (**)

__(**) NO OBLIGATORIOS__  **Sólo** si tienes curiosidad y tiempo, recuerda que tienes otras asignaturas!!.

## Heap de objetos (Items)

*Referencia introduccción POO: *Introduction to Computation and Programming Using Python with Application to 
Computational Modeling and Understanding Data*, J. Guttag, Chapter 10 

* El problema con el planteamiento anterior es que *rompemos* los objetos al desligar la prioridad de los datos de su información. En realidad **no** tenemos un Heap de objetos sino un un *heap de prioridades de objetos*. Si extrayésemos una prioridad del minHeap tendríamos que buscar a que objeto corresponde esa prioridad.  

* Ahora queremos construir un *minHeap* en el que sus nodos sean *objetos (pares)* y no enteros. Para ello los objetos deben ser *objetos ordenables*, i.e, dados dos objetos cualesquiera deben poder compararse y decidir cual de ellos es menor. ¿Cómo podemos hacerlo? 
Una posibilidad es considerar a los objetos como pares con una *llave o clave* y un *valor* (llave, valor). 
Los objetos se compararán por el valor de su *llave*: dados dos objetos el menor será aquel cuya clave es menor. 
Es decir debemos *redefinir (sobrecargar)* el operador de comparación $<$.

   En Python podemos construir tales objetos definiendo una clase e incorporando el método mágico `__lt__()`. En este caso hemos definido la clase `Item` con dos variable privadas `__key` y `__value`. 
    
   En [pythontutor](https://pythontutor.com/render.html#code=_parent%20%3D%20lambda%20i%3A%20%20%28i-1%29//2%20%20%0A%0Adef%20_heapify%20%28h,%20i%29%3A%0A%20%20%20%20'''%20Version%202%20%28transparencias%29'''%0A%20%20%20%20while%202*i%2B1%20%3C%20len%28h%29%3A%0A%20%20%20%20%20%20%20%20n_i%20%3D%20i%0A%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20if%20h%5Bi%5D%20%3E%20h%5B2*i%2B1%5D%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20n_i%20%3D%202*i%2B1%0A%20%20%20%20%20%20%20%20if%202*i%2B2%20%3C%20len%28h%29%20and%20h%5Bi%5D%20%3E%20h%5B2*i%2B2%5D%20and%20h%5B2*i%2B2%5D%20%3C%20h%5Bn_i%5D%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20n_i%20%3D%202*i%2B2%0A%0A%20%20%20%20%20%20%20%20if%20n_i%20%3E%20i%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20h%5Bi%5D,%20h%5Bn_i%5D%20%3D%20h%5Bn_i%5D,%20h%5Bi%5D%0A%20%20%20%20%20%20%20%20%20%20%20%20i%20%3D%20n_i%0A%20%20%20%20%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20return%0A%0Adef%20minheap_build%20%28l%3Alist%29%20-%3E%20list%3A%0A%20%20%20%20'''%20utiliza%20heapify'''%0A%20%20%20%20%0A%20%20%20%20j%20%3D%20_parent%28len%28l%29-1%29%20%20%23%C3%ADndice%20del%20padre%20del%20ultimo%20nodo%20%0A%0A%20%20%20%20while%20j%20%3E-1%3A%0A%20%20%20%20%20%20%20%20_heapify%20%28l,%20j%29%0A%20%20%20%20%20%20%20%20j%20-%3D%201%0A%20%20%20%20%20%20%20%20%20%20%20%0A%0Aclass%20Item%3A%0A%20%20%20%20'''Lightweight%20composite%20to%20store%20heap%20items.'''%0A%20%20%20%20%20%20%20%20%0A%20%20%20%20def%20__init__%28self,%20key%3Aint,%20value%3Astr%29%3A%0A%20%20%20%20%20%20%20%20'''Inicializa%20un%20objeto%20como%20un%20par%20%28llave%3Aint,%20valor%3AString%29'''%0A%20%20%20%20%20%20%20%20self._key%20%3D%20key%0A%20%20%20%20%20%20%20%20self._value%20%3D%20value%0A%20%20%20%20%0A%20%20%20%20def%20__lt__%28self,other%29%3A%0A%20%20%20%20%20%20%20%20'''Los%20objetos%20se%20comparan%20por%20el%20valor%20de%20su%20llave'''%0A%20%20%20%20%20%20%20%20return%20self._key%20%3C%20other._key%0A%20%20%20%20%0A%20%20%20%20def%20__str__%28self%29%3A%0A%20%20%20%20%20%20%20%20'''Consideramos%20que%20el%20valor%20de%20los%20objetos%20son%20cadenas%20de%20caracteres'''%0A%20%20%20%20%20%20%20%20return%20f'%28%7Bself._key%7D,%20%7Bself._value%7D%29'%0A%20%20%20%20%0A%20%20%20%20def%20__repr__%28self%29%3A%0A%20%20%20%20%20%20%20%20'''...'''%0A%20%20%20%20%20%20%20%20return%20str%28self%29%0A%20%20%20%20%20%20%20%20%0A%23%23%23%20Driver%20Programm%0A%0Ax%20%3D%20Item%2814,'Eduardo'%29%0Ay%20%3D%20Item%2810,%20%22Carlos%22%29%0A%0A%23%20Como%20cualquier%20objeto%20de%20Python,%20los%20items%20los%20podemos%20guardar%20en%20un%20contenedor%0Al%20%3D%20%5Bx,%20y%5D%0A%0A%23%20Podemos%20construir%20un%20Heap%0Aminheap_build%20%28l%29&cumulative=false&curInstr=40&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) se ha incluído una ejecución simplificada del *programa driver*.

In [42]:
class Item:
    '''Lightweight composite to store heap items.'''
        
    def __init__(self, key:int, value:str):
        '''Inicializa un objeto como un par (llave:int, valor:String)'''
        self._key = key
        self._value = value
    
    def __lt__(self,other):
        '''Los objetos se comparan por el valor de su llave'''
        return self._key < other._key
    
    def __str__(self):
        '''Consideramos que el valor de los objetos son cadenas de caracteres'''
        return f'({self._key}, {self._value})'
    
    def __repr__(self):
        '''...'''
        return str(self)

    
### Driver Programm

x = Item(5, "write code")
y = Item(7, "release product")
z = Item(4, "create test")
w = Item(2, "write spec")

# Los items son objetos ordenables. La comparación se hace a través de las claves 
print(f'x: {x}, y:{y}')
print(f'¿Es x < y?  {x<y}') 

# Podemos construir un Heap con los items
l = minheap_build ([x, y,  z, w])
print(f'Despues de construir el min Heap: {l}')

minheap_extract(l)
print(f'Despues de extraer: {l}')


x: (5, write code), y:(7, release product)
¿Es x < y?  True
Despues de construir el min Heap: [(2, write spec), (5, write code), (4, create test), (7, release product)]
Despues de extraer: [(4, create test), (5, write code), (7, release product)]


* Podemos construir la cola de prioridad exactamente igual que antes enlazando las funciones de la cola de prioridad con las del Heap

In [37]:
pq_insert = minheap_insert
pq_remove = minheap_extract
pq_build = minheap_build

pq = pq_build([x, y, z])
print(pq)

pq_insert (pq, w)               
print(pq)
               
pq_remove (pq)
print (pq)

[(5, Simone), (10, Carlos), (14, Eduardo)]
[(1, Jose), (5, Simone), (14, Eduardo), (10, Carlos)]
[(5, Simone), (10, Carlos), (14, Eduardo)]


## Cola de prioridad como una clase (**)

Referencia: *Data Structures and Algorithms in Python*, M. Goodrich et. al.  


* Un planteamiento muy habitual es definir una clase para la cola de prioridad en la que el Heap es la estructura de datos que utilizamos para guardar los elementos de la PQ.

In [38]:
class PriorityQueue:
    '''......'''
    def __init__(self, *args):
        # Estructura de datos para implementar la PQ 
        self._h = list(args)
        self._size = len(self._h)
        
        minheap_build(self._h)
            
    def extract(self):
        return minheap_extract(self._h)
    
    def insert(self, obj):
        return minheap_insert (self._h, obj)
    
    def __len__(self):
        return self._size
    
    def __str__(self):
        return str(self._h)
    
    def __iter__(self):
        return iter(self._h)
        
              
x, y, z = Item(5,"write code"), Item(7,"release product"), Item(2, 'write spec')      

pq = PriorityQueue(x, y)    
print(pq)

pq.extract()
print(pq)

pq.insert(Item(4, "create test"))
print(pq)

print(len(pq))

for i in pq:
    print(i)

[(5, write code), (7, release product)]
[(7, release product)]
[(4, create test), (7, release product)]
2
(4, create test)
(7, release product)


* Si has investigado por la web, te habrás dado cuenta que el módulo `heapq` implementa *Heaps*. Podemos cambiar nuestra implementación de PQ para que utilice las funciones de este módulo.

In [39]:
import heapq as hp

x, y, z = Item(5,"write code"), Item(7,"release product"), Item(2, 'write spec')   

# Prueba de las funciones de heapq
h = []
hp.heappush(h, x)
hp.heappush(h, y)
hp.heappush(h, z)
print(h)

[(2, write spec), (7, release product), (5, write code)]


In [40]:
class PriorityQueueHeapq:
    '''......'''
    def __init__(self, *lista:Item):
        self._h = []
        self._size = len(lista)
        
        # inserta los objetos en la lista
        for obj in lista:
            hp.heappush (self._h, obj)
            
    def extract(self):
        return hp.heappop(self._h)
    
    def insert(self, obj):
        return hp.heappush (self._h, obj)
    
    def __len__(self):
        return self._size
    
    def __str__(self):
        return str(self._h)
    
    def __iter__(self):
        return iter(self._h)
        
# Driver programm              
            
pq = PriorityQueueHeapq(x, y)    
print(pq)

pq.extract()
print(pq)

pq.insert(z)
print(pq)

print(len(pq))

for i in pq:
    print(i)

[(5, write code), (7, release product)]
[(7, release product)]
[(2, write spec), (7, release product)]
2
(2, write spec)
(7, release product)
