# Laboratorio 3

## HEAPSORT

Heapsort è uno dei tanti algoritmi di ordinamento, esso presenta però una caratteristica che lo differenzia dagli altri: utilizza, infatti, una particolare struttura dati, denominata **heap**, per gestire gli elementi da ordinare.

La struttura di dati _heap_ è un array che può essere visto come un albero binario bilanciato.
* Ogni nodo dell'albero corrisponde a un elemento dell'array che contiene il valore del nodo.
* L'albero è riempito su tutti i livelli tranne, eventualmente, il più basso che è riempito da sinistra in poi.
* I max-heap (min-heap) soddisfano la proprietà di ordinamento parziale: il valore di un nodo è *minore* (*maggiore*) uguale al valore del padre: quindi l'elemento più grande (più piccolo) è memorizzato nella radice.

<img src='Max-Heap.png' style="background:white"/>

Nel laboratorio di oggi implementeremo la struttura dati Max-Heap e l'algoritmo di ordinamento Heapsort, che sfrutta la struttura dati appena descritta.

In [1]:
import numpy as np
import matplotlib.pyplot as plt

In [52]:
class MaxHeap():
    def __init__(self, values):
        self._keys = values
        self.number_of_nodes = len(values)
        self.height = int(np.log2(self.number_of_nodes))
        self.build_heap()
    
    # Notazione per figlio sinistro, destro e genitore avendo come indice di partenza 0
    def left(self, i):
        return 2*i + 1
    
    def right(self, i):
        return 2*i + 2
    
    def parent(self, i):
        return (i-1)//2
    
    # Razionale: ad ogni passo verifichiamo la proprietà di una max-heap, ovvero, 
    # la chiave di ciascun figlio è <= della chiave del padre. Nel caso non sia così allora:
    #   1. Trovo il figlio avente chiave maggiore;
    #   2. Scambio il padre con il figlio avente chiave più grande;
    #   3. Verifico se la condizione di max-heap è soddisfatta nel sottoalbero in cui ho effettuato lo scambio;
    #       * Se vera, ho concluso l'operazione di heapify ed ho ristabilito la max-heap;
    #       * Altrimenti, continuo dal punto 1.
    def heapify(self, i):
        L = self.left(i)
        R = self.right(i)
        largest = i
        if L < self.number_of_nodes and self._keys[L] > self._keys[largest]:
            largest = L
        if R < self.number_of_nodes and self._keys[R] > self._keys[largest]:
            largest = R
        if largest != i:
            tmp = self._keys[i]
            self._keys[i] = self._keys[largest]
            self._keys[largest] = tmp
            #### Be pythonic :) 
            #### Metodo molto utile per fare uno swap senza aggiungere alcuna variabile ausiliaria "tmp"
            # self._keys[i], self._keys[largest] = self._keys[largest], self._keys[i]  
            self.heapify(largest)
        return self._keys
    
    def build_heap(self):
        for i in range(self.number_of_nodes//2, -1, -1):
            print(self, '\n', self._keys, '\n\n')
            self.heapify(i)
        return self._keys
    
    def heapsort(self):
        for i in range(self.number_of_nodes -1, 0, -1):
            self._keys[i], self._keys[0] = self._keys[0], self._keys[i]  # swap root with last element
            self.number_of_nodes = self.number_of_nodes - 1
            self.heapify(0) # heapify root

        return self._keys
   
    def __repr__(self):
        bt_str = 'Heap:\n'
        for i in range(self.height+1):
            bt_str += '    ' * (2**(self.height-i)-1)  # Indentation
            for j in range(2**i):  # Nodes in the current level
                index = 2**i + j - 1
                if index < len(self._keys):
                    bt_str += '[{}]'.format(str(self._keys[index]).zfill(2)) 
                if j < 2**i - 1:
                    bt_str += '    ' * (2**(self.height - i + 1) - 1) # Space between nodes
            bt_str += '\n'
        return bt_str

In [57]:
A = [24, 3, 0, 56, 88, 12, 3, 19, 7, 48, 112]
print(A)

[24, 3, 0, 56, 88, 12, 3, 19, 7, 48, 112]


In [58]:
tree = MaxHeap(A)   
print(tree)

Heap:
                            [24]
            [03]                            [00]
    [56]            [88]            [12]            [03]
[19]    [07]    [48]    [112]                
 
 [24, 3, 0, 56, 88, 12, 3, 19, 7, 48, 112] 


Heap:
                            [24]
            [03]                            [00]
    [56]            [88]            [12]            [03]
[19]    [07]    [48]    [112]                
 
 [24, 3, 0, 56, 88, 12, 3, 19, 7, 48, 112] 


Heap:
                            [24]
            [03]                            [00]
    [56]            [112]            [12]            [03]
[19]    [07]    [48]    [88]                
 
 [24, 3, 0, 56, 112, 12, 3, 19, 7, 48, 88] 


Heap:
                            [24]
            [03]                            [00]
    [56]            [112]            [12]            [03]
[19]    [07]    [48]    [88]                
 
 [24, 3, 0, 56, 112, 12, 3, 19, 7, 48, 88] 


Heap:
                            [24]
     

In [236]:
oredered_array = tree.heapsort()
print(oredered_array)

[0, 3, 3, 7, 12, 19, 24, 48, 56, 88, 112]


In [237]:
# now plot the tree
print(tree)

Heap:
                            [0]
            [3]                            [3]
    [7]            [12]            [19]            [24]
[48]    [56]    [88]    [112]                

