# ALBERI

Gli alberi sono una struttura dati *non lineare*

Gli elementi della struttura sono nodi aventi tra loro una relazione padre/figlio, infatti:

- Tutti gli elementi hanno infatti un padre (ad eccezione della root)
- Tutti gli elementi possono avere 0 o più figli

### Definizioni

- Se T è un albero non vuoto avrà sicuramente il nodo radice (root) non avente genitore
- Ogni nodo V dell'albero ha un solo nodo genitore
- Se due nodi sono figli dello stesso genitore si dicono *fratelli*
- Un nodo si dice *esterno* se non ha figli (o *foglie*)
- 
- Un sotto-albero di T è un albero avente come root un nodo V di T e composto da tutti i discendenti del nodo V
- Un arco di T è una coppia di nodi (u,v) tale che uno dei due nodi è genitore dell'altro

## Alberi Ordinati

Un albero si dice ordinato se vi è un ordine specifico tra i figli di un nodo in modo da identificarne il primo/secondo ecc.

### Alberi Binari

Un albero binario è un albero ordinato dove ogni nodo può avere al più due figli (figlio destro e sinistro con il figlio sinistro che precede il destro)

Un albero binario si dice proprio (completo) se ogni nodo possiede 0 o due figli, ogni nodo interno avrà quindi esattamente due figli

Un albero binario può essere introddo ricorsivamente dicendo che è vuoto oppure è formato da:

- Un nodo root
- Un sottoalbero sinistro 
- Un sottoalbero destro


### Implementazione

Per implementare un albero binario possiamo immaginare di avere un dizionario di dizionari

nodo 1: {'parent':None, 'left': 2,'right': 3}
nodo 2: {'parent': 1, 'left':None, 'right':None}
nodo 3: {'parent': 1, 'left':None, 'right':None}

In [1]:
def add_root(root, tree = dict()):
    tree[root] = {'parent':None, 'left':None, 'right':None}
    return tree

def add_child(tree, p, node, side):
    
    #se il nodo parent esiste e non ha figli nel lato selezionato
    if p in tree and not tree[p][side]:
        tree[p][side] = node
        tree[node] = {'parent': p, 'left':None, 'right':None}

## Profondità

Dato un albero T ed un generico nodo V, la profondità di V è data dal numero di antenati di V (V escluso), quindi:

- Se V è root -> profondità(V) = 0
- SE V non è root -> profondità(V) = profondità(parent(V)) + 1

In [2]:
import pprint

def is_root(tree, node):
    return tree[node]['parent'] == None

def parent(tree, node):
    return tree[node]['parent']

def recursive_depth(tree, node):
    if is_root(tree,node):
        return 0 
    return recursive_depth(tree, parent(tree, node)) + 1

def iterative_depth(tree, node):
    depth = 0
    root = False
    temp_node = node
    while not root:
        depth += 1
        root = is_root(tree, temp_node)
        temp_node = parent(tree, temp_node)
    return depth
    

### Complessità Computazionale

Essendo che l'algoritmo esegue una ricorsione/iterazione partendo dal nodo fino ad arrivare al padre la complessità sarà:

\begin{align*}
O(depth(node))
\end{align*}

Nel caso peggiore (quando il nodo è una foglia) sarà:

\begin{align*}
O(N)
\end{align*}

## Altezza

Similmente alla profondità, dato un nodo V, l'altezza di V sarà data dal numero di discendenti di V (V escluso), quindi:

- Se V è una foglia -> altezza(V) = 0
- Se V non è una foglia -> altezza(max-altezza(figli(node)) +1

A differenza della profondità, essendo che un nodo può avere più figli, ad ogni iterazione dovremmo controllare l'altezza del sotto-albero sinistro e l'altezza del sotto-albero destro (nel caso di un albero binario)

Possiamo definire anche l'altezza di un albero come l'altezza del suo nodo radice

In [3]:
def is_leaf(tree, node):
    return tree[node]['left'] == None and tree[node]['right'] == None

def children(tree, node):
    c = []
    if tree[node]['left'] != None:
        c.append(tree[node]['left'])
    if tree[node]['right'] != None:
        c.append(tree[node]['right'])
    return c

def recursive_height(tree, node):
    if is_leaf(tree, node):
        return 0
    return max(recursive_height(tree,child) for child in children(tree, node)) + 1 

In [4]:
tree = add_root(5)
add_child(tree, 5, 7, 'right')
add_child(tree, 5, 3, 'left')
add_child(tree, 7, 6,'left')
add_child(tree, 7, 9, 'right')

## Proprietà

L'insieme di tutti i nodi che si trovano alla stessa altezza d viene indicato come livello *d* dell'albero

- Il livello 0 avrà al massimo 1 nodo (2^0)

- Il livello 1 avrà al massimo 2 nodi (2^1)

- Il livello 2 avrà al massimo 4 nodi (2^2)

- Il livello N avrà al massimo 2^N nodi

Se T non vuoto con N nodi, N_e nodi esterni, N_i nodi interni e h l'altezza avremo:

$$
h+1 \le n \le 2^{h+1} - 1
$$

$$
1 \le N_e \le 2^h
$$

$$
h \le N_i \le 2^h -1
$$

$$
\log(n+1) - 1 \le h \le n-1
$$

Se T è non vuoto valgono anche le proprietà:

$$
2h + 1 \le n \le 2^{h+1} -1
$$

$$
h + 1 \le n \le 2^h
$$

$$
h \le N_i \le 2^h -1
$$

$$
\log(n+1) - 1 \le h \le \frac{n-1}{2}
$$

Infine si ha che


$$
N_e = N_i + 1
$$

Infatti, se T ha solo un nodo sarà sicuramente un nodo esterno

Se T presenta più nodi è sicuramente possibile rimuovere un nodo esterno *w* con il relativo genitore *v*, se poi v ha un genitore u è possibile collegare u al fratello di w

Questa operazione rimuove un nodo esterno mantenendo le proprietà di albero binario

È possibile quindi ripetere l'operazione finchè non resta un solo nodo, a quel punto come abbiamo detto la preposizione sarà vera

## Visita

È possibile visitare gli alberi seguendo vari tipi di approcci

### Pre-Order

Nella visita pre-order andremo a visitare inizialmente la root dell'albero per poi passare alla visita del sottoalbero sinistro e successivamente del sottoalbero destro

In [5]:
def pre_order_recursive(tree, node, visited = list()):
    visited.append(node)
    if tree[node]['left']:
        pre_order_recursive(tree, tree[node]['left'], visited)
    if tree[node]['right']:
        pre_order_recursive(tree, tree[node]['right'], visited)
    return visited

def pre_order_iterative(tree, node):
    visited, queue = [], [node]
    while queue:
        temp_node = queue.pop()
        visited.append(temp_node)
        if tree[temp_node]['right']:
            queue.append(tree[temp_node]['right'])
        if tree[temp_node]['left']:
            queue.append(tree[temp_node]['left'])
    return visited

### Post-Order

A differenza del pre-order, qui, la visita del root viene posticipata, l'ordine di visita è dunque:

- Sotto-albero sinistro
- Sotto-albero destro
- Root

In [6]:
def post_order_recursive(tree, node, visited=list()):
    if tree[node]['left']:
        post_order_recursive(tree, tree[node]['left'], visited)
    if tree[node]['right']:
        post_order_recursive(tree, tree[node]['right'], visited)
    visited.append(node)
    return visited

### In-Order

Nella visita in-order verrà prima visitato il sotto-albero sinistro, successivamente la root e infine il sotto-albero destro

In [7]:
def in_order_recursive(tree, node, visited=list()):
    if tree[node]['left']:
        in_order_recursive(tree, tree[node]['left'], visited())
    visited.append(node)
    if tree[node]['right']:
        in_order_recursive(tree, tree[node]['right'], visited())
    return visited

### Costo Computazionale

Ad ogni iterazione/ricorsione viene visitato un nodo, dovremmo iterare quindi N volte per un albero di N nodi

La visite di un nodo consiste nell'aggiunta di un elemento in una lista, il costo computazionale sarà quindi O(1)

Complessivamente quindi l'algoritmo richiede un tempo di esecuzione di:

$$
O(N)
$$

## Visita in Ampiezza

La visita in Ampiezza segue una logica diversa da quelle viste in precedenza

I nodi verrranno visitati infatti in base alla loro profondità

I nodi a profondità d+1 verranno quindi visitati dopo che tutti i nodi a profondità d siano stati visitati

In [8]:
def bfs(tree, node):
    visited, queue= [], [node]
    while queue:
        temp_node = queue.pop(0)
        if tree[temp_node]['left']:
            queue.append(tree[temp_node]['left'])
        if tree[temp_node]['right']:
            queue.append(tree[temp_node]['right'])
    return visited

# Alberi binari di ricerca

È possibile effettuare la ricerca di valori in modo efficiente se questo presenta determinate caratteristiche:

Data la root, tutti i valori minori della root si troveranno nel sotto albero sinistro, tutti i valori maggiori nel sottoalbero destro

Tramite la visita in-order è possibile elencare tutte le chiavi dell'albero i ordine crescente

In [9]:
def tree_search_recursive(tree, root, target):
    print('root è', root,'target è', target)
    if root is None:
        return root
    if root == target:
        return root
    if root < target:
        return tree_search_recursive(tree, tree[root]['right'], target)
    if root > target:
        return tree_search_recursive(tree, tree[root]['left'], target)

def tree_search_iterative(tree, root, target):
    while True:
        if root == None or root == target:
            return root
        if root < target:
            root = tree[root]['right']
        elif root > target:
            root = tree[root]['left']
            
def tree_min(tree, root):
    while tree[root]['left']:
        root = tree[root]['left']
    return root

def tree_max(tree, root):
    while tree[root]['right']:
        root = tree[root]['right']
    return root
    
print(tree_min(tree,5))
print(tree_max(tree,5))

3
9


### Inserimento

Per eseguire l'inserimento di un nodo dovremmo fare in modo di mantenere le proprierà dell'albero binario di ricerca

Per far ciò immaginiamo di dover eseguire una ricerca del nodo da inserire in modo da trovarne la posizione corretta

Per far ciò quindi utilizziamo due variabili

- La prima per eseguire la ricerca
- La seconda per tenere traccia del nodo precedente quando la prima sarà diventata None

A questo punto aggiungo il nuovo nodo, ci collego il padre e faccio un controllo per sapere va nel sottoalbero destro o sinistro

In [10]:
def insert_node(tree, node, root):
    y = None
    x = root
    while x is not None:
        y = x
        if node < x:
            x = tree[x]['left']
        elif node > x:
            x = tree[x]['right']
    tree[node] = {'p': y, 'left': None, 'right': None}
    if y > node:
        tree[y]['left'] = node
    elif y < node:
        tree[y]['right'] = node

insert_node(tree,4,5)

### Cancellazione

Per quanto riguarda la cancellazione di un nodo *z* possono verificarsi tre casi:

- *z* non ha figli, dovremmo modificare solo il genitore di *z*

- *z* ha un solo figlio che si sostituirà a *z*

- *z* ha due figli, si dovrà trovare il successore di Z e lo si sostituisce

L'algoritmo sfrutta anche una funzione d'appoggio **transplant** che si occupa di eseguire lo spostamento di un sottoalbero, questa prende in input il vecchio nodo e quello che dovrà prendere il suo posto

In [11]:
def transplant(tree, old, new):
    oldparent = tree[old]['p']
    
    # Sistemo le parentele del nuovo nodo
    
    # se old era la root
    if oldparent == None:
        
        # il nuovo nodo avrà parent = None
        tree[new]['p'] = None
        
        #se il vecchio nodo aveva sotto-albero sinistro
        if tree[old]['left']:
            tree[new]['left'] = tree[old]['left']
        #se il vecchio nodo aveva sotto-albero destro
        if tree[old]['right']:
            tree[new]['right'] = tree[old]['right']
    
    #se old era figlio sinistro
    elif old == tree[oldparent]['left']:
        tree[oldparent]['left'] = new
        
    #old era figlio destro
    else:
        tree[oldparent]['right'] = new
        
    if new != None:
        tree[new]['p'] = tree[old]['p']
    
def delete_node(tree, node):
    if not tree[node]['left']:
        transplant(tree, node, tree[node]['right'])
    elif not tree[node]['right']:
        transplant(tree, node, tree[node]['left'])
    else:
        #il successore sarà il nodo più piccolo del sottoalbero destro
        successor = tree_min(tree, tree[node]['r'])
        if tree[successor]['p'] != node:
            tree[successor]['right'] = tree[node]['right']
            tree[tree[node]['right']]['p'] = successor
            transplant(tree, node, tree[node]['left'])
        tree[successor]['left'] = tree[node]['left']
        tree[tree[node]['left']]['parent'] = successor
        transplant(tree, node, successor)

# Heap

L'heap è una struttura dati composta da un array considerabile come un albero binario, ogni elemento dell'array infatti corrisponde ad un nodo dell'albero

L'heap è caratterizzato dal fatto che tutti i livelli sono completamente riempiti, eccetto l'ultimo che può essere riempito a partire da destra

Avendo questa caratteristica, nota la posizione di un elemento, è possibile risalire alle posizioni del padre e dei figli senza la necessità di una struttura a doppio dizionario per evidenziare i var legami

In [12]:
def parent(node):
    return node//2

def left(node):
    return 2*node

def right(node):
    return (2*node)+1

## Min - Heap

Per ogni nodo (eccetto la root) di un Heap minimo vale la seguente proprietà:

$$
value(parent(i)) \le value(i)
$$

Il valore di ogni nodo è quindi maggiore o uguale del nodo padre

Segue che l'elemento più piccolo si trova nella radice e che ogni sotto albero conterrà sicuramente valori non maggiori del padre

## Max - Heap

Per ogni nodo (eccetto la root) di un Heap massimo vale la seguente proprietà:

$$
value(parent(i)) \ge value(i)
$$

Il valore di ogni nodo è quindi minore o uguale del nodo padre

Segue che l'elemento più grande si trova nella radice e che ogni sotto albero conterrà sicuramente valori non maggiori del padre

## Proprietà

Date le caratteristiche di un Heap avremo che un heap composto da *n* elementi un'altezza:

$$
h = \log_2(n)
$$

Infatti un heap avrà sicuramente un numero di nodi tra i livelli 0 ed h-1 pari ad:

$$
1 + 2 + 4 + 8 + ... + 2^{h-1} = 2^{h}-1
$$

Mentre il numero di nodi nel livello h sarà

$$
0 \le n \le 2^h
$$

Da ciò segue che:

$$
n \ge 2^h - 1
$$

$$
n \le 2^h - 1 + 2^h = 2^{h+1} -1
$$

$$
2^h-1 \le n \le 2^{h+1} -1
$$

## Costruzione Max - Heap

Per costruire un Max Heap possiamo immaginare di avere una funzione che prenda in input un nodo tale che i sottoalberi sinistro e destro siano a loro volta dei max-heap tuttavia il nodo stesso non può essere più piccolo dei suoi figli, segue che l'albero avente come root il nodo non sarà un max-heap

La funzione si occuperà quindi di far scorrere il valore del nodo nel max-heap corretto, in modo che tutto l'insieme diventi un max-heap

Applicando questa funzione dal basso verso l'alto su tutto l'albero avremmo come risultato un albero ordinato secondo le proprietà del max-heap

### Max - Heapify 

La funzione come abbiamo detto deve rendere l'albero un max-heap partendo da due sottoalberi max-heap, per far ciò dovrà determinare l'elemento più grande tra:

- Root
- Elementi del sotto-albero sinistro
- Elementi del sotto-albero destro

Se l'elemento più grande è la root avremo già un max-heap e non dovremmo fare più niente

Altrimenti la root dovrà essere scambiata con il valore massimo

A questo punto il nodo massimo avrà il valore della root, dovremmo applicare nuovamente un max-heapify per mantenere le proprietà dell'max-heap anche nel sottoalbero

In [13]:
def max_heapify(tree, root, heapsize):
    l = left(root+1) - 1
    r = right(root+1) - 1
    if l < heapsize and tree[l] > tree[root]:
        maximum = l
    else:
        maximum = root
    if r < heapsize and tree[r] > tree[maximum]:
        maximum = r
    if root != maximum:
        tree[root], tree[maximum] = tree[maximum], tree[root]
        max_heapify(tree, maximum, heapsize)
        
def build_max_heap(data, heapsize):
    for i in range(heapsize//2 - 1, 0-1, -1):
        max_heapify(data, i, heapsize)

## Costo computazionale

La funzione max_heapify avrà un costo computazionale

$$
O(\log_2(n))
$$

Questà dovrà essere poi chiamata su metà dell'heap (tutti i nodi interni)

La complessità computazionale per costruire un max_heap sarà quindi:

$$
O(n\log_2(n))
$$

## HeapSort

Dato che un Heap è costituito da una lista, possiamo immaginare di utilizzare le proprietà di questo per ordinarla

L'heapsort utilizza la funzione build_max_heap per rendere la lista da ordinare un heap, successivamente, dato che la root sarà l'elemento più grande potrà essere scambiato con l'ultimo elemento

Possiamo immaginare di iterare il procedimento finchè tutti gli elementi si trovano in ordine, ricordando che ad ogni iterazione la dimensione dell'heap diminuirà di 1

In [14]:
def heapsort(data):
    heapsize = len(data)
    build_max_heap(data, heapsize)
    for i in range(heapsize-1, 0, -1):
        data[0], data[heapsize-1] = data[heapsize-1], data[0]
        heapsize -= 1
        max_heapify(data, 0, i)
        
a = [8,3,7,9,2,6,1]
heapsort(a)
print(a)

[1, 2, 3, 6, 7, 8, 9]


### Costo Computazionale

La funzione per costruire il max_heap avrà un costo computazionale

$$
O(n)
$$

Il max-heapify invece avrà un costo

$$
O(\log_2(n))
$$

Il costo totale dell'heapsort sarà dunque 

$$
O(n\log_2(n))
$$