<a href="https://colab.research.google.com/github/matteomarchiori/algoritmi/blob/master/graphs.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Minimum Spanning Trees

## Algoritmi

Gli algoritmi da implementare sono tre:

- **Algoritmo di Prim** implementato con Heap
- **Algoritmo di Kruskal** nella sua implementazione "naive" di complessità O(mn)
- **Algoritmo di Kruskal** implementato con Union-Find

## Dataset

Il dataset contiene 68 grafi di esempio, di dimensione compresa tra 10 e 100000 vertici, generati in modo randomico con il TestCaseGenerator di [stanford-algs](https://github.com/beaunus/stanford-algs/tree/master/testCases/course3/assignment1SchedulingAndMST/question3). Ogni file descrive un grafo non orientato con pesi interi usando il seguente formato:

```
[numero_di_vertici] [numero_di_archi] 
[un_vertice_arco_1] [altro_vertice_arco_1] [peso_arco_1] 
[un_vertice_arco_2] [altro_vertice_arco_2] [peso_arco_2] 
[un_vertice_arco_3] [altro_vertice_arco_3] [peso_arco_3] 
...
```

Ad esempio, una riga "2 3 -8874" indica che esiste un arco che collega il vertice 2 al vertice 3 con peso -8874. NON si deve presumere che i pesi siano positivi, né che siano distinti.

## Domanda 1

Eseguite i tre algoritmi che avete implementato (Prim, Kruskal naive e Kruskal efficiente) sui grafi del dataset. Misurate i tempi di calcolo dei tre algoritmi e create un grafico che mostri la variazione dei tempi di calcolo al variare del numero di vertici nel grafo. Per ognuna delle istanze del problema, riportate il peso del minimum spanning tree ottenuto dagli algoritmi. 

## Domanda 2

Commentate i risultati che avete ottenuto: come si comportano gli algoritmi rispetti alle varie istanze? C'è un algoritmo che riesce sempre a fare meglio degli altri? Quale dei tre algoritmi che avete implementato è più efficiente?

## Cosa consegnare

- Una breve relazione sullo svolgimento del progetto. La relazione deve contenere:
  - una sezione introduttiva con la descrizione degli algoritmi e delle scelte implementative che avete fatto;
  - grafici esplicativi dei risultati con le risposte alle due domande;
  - eventuali originalità introdotte nell'elaborato o nell'implementazione;
  - una sezione conclusiva in cui porre i vostri commenti e le vostre conclusioni sull’elaborato svolto e i risultati ottenuti.
- Il codice sorgente dell’implementazione in un unico file di archivio (.zip, .tar.gz, ecc.).

## Note generali
- L'esercitazione si può implementare con qualsiasi linguaggio di programmazione. Strutture dati di base come liste, code, pile, insiemi, dizionari o mappe, messe a disposizione dalle librerie standard del linguaggio, sono utilizzabili senza restrizioni. Non è consentito utilizzare librerie che forniscono direttamente le strutture dati e gli algoritmi per rappresentare e manipolare grafi, come NetworkX, JGraphT o simili.
- Commenta le parti essenziali del codice in modo che sia possibile cogliere le idee che hanno portato alla scrittura di quel codice. I commenti aiuteranno a chiarire se un bug è un errore concettuale o solo un piccolo errore.
- Il laboratorio può essere svolto sia da soli che in gruppi di massimo tre persone.
- Solo uno dei componenti del gruppo consegna l'elaborato, indicando i nomi dei componenti del gruppo nella relazione e nello spazio sottostante.
- La prima esercitazione va consegnata entro le **ore 23:55 di lunedì 4 maggio.** Consegne in ritardo comportano una penalizzazione sul voto.

In [0]:
class Heap():

    def __init__(self):
        self._list = []
        self._last = -1

    def push(self, value):
        self._last += 1
        if self._last < len(self._list):
            self._list[self._last] = value
        else:
            self._list.append(value)
        self._orderup(self._last)

    def pop(self):
        if self._last == -1:
            raise IndexError('The heap is empty')

        min_value = self._list[0]

        self._list[0] = self._list[self._last]
        self._last -= 1
        self._orderdown(0)

        return min_value

    def is_present(self, search):
        if self._last == -1:
            raise IndexError('The heap is empty')
        index, value = 0, self._list[0]
        while(index < last and index != None):
            if(search == value):
                return True
            if(search < value):
                index, value = _get_right_child(index)
            else:
                index, value = _get_left_child(index)
        return False

    def _orderup(self, index: int):
        if index > 0:
            p_index, p_value = self._get_parent(index)
            if p_value <= self._list[index]:
                return
            self._list[p_index], self._list[index] = self._list[index], self._list[p_index]
            index = p_index
            self._orderup(index)

    def _orderdown(self, index: int):
        while True:
            index_value = self._list[index]
            left_child_index, left_child_value = self._get_left_child(index)
            right_child_index, right_child_value = self._get_right_child(index)
            if index_value <= left_child_value and index_value <= right_child_value:
                break
            if left_child_value < right_child_value:
                new_index = left_child_index
            else:
                new_index = right_child_index
            self._list[new_index], self._list[index] = self._list[index], self._list[new_index]
            index = new_index

    def _get_parent(self, index: int):
        if index == 0:
            return None, None
        p_index = (index - 1) // 2
        return p_index, self._list[p_index]

    def _get_left_child(self, index: int):
        left_child_index = 2 * index + 1
        if left_child_index > self._last:
            return None, None

        return left_child_index, self._list[left_child_index]

    def _get_right_child(self, index: int):
        right_child_index = 2 * index + 2
        if right_child_index > self._last:
            return None, None
        return right_child_index, self._list[right_child_index]

    def __len__(self):
        return len(self._list)

In [0]:
class UnionFind():

    def __init__(self):
        self._parents = []
    
    def initialize(self, n: int):
        for i in range(0,n):
            self._parents[i] = i

    def find(self, x, depth=0):
        if (x != self._parents[x]):
            return self.find(self._parents[x], depth+1)
        return x, depth

    def union(self, x, y):
        set_x, depth_x = find(x)
        set_y, depth_y = find(y)
        if(set_x == set_y):
            return
        if(depth_x > depth_y):
            self._parents[set_y] = set_x
        else:
            self._parents[set_x] = set_y

In [0]:
class Node():
    
    def __init__(self,key,parent):
        self._key = key
        self._parent = parent

    def key(self):
        return self._key

    def set_key(self,key):
        self._key = key;

    def parent(self):
        return delf._parent

    def set_parent(self,parent):
        self._parent=parent

class Edge():

    def __init__(self, weight, node): 
        self._weight = weight
        self._node = node

    def weight(self):
        return self._weight

    def node(self):
        return self._node

In [0]:
class Graph():

    def __init__(self,n):
        self._nodes = []
        for i in range(0,n):
            self._nodes.append([])

    def add_edge(self, src, dest, weight):
        edge = Edge(weight, dest.key())            
        self._nodes[src.key()].append(edge)

    def get_graph(self):
        return self._nodes

# Algoritmo di Prim

## Prim di base

```
Prim(G,s)
  
  X = {s}
  A = empty;

  while edge in (u,v), u in X, v not in X:
    (u*, v*) = light edge
    add v* to X
    add (u*, v*) to A

  return A
```

## Prim con heap

```
Prim(G,s)
  foreach u in V:
    key[u] = infinity
    parent[u] = null
  key[s] = 0
  Q = V
  while Q not empty:
    u = extractMin(Q)
    foreach v adjacent_to u:
      if v in Q and w(u,v) < key[v]:
        parent[v] = u
        key[v] = w(u,v)
  return V\Q
```

In [0]:
import os
import sys

def prim(graph, s):
    adjacency_list = graph.get_graph()
    for u in range(0,len(adjacency_list)):
        adjacency_list[u].set_key(sys.maxsize)
        adjacency_list[u].set_parent(None)
    adjacency_list[s] = 0
    heap = Heap()
    for key in keys:
        heap.push(key)
    while(len(heap) !=0 ):
        u = heap.pop()
        adjacents = adjacency_list[u]
        for e in adjacents:
            v = e.node()
            if(e.weight() < keys[v]):
                parents[v] = u
                keys[v] = e.weight()
    print("Keys: " + keys)
    print("Parents: " + parents)

def read_file(filename):
    file = open(filename, "r")
    vertici, archi = list(map(int, file.readline().split()))
    graph = Graph(vertici)
    for line in file:
        tripla = list(map(int, line.split()))
        graph.add_edge(Node(tripla[0],None), Node(tripla[1],None), tripla[2])
    file.close()
    return graph

if __name__ == "__main__":
    with os.scandir('mst-dataset') as it:
        for entry in it:
            if not entry.name.startswith('.') and entry.is_file():
                graph = read_file('mst-dataset/'+entry.name)
                prim(graph, 0)
                break
                #aaa

AttributeError: 'list' object has no attribute 'set_key'