# GRAPH

## INTRODUZIONE

I grafi sono una struttura dati non lineare usata particolarmente nell'informatica moderna delle reti composto da VERTICI interconnessi tra loro attraverso ARCHI

Un **ARCO** può essere:
- Orientato se la coppia dei vertici *(U, V)* è ordinata
- Non orientato se non vi è un ordine tra *(U, V)*

UN **GRAFO** si dice:
- *Orientato* se tutti gli archi sono orientati
- *Non orientato* se tutti gli archi non sono orientati
- *Misto* se presenta archi orientati e non

In un arco non orientato, i due vertici si chiamano **End-Vertices** o **EndPoints**

In un arco orientato, il primo endpoint è chiamato **Origine**, l'ultimo **Destinazione**

Due vertici sono **adiacenti** se c'è un arco che li collega

Un arco si dice **incidente** ad un vertice se quel vertice è un endpoint dell'arco

Un arco si dice **uscente** ad un vertice se quel vertice è l'**origine** dell'arco

Un arco si dice **entrante** ad un vertice se quel vertice è la **destinazione** dell'arco

Un gruppo di archi è indicato come una raccolta di essi, in modo che due archi possano avere gli stessi endpoints

Questi archi sono chiamati **paralleli**

Si dice arco **ciclico** quando gli endpoints coincidono

Si dice **grafo semplice** quando non sono presenti archi paralleli o ciclici

Il **grado** di un vertice è il numero di archi incidenti al vertice

Il **grado di entrata (IN-DEGREE)** è il numero di archi aventi come destinazione il vertice

Il **grado di uscita (OUT-DEGREE)** è il numero di archi aventi come origine il vertice

## Proposizione #1
<a id='prop1'></a>

Se G è un grafo con M archi e un insieme di vertici V si ha che:

\begin{align*}
\sum \limits _{v in V} deg (V) = 2m
\end{align*}


### Dimostrazione:

Dati due vertici *U* e *V* collegati da uno e un solo arco

\begin{align*}
degree(U) = 1 ⠀ ⠀ ⠀ ⠀ ⠀ degree(V) = 1
\end{align*}
\begin{align*}
sum(degree(v)) = degree(U) + degree(V) = 2
\end{align*}




## Proposizione #2

In un grafo orientato: 

\begin{align*}
in-degree = out-degree = M
\end{align*}

### Dimostrazione:

Ogni arco del grafo sarà:
- Entrante in un nodo
- Uscente in un nodo

Per tanto *in-degree = out-degree* e coincidono con il numero di archi del grafo M

## PATH

Si dice **Path** una sequenza di vertici e archi tale che ogni arco sia incidente al nodo predecessore e nodo successore

Se il vertice finale e iniziale coincidono il path si dice **ciclo**

Un ciclo deve includere quindi almeno un vertice

Un path si dice **semplice** se ogni vertice viene percorso uno e una sola volta

Un path orientato presenta tutti archi orientati i quali devono essere attraversati nella direzione prevista

Dati due vertici U e V, si dice che U raggiunge V se esiste un cammino orientato da U a V

Se il cammino non è orientato U raggiunge V e V raggiunge U simmetricamente

Un grafo si dice **connesso** se presi due U e V qualsiasi esiste almeno un percorso tra loro

Un grafo si dice **fortemente connesso** se orientato e presi due vertici qualsiasi U e V entrambi si raggiungono a vicenda

## RELAZIONE ARCHI-VERTICI

#### Relazione #1

Sia G un grafo semplice e non orientato avente N vertici ed M archi, allora:
    
\begin{align*}
m <= n(n-1)/2
\end{align*}

#### Motivazione:

In quanto grafo semplice non ci sono archi aventi gli stessi endpoints o cicli

Il grado massimo di un vertice è quindi *n-1*

Segue che per la [proposizione #1](#prop1):
\begin{align*}
2m <= n*(n-1)
\end{align*}

e quindi
\begin{align*}
m <= n*(n-1)/2
\end{align*}

#### Relazione #2

Sia G un grafo semplice e questa volta orientato, allora:

\begin{align*}
m <= n*(n-1)
\end{align*}

#### Motivazione:

Essendo anche in questo caso il grado massimo di un vertice n-1

La stessa [proposizione #2](#prop2) dice che:
\begin{align*}
m <= n*(n-1)
\end{align*}

## SOTTOGRAFI

Un sottografo di un grafo G è a sua volta un grafo i cui vertici e archi sono sottoinsiemi dei vertici e archi di G

Si dice sottografo di spanning se contiene tutti i vertici di G (ma non tutti gli archi)

Se G non connesso, i sottografi massimali connessi sono detti componenti connesse di G

## Implementazioni grafi

Dato il grafo
<img src='media/graph.jpeg' alt='grafo'>

### Lista di archi

In [1]:
graph = [(1,2),(1,4),(1,5),(2,3),(2,5),(2,6),(3,6),(4,5),(4,7),(5,7)]

Composto da una lista di tuple, dove ogni tupla contiene i due endpoints

### Liste di adiacenza

In [2]:
graph = graph = {1:[2,4,5,6],
                 2:[1,5,6],
                 3:[2,6],
                 4:[1,5,7],
                 5:[1,2,4,7],
                 6:[1,2,3],
                 7:[4,5]}

Composto da un dizionario, dove ogni *key* corrisponde ad un nodo ed ogni *value* corrisponde ad una lista con tutti i nodi adiacenti al nodo key

Usato principalmente per grafi sparsi dove
\begin{align*}
|E| << |V|^2
\end{align*}
Con:

    -|E|: Numero di archi
    -|V|: Numero di vertici
    
In quanto il costo in termini di memoria è:
\begin{align*}
O(V+E)
\end{align*}

### Matrici di adiacenza

In [3]:
graph = [[0,1,0,1,1,1,0], #1 = connection
         [1,0,1,0,1,1,0], #0 = no connection
         [0,1,0,0,0,1,0,],
         [1,0,0,0,1,0,1],
         [1,1,0,1,0,0,1],
         [1,1,1,0,0,0,0],
         [0,0,0,1,1,0,0]]

Risulta più efficiente delle liste di adiacenza in termini computazionali in quanto verificare la presenza di un arco richiede un costo di:
\begin{align*}
O(1)
\end{align*}

tuttavia il costo in termini di memoria è:
\begin{align*}
O(V^2)
\end{align*}

# *GRAFI PONDERATI*

Un grafo ponderato è un grafo dove ogni arco *e(u,v)* presenta un etichetta *w(e)* indicante il peso di quell'arco

Posso definire il peso di un certo percorso P come la somma di tutti gli archi di P


# CAMMINI MINIMI

In un grafo non pesato, per trovare il cammino minimo tra un nodo START e un nodo END può essere usata la Visita in Ampiezza

In un grafo pesato questo cambia, in quanto, a seconda del peso, potrebbe essere più conveniente percorrere più archi (più leggeri) piuttosto di un solo arco (più pesante)

## Algoritmo di Dijkstra

Per risolvere il problema del cammino minimo in un grafo pesato possiamo usare l'algoritmo di Dijkstra

Questo applica il metodo **greedy** dove ad ogni iterazione l'algoritmo si occupa di valutare la scelta migliore tra quelle disponibili


### Principio di funzionamento

Ogni vertice *v* presenta un'etichetta *D[v]* che serve per memorizzare il minore peso del cammino per arrivare da s a v

inizialmente D[s] = 0 e D[v] = -1 in quanto sconosciuta

L'algoritmo utilizza poi un insieme di vertici C detto nuvola di vertici

Per ogni iterazione viene selezionato un nuovo vertice *u* non presente nella nuvola con la più piccola etichetta D[u], *u* viene poi inserito in C

Ogni volta che il nodo u viene inserito in C andranno aggiornate tutte le etichette dei nodi al di fuori di C *(processo chiamato rilassamento)*

In particolare:
    
- se **D[u] + w(u,v) < D[v]** allora **D[v] = D[u] + w(u,v)**

## Implementazione

Il codice utilizza una particolare struttura dati chiamata coda di priorità, dove l'ordine degli elementi dipende esclusivamente dal valore della priorità a loro data

In [4]:
def minpop(q):
    dmin, nmin = q[0]
    for d,n in q:
        if d < dmin:
            dmin, nmin = d, n
    q.remove((dmin, nmin))
    return dmin, nmin

In [5]:
def dijkstra(graph, start):

    # inizializzo il dizionario D
    d = {v:None for v in graph}
    d[start] = 0
    
    
    # uso una coda di priorità per estrarre i nodi
    # la priorità sarà l'etichetta d[v]
    pqueue = [(d[start], start)]

    while pqueue:
        print('La coda è:',pqueue)
        current_dist, current_v = minpop(pqueue)
        print('Estraggo',current_v, 'con distanza', current_dist)
        # scorro tutti i vicini
        for adjnode in graph[current_v]:
            print('\tControllo la distanza del nodo', adjnode[0])
            neighbor = adjnode[0]
            weight = adjnode[1]
            new_distance = current_dist + weight
            print('\tLa nuova distanza è', new_distance)
            print('\tLa vecchia distanza', d[neighbor])
            if d[neighbor] is None or new_distance < d[neighbor]:
                d[neighbor] = new_distance
                print('\tLa distanza aggiornata è', d[neighbor])
                pqueue.append((new_distance, neighbor))
                print('\tAggiunto {} in coda'.format(neighbor))
            print('\n')
    
    return d



In [6]:
mygraph = {
    1: [[2,2],[3,5],[6,8]],
    2: [[1,2],[4,1]],
    3: [[1,5],[4,1],[5,2]],
    4: [[2,1],[3,1],[6,5]],
    5: [[3,2],[6,1]],
    6: [[1,8],[4,5],[5,1]]
}

In [7]:
print(dijkstra(mygraph,1))

La coda è: [(0, 1)]
Estraggo 1 con distanza 0
	Controllo la distanza del nodo 2
	La nuova distanza è 2
	La vecchia distanza None
	La distanza aggiornata è 2
	Aggiunto 2 in coda


	Controllo la distanza del nodo 3
	La nuova distanza è 5
	La vecchia distanza None
	La distanza aggiornata è 5
	Aggiunto 3 in coda


	Controllo la distanza del nodo 6
	La nuova distanza è 8
	La vecchia distanza None
	La distanza aggiornata è 8
	Aggiunto 6 in coda


La coda è: [(2, 2), (5, 3), (8, 6)]
Estraggo 2 con distanza 2
	Controllo la distanza del nodo 1
	La nuova distanza è 4
	La vecchia distanza 0


	Controllo la distanza del nodo 4
	La nuova distanza è 3
	La vecchia distanza None
	La distanza aggiornata è 3
	Aggiunto 4 in coda


La coda è: [(5, 3), (8, 6), (3, 4)]
Estraggo 4 con distanza 3
	Controllo la distanza del nodo 2
	La nuova distanza è 4
	La vecchia distanza 2


	Controllo la distanza del nodo 3
	La nuova distanza è 4
	La vecchia distanza 5
	La distanza aggiornata è 4
	Aggiunto 3 in coda


	Con

# Albero di Connessione minimo

Alle volte è utile trovare un albero di connessione che connette tutti i nodi di un grafo in modo tale che il peso dell'albero sia minimo (problema del Minimo Albero di Connessione o anche Minimum Spanning Tree

### Preposizione #1

Dati due sotto-insiemi di vertici detti V1 e V2

e sia *e* un arco del grafo G con peso minimo avente i due endpoints in V1 e V2 

Esisterà un albero di copertura minimo T avente e come uno dei suoi archi

# Algoritmo di Prim-Jarnik

L'idea dell'algoritmo è simile a quello di Dijkstra, viene infatti definita una nuvola di vertici che si espande per ogni iterazione

Ad ogni iterazione viene preso l'arco di peso minimo che collega un vertice interno alla nuvola con un vertice esterno

Il vertice esterno verrà quindi inserito nella nuvola e si passerà all'iterazione successiva

Anche in questo caso verrà mantenuta un'etichetta D[v]

In [8]:
#Nuova implementazione di minpop

def minpop(q):
    wmin, umin, vmin = q[0]
    for w,u,v in q:
        if w < wmin:
            wmin, umin, vmin = w, u, v
    q.remove((wmin, umin, vmin))
    return wmin, umin, vmin

In [9]:
def prim_jarnik(graph, start):
    
    # MST è il dizionario contenente il Minimum Spanning Tree
    # Cloud è invece la nuvola di vertici
    # edge_counter conta gli archi inseriti
    mst = dict()
    cloud = {start}
    edge_counter = 0
    # Tutti i vertici del grafo devono essere considerati
    while len(cloud) != len(graph):
        
        print('Vertici in cloud:',cloud)
        # Lista contenente tutti gli archi da considerare 
        # con i relativi pesi
        cross = []
        
        # Riempio la struttura cross con tutti gli archi da valutare
        for u in cloud:
            for v in graph:
                
                # Se k non è in cloud ma nella lista di adiacenza di v
                # Aggiungo l'arco negli archi da valutare
                if v not in cloud and v in graph[u]:
                    cross.append((graph[u][v],u,v))
        print('cross contiene gli archi', cross)
        # Estraggo il cammino minimo e lo inserisco nel MST
        w, u, v = minpop(cross)
        print("L'arco minimo è: ({}, {}, {})".format(w,u,v))
        mst[edge_counter] = (w, u, v)
        
        # Aggiungo il nuovo nodo in cloud
        # Incremento il contatore degli archi
        print('Aggiungo {} in cloud'.format(v))
        cloud.add(v)
        edge_counter += 1
        print('\n')
    
    return mst

In [10]:
mygraph = {
    1: {2:2,3:5,6:8},
    2: {1:2,4:1},
    3: {1:5,4:1,5:2},
    4: {2:1,3:1,6:5},
    5: {3:2,6:1},
    6: {1:8,4:5,5:1}
    }

In [11]:
print(prim_jarnik(mygraph, 1))

Vertici in cloud: {1}
cross contiene gli archi [(2, 1, 2), (5, 1, 3), (8, 1, 6)]
L'arco minimo è: (2, 1, 2)
Aggiungo 2 in cloud


Vertici in cloud: {1, 2}
cross contiene gli archi [(5, 1, 3), (8, 1, 6), (1, 2, 4)]
L'arco minimo è: (1, 2, 4)
Aggiungo 4 in cloud


Vertici in cloud: {1, 2, 4}
cross contiene gli archi [(5, 1, 3), (8, 1, 6), (1, 4, 3), (5, 4, 6)]
L'arco minimo è: (1, 4, 3)
Aggiungo 3 in cloud


Vertici in cloud: {1, 2, 3, 4}
cross contiene gli archi [(8, 1, 6), (2, 3, 5), (5, 4, 6)]
L'arco minimo è: (2, 3, 5)
Aggiungo 5 in cloud


Vertici in cloud: {1, 2, 3, 4, 5}
cross contiene gli archi [(8, 1, 6), (5, 4, 6), (1, 5, 6)]
L'arco minimo è: (1, 5, 6)
Aggiungo 6 in cloud


{0: (2, 1, 2), 1: (1, 2, 4), 2: (1, 4, 3), 3: (2, 3, 5), 4: (1, 5, 6)}


## Costo computazionale (Prim Jarnik)

L'algoritmo deve compiere:
    
    - N inserimenti nella nuvola e quindi N estrazioni dell'arco minimo
    - M valutazioni sugli archi

Le operazioni sulla coda di priorità vengono effettuate con un con una complessità di O(log(n))

Il costo computazionale dell'algoritmo sarà quindi:

\begin{align*}
O((m+n)log(n))
\end{align*}

# Algoritmo di Kruskal

Il funzionamento dell'algoritmo di Kruskal si basa su una foresta di cluster (cloud)

Ogni nodo è infatti un cluster a se

L'algoritmo poi gli archi in modo ordinato

L'arco *e* minimo che unisce due cluster diversi verrà aggiunto algi archi dell'albero e i due cluster si fonderanno in un unico cluster

Se invece l'arco *e* connette due vertici dello stesso cluster, questo verrà scartato 

Termina quando avremo un unico cluster 

L'algoritmo sfrutta poi due funzioni di appoggio

### Find Node
Cerca un determinato vertice nella lista delle cloud e torna il cluster contenente il nodo cercato

In [12]:
def find_node(clouds, node):
    
    # k è il numero associato alla nuvola
    # v è la lista contenente i nodi della nuvola
    for k, v in clouds.items():
        
        # trovato il nodo nella lista v torno il numero della nuvola
        if node in v:
            return k

### Merge Clouds
Prende due nuvole ed esegue il merge spostando tutti gli elementi dalla nuvola con numero associato più grande a quella più piccola

In [13]:
def merge_clouds(clouds,u,v):
    if u<v:
        # i nodi vengono spostati da v ad u
        for node in clouds[v]:
            clouds[u].append(node)
            clouds[v] = []
    else:
        for node in clouds[u]:
            clouds[v].append(node)
            clouds[u] = []
    return clouds

In [14]:
def kruskal(graph):
    
    # mst contiene il minimum spanning tree
    # edges contiene i vari archi da valutare
    # clouds contiene tutti i cluster
    # Cloud/Edge counter è un contatore di nuvole/archi
    mst, clouds = {}, {}
    edges = set()
    cloud_counter = 0
    edge_counter = 0
    
    # Inizializzo tutti i cluster
    # Ogni cluster è rappresentato da una lista
    for node in graph:
        clouds[cloud_counter] = [node]
        cloud_counter += 1
    print("clouds iniziale:", clouds)
        
    # Inizializzo tutti gli archi
    for u in graph.keys():
        for v in graph[u]:
            w = graph[u][v]
            # Se l'arco non è nella struttura edges lo aggiungo
            if (w,u,v) not in edges and (w,v,u) not in edges:
                edges.add((w,u,v))
    print("archi inziali:",edges)
    
    # Ordino gli archi in ordine crescende
    for edge in sorted(edges):
        print('valuto',edge)
        w, u, v = edge
        cloud_u = find_node(clouds, u)
        cloud_v = find_node(clouds, v)
        
        # Se i due nodi appartengono a due nuvole diverse
        # eseguo il merge
        if cloud_u != cloud_v:
            print('\tpuò essere eseguito il merge')
            clouds = merge_clouds(clouds, cloud_u, cloud_v)
            mst[edge_counter] = (w, u, v)
            edge_counter += 1
            
    return mst

In [15]:
print(kruskal(mygraph))

clouds iniziale: {0: [1], 1: [2], 2: [3], 3: [4], 4: [5], 5: [6]}
archi inziali: {(8, 1, 6), (1, 3, 4), (2, 3, 5), (1, 5, 6), (2, 1, 2), (5, 4, 6), (5, 1, 3), (1, 2, 4)}
valuto (1, 2, 4)
	può essere eseguito il merge
valuto (1, 3, 4)
	può essere eseguito il merge
valuto (1, 5, 6)
	può essere eseguito il merge
valuto (2, 1, 2)
	può essere eseguito il merge
valuto (2, 3, 5)
	può essere eseguito il merge
valuto (5, 1, 3)
valuto (5, 4, 6)
valuto (8, 1, 6)
{0: (1, 2, 4), 1: (1, 3, 4), 2: (1, 5, 6), 3: (2, 1, 2), 4: (2, 3, 5)}


## Costo computazionale (Kruskal)
L'ordinamento degli archi avviene in O(mlog(n)) tramite l'utilizzo di una coda di priorità

Va poi gestita la ricerca dei cluster da fondere che per N vertici avrà un costo di O((n+m)log(n))