# Algoritmo di 2-approssimazione per TSP

In [189]:
!pip install ipython-autotime
#%load_ext autotime

Collecting ipython-autotime
  Using cached https://files.pythonhosted.org/packages/59/0d/f5e65097c5b4847c36d2b4ad04995a04fc6b6c4c2587b052c7707a195ab0/ipython_autotime-0.1-py2-none-any.whl
Installing collected packages: ipython-autotime
Successfully installed ipython-autotime-0.1


In [190]:
import os
import time
import math
from heap import * 

Imposto la directory in cui sono presenti i dataset:

In [191]:
ds_dir = "tsp_dataset/"

Definisco una lista con i nomi dei file del dataset dato e le soluzioni ottime date per ciascun file, da confrontare poi con le soluzioni calcolate:

In [192]:
data = [
    ["burma14.tsp", 3323],
    ["ulysses16.tsp", 6859],
    ["ulysses22.tsp", 7013],
    ["eil51.tsp", 426],
    ["berlin52.tsp", 7542],
    ["kroD100.tsp", 21294],
    ["kroA100.tsp", 21282],
    ["ch150.tsp", 6528],
    ["gr202.tsp", 40160],
    ["gr229.tsp", 134602],
    ["pcb442.tsp", 50778],
    ["d493.tsp", 35002],
    ["dsj1000.tsp", 18659688]
]

Definisco una funzione parser che legga i file nel formato specificato nella consegna. Questa ritorna t, la stringa che indica il tipo di coordinate contenute nel file e V, lista contenente i nodi e le loro coordinate.

In [193]:
def parser(file):
    
    lines = open(ds_dir + file, "r").readlines()
    index_start_coordinates = 0
    cont = 0
    V = []

    for line in lines:
      cont += 1
      if line.startswith("EOF") or line.startswith(" EOF"):
        break
      elif line.startswith("DIMENSION"):
        n = int(line.split(":")[1][1:])
      elif line.startswith("EDGE_WEIGHT_TYPE"):
        t = line.split(":")[1][1:-1] # TODO: remove space at the end
      elif line.startswith("NODE_COORD_SECTION"):
        index_start_coordinates = cont
      elif index_start_coordinates > 0:
        V.append((int(line.split()[0]) - 1, [float(line.split()[1]), float(line.split()[2])])) # (i, [x_value, y_value])
    #n = int(lines[3].split()[1]) #.split()[0] # extract number of vertexes
    #t = lines[4].split()[1]

    return t, V

Definisco la funzione di weight che converte le coordinate date nel file letto. A questa vengono passati due nodi, u e v, e il tipo delle coordinate in cui questi sono rappresentati. La funzione ritorna quindi il peso dell'arco che li connette.

In [194]:
def weight (u, v, t):
  if t == 'EUC_2D':
    return round(math.sqrt(sum([(a - b) ** 2 for a, b in zip(u, v)])))
  else:
    PI = 3.141592
    deg_xu = int(u[0])
    min_xu = u[0] - deg_xu
    rad_xu = PI * (deg_xu + 5.0 * min_xu/ 3.0) / 180.0

    deg_yu = int(u[1])
    min_yu = u[1] - deg_yu
    rad_yu = PI * (deg_yu + 5.0 * min_yu/ 3.0) / 180.0

    deg_xv = int(v[0])
    min_xv = v[0] - deg_xv
    rad_xv= PI * (deg_xv + 5.0 * min_xv/ 3.0) / 180.0

    deg_yv = int(v[1])
    min_yv = v[1]- deg_yv
    rad_yv = PI * (deg_yv + 5.0 * min_yv/ 3.0) / 180.0

    RRR = 6378.388
    q1 = math.cos(rad_yu - rad_yv)
    q2 = math.cos(rad_xu - rad_xv)
    q3 = math.cos(rad_xu + rad_xv)
    return (int) (RRR * math.acos(0.5 * ((1.0 + q1) * q2 - (1.0 - q1) * q3)) + 1.0)
    

Definisco la classe COMPLETE_GRAPH che rappresenta in maniera specifica i grafi completi mantenendo una matrice a due dimensioni che contiene i pesi degli archi.
Questa ha i seguenti metodi:
- __init__(self, n): inizializzo total_nodes, che indica il numero di nodi totali del grafo, e creo una matrice bidimensionale di pesi (weights) che rappresenta il grafo completo, queste vengono tutte inizializzate a 0. La complessità di questa operazione è O(n^2);
- set_weight(self, u, v, weight): dati due nodi u e v, inserisce nella matrice il peso dell'arco che li connette, questa operazione è O(1);
- get_weight(self, u, v): dati  i due nodi u e v, restituisce il peso dell'arco che gli connette, questa operazione è O(1);
- ham_circ_weight(self, ham_circ): dato in input un circuito hamiltoniano ham_circ, la funzione calcola il peso totale dei nodi del circuito dato. Questa funzione ha peso O(n) dove n rappresentail numero di nodi del circuito dato.

In [195]:
class COMPLETE_GRAPH:

    def __init__(self,n):
        self.weights = [ [0 for i in range(n)] for j in range(n)]
        self.total_nodes = n

    def set_weight(self, u, v, weight):
        if u != v: 
            self.weights[u][v] = self.weights[v][u] = weight
    
    def get_weight(self, u, v): 
        return self.weights[u][v]

    def ham_circ_weight(self, ham_circ):
        total_weight = 0
        for j in range(1, len(ham_circ)):
            i = j - 1
            total_weight += self.get_weight(ham_circ[i], ham_circ[j])
        return total_weight


Metodo che, dato in input il nome del file contente i dati relativi al grafo, lo genera passando per il precedente metodo di parsing, definendo un oggetto COMPLETE_GRAPH e, per ciascun arco del grafo, inserirne i pesi calcolati con il precedente metodo weight.
Questo metodo ritorna quindi il grafo completo appena creato.

In [196]:
def graph_from_file(file):

    t, V = parser(file)
    G = COMPLETE_GRAPH(len(V))

    xy_pairs = [(x,y) for x in range(len(V)) for y in range(x + 1, len(V))]
    for (x,y) in xy_pairs:
        curr_weight = weight(V[x][1], V[y][1], t)
        G.set_weight(x, y, curr_weight)
        
    return G

Implemento l'algoritmo di Prim tramite un metodo che prende in input il grafo G e l'indice del vertice da cui far partire il MST. Questa funzione utilizza la struttura dati heap, definita in un file a parte.

In [197]:
def Prim(G, root):

    n = G.total_nodes
    
    k = dict()
    p = dict()
    for i in range(n):
        k[i] = G.get_weight(root, i)
        p[i] = root

    H = heap()
    
    indexs = list(range(n))
    indexs.remove(root)

    for i in indexs: 
        H.add(i, k[i])

    while not H.isEmpty() :
        u = H.extractMin()
        for v in H.A:
            if G.get_weight(u, v) < k[v]:
                k[v] = G.get_weight(u,v)
                p[v] = u
                H.decreaseKey(v, k[v])

    return p

def create_heap(n, k, root):
    
    

    return H

Definisco la funzione MST_TO_TREE che, data in input la mappa dei predecessori ciascun nodo, la converte in un albero

In [198]:
def MST_TO_TREE(predec):

    if len(predec) == 0:
        return None

    if len(predec) == 1:
        nodo, padre = predec.popitem()
        return {padre: [nodo]}

    nodo, padre = predec.popitem()

    tree = MST_TO_TREE(predec)

    if padre in tree:
        tree[padre].append(nodo)
    else:
        tree[padre] = [nodo]

    return tree



Implemento la funzione di 2-approssimazione che, dato in input il grafo completo pesato G, risolve il problema TSP sul grafo G usando il suo albero di copertura minimo di G.
Ritorna una soluzione 2-approssimata, ovvero il valore massimo di questa è 2 volte la soluzione ottima, definita precedentemente per ciascun file nella lista `data`.
Questo metodo restituisce un ciclo hamiltoniano che visita tutti i nodi.

In [199]:
def TWO_APPROX_TSP(G):

    MST = Prim(G, 0)
    TREE = MST_TO_TREE(MST)

    HAM_CYCLE = preorder(TREE, 0)
    HAM_CYCLE.append(0)

    return HAM_CYCLE


Definisco la funzione preorder che, presi in input tree (la mappa dei successori) e u (vertice di partenza), ritorna una lista della visita in profondità dell'albero a partire dal nodo passato.

In [200]:
def preorder(tree, u):
    
    if u not in tree:
        return [u]
    
    A = [u]
    for v in tree[u] :
        if v != u : 
            A = A + preorder(tree, v)

    return A


Eseguo l'algortimo appena definito per ciascun file presente nel dataset:

In [201]:
for file, optimal_solution in data:

    G = graph_from_file(file)

    start_time = time.time()

    current_solution = TWO_APPROX_TSP(G)
    current_solution = G.ham_circ_weight(current_solution)

    total_time = time.time() - start_time
    total_time = '%.2E' % total_time

    errore = round(float(current_solution - int(optimal_solution)) / int(optimal_solution) * 100, 2)

    print("File name: ", file)
    print("Optimal solution: ", optimal_solution)
    print("Costo soluzione: ", str(current_solution))
    print("Tempo di esecuzione: ", str(total_time))
    print("Percentuale di errore: ", str(errore))    

    print()

File name:  burma14.tsp
Optimal solution:  3323
Costo soluzione:  4003
Tempo di esecuzione:  3.57E-04
Percentuale di errore:  20.46

File name:  ulysses16.tsp
Optimal solution:  6859
Costo soluzione:  7788
Tempo di esecuzione:  4.55E-04
Percentuale di errore:  13.54

File name:  ulysses22.tsp
Optimal solution:  7013
Costo soluzione:  8308
Tempo di esecuzione:  4.70E-04
Percentuale di errore:  18.47

File name:  eil51.tsp
Optimal solution:  426
Costo soluzione:  567
Tempo di esecuzione:  1.11E-03
Percentuale di errore:  33.1

File name:  berlin52.tsp
Optimal solution:  7542
Costo soluzione:  10402
Tempo di esecuzione:  2.36E-03
Percentuale di errore:  37.92

File name:  kroD100.tsp
Optimal solution:  21294
Costo soluzione:  28599
Tempo di esecuzione:  4.72E-03
Percentuale di errore:  34.31

File name:  kroA100.tsp
Optimal solution:  21282
Costo soluzione:  30516
Tempo di esecuzione:  3.47E-03
Percentuale di errore:  43.39

File name:  ch150.tsp
Optimal solution:  6528
Costo soluzione:  