## Algoritmo genetico per il problema del commesso viaggiatore

Lo scopo di questo esercizio è di risolvere il problema del commesso viaggiatore (o Traveling Salesman Problem TSP) tramite un algoritmo genetico. 
Gli algoritmi genetici cercano di sfruttare meccanismi simili a quelli dei processi di evoluzione Darwiniana, per "evolvere" una popolazione inziale di soluzioni "approssimate" di un certo problema in una popolazione costituita dalle soluzioni esatte (o molto prossime) dello stesso. Per fare questo gli algortimi genetici incorporano la $\textit{stocasticità}$ insieme alla $\textit{selezione naturale}$ e infine anche l'$\textit{incrocio genetico}$.

Nel problema del commesso viaggiatore la soluzione è rappresentata dal cammino più breve che permette al commesso di attraversare tutte le città di una mappa e tornare a quella di partenza. Abbiamo studiato questo problema nel caso in cui il commesso debba attraversare 30 città disposte:

1) lungo una circonferenza 

2) casualmente all'inteno di un quadrato.

Il primo di questi casi ha una soluzione che è intuibile a priori, ovvero il cammino più breve è il poligono inscritto, almeno per un numero sufficientemente alto di città $\textit{uniformemente}$ distribuite lungo la circonferenza. È quindi un caso di fondamentale importanza per testare se l'algoritmo scritto funziona correttamente, e poter poi attaccare il secondo problema.


### L'evoluzione della popolazione 

Una volta generata una mappa delle città, e avendole univocamente identificate con dei numeri interi da 0 a 29, abbiamo inizializzato una popolazione di $N_{pop} = 900$ individui come permutazioni casuali della configurazione ordinata $\{0, 1, 2, ..., 29\}$. Il vettore di interi che identifica un'individuo è detto $DNA$ dell'individuo.

A questo punto veniva dato il via all'evoluzione per una durata totale di $200$ generazioni, dove una generazione era caratterizzata dalle seguenti operazioni sugli individui:
- $selezione$ di una coppia di individui in base alla loro "fitness", ovvero, nel nostro caso, alla lunghezza $L$ del relativo percorso: in particolare abbiamo utilizzato una roulette truccata che favorisse la scelta degli individui migliori, rispecchiando in qualche modo il processo di selezione nturale. La funzione costo da noi scelta è stata la "lunghezza l2" del cammino, ovvero, detto $\gamma$ il percorso,

$$
L = \sum_{i\in\gamma} |x(i) - x(i-1)|^2 + |y(i) - y(i-1)|^2
$$
- mutazioni genetiche casuali e $\textit{mutuamente esclusive}$ (cioè un individuo ad ogni generazione riceve $\textit{al più}$ una mutazione) colpivano ciascuno dei due individui con una probabilità $p_{mute} = 10$%. Le mutazioni casuali da noi implementate sono: lo scambio di due elementi o di due interi segmenti del $DNA$, l'inversione di un segmento e infine lo slittamento totale del $DNA$ di un certo numero di posizioni.
- incrocio tra la coppia di individui scelti con una certa probabilità $p_{cross} = 50$%. In tal caso i due individui venivano rimpiazzati da due discendenti, ottenuti combinando pezzi del loro $DNA$.

Quello che permette all'algoritmo di convergere è la fase di selezione, mentre le altre fasi servono a introdurre nuovi individui che possono però essere peggiori o migliori dei loro "antenati".

### Grafici e risultati 

Presentiamo qui il risultato delle nostre simulazioni in maniera duplice: da un lato mostriamo l'evoluzione del cammino migliore presente nella popolazione con il passare del tempo; dall'altro mostriamo un grafico della lunghezza media dei cammini alvariare del numero di generazioni. Presentiamo i risultati prima per il problema sul cerchio e poi nel quadrato.

$\textit{Nota}$: il notebook è in modalità interattiva, e si consiglia di stoppare le animazioni con l'apposito pulsante che compare in alto a destra di fianco ai grafici per evitare "sovrapposizioni" tra animazioni diverse.

In [16]:
%matplotlib notebook
import matplotlib 
import matplotlib.pyplot as plt
import numpy as np
from matplotlib import animation
from IPython.display import HTML

def lenght(path, xcoord, ycoord):
    N = len(path)
    l = 0
    for i in range(N):
        l += (xcoord[path[i-1]] - xcoord[path[i]])**2 + (ycoord[path[i-1]] - ycoord[path[i]])**2 
    
    return l

### TSP sul cerchio

In [21]:
# Le seguenti funzioni servono per sfruttare il modulo 'animation' 

# Funzione di inizializzazione: plotta il background di ogni frame
def init():
    line.set_data([], [])
    text.set_text('')
    return line, text

# Funzione di animazione: viene chiamata sequenzialmente
def animate(i, argu):
    if argu == 1:
        path = np.loadtxt("Circular/CirclePath."+str(i+1)+".final")
    if argu == 2:
        path = np.loadtxt("Square/SquarePath."+str(i+1)+".final")

    path = path.astype(int)
    L = len(path)
    xpairs = []
    ypairs = []
    for k in range(L-1):
        xends = [x[path[k]], x[path[k+1]]]
        yends = [y[path[k]], y[path[k+1]]]
        xpairs.append(xends)
        ypairs.append(yends)
    xends = [x[path[L-1]], x[path[0]]]
    yends = [y[path[L-1]], y[path[0]]]
    xpairs.append(xends)
    ypairs.append(yends)
    line.set_data(xpairs, ypairs)
    
    l = lenght(path, x, y)
    text.set_text('Lenght = %.1f' % l)
    return line, text


# call the animator.  blit=True means only re-draw the parts that have changed.

# save the animation as an mp4.  This requires ffmpeg or mencoder to be
# installed.  The extra_args ensure that the x264 codec is used, so that
# the video can be embedded in html5.  You may need to adjust this for
# your system: for more information, see
# http://matplotlib.sourceforge.net/api/animation_api.html
#anim.save('basic_animation.mp4', fps=30, extra_args=['-vcodec', 'libx264'])

In [22]:
fig = plt.figure()
ax = plt.axes(xlim=(-2, 2), ylim=(-2, 2))
plt.axis('equal')
# Set line variable for animate function
line, = ax.plot([], [], lw=2)
# Set text to add to the plot
text = ax.text(0.8, 0.9, '')

x, y = np.loadtxt("circle.start", usecols = (0,1), unpack = 'true')
plt.scatter(x, y, color = 'red')
plt.title('Evoluzione del percorso')

# Call the animation
anim = animation.FuncAnimation(fig, animate, fargs = (1,), init_func=init,
                               frames=200, interval=100, blit=True)

# Si consiglia di stoppare l'animazione con l'apposito pulsante (in alto a destra) 
# quando il cammino si è stabilizzato, per evitare problemi con le celle seguenti che
# utilizzano ancora la funzione ANIMATE definita sopra...

<IPython.core.display.Javascript object>

In [19]:
fig = plt.figure()
Fitness = np.loadtxt("Circular/Fitness.dat")
gen = len(Fitness)
n = np.arange(gen)
plt.plot(n, Fitness)
plt.xlabel('Generation number')
plt.ylabel('Lunghezza')
plt.grid()

print("Lunghezza media finale: " ,Fitness[gen-1])

<IPython.core.display.Javascript object>

Lunghezza media finale:  4.89762


Nell'animazionei punti rossi rappresentano le città, mentre in blu compare il percorso del commesso. Dal secondo grafico ci accorgiamo che 200 generazioni sono più che sufficienti per raggiungere una sorta di equilibrio: il costo medio non diminuisce più, ma rimane ad una valore circa costante di $4.89$ mentre sappiamo dall'animazione che il percorso più breve è presente nella popolazione ed ha un costo di $2.3$.
### TSP nel quadrato

In [23]:
fig = plt.figure()
ax = plt.axes(xlim=(-2, 2), ylim=(-2, 2))
plt.axis('equal')
line, = ax.plot([], [], lw=2)
text = ax.text(0.8, 0.95, '')
x, y = np.loadtxt("square.start", usecols = (0,1), unpack = 'true')
plt.scatter(x, y, color = 'red')
plt.title('Evoluzione del percorso')

# call the animator.  blit=True means only re-draw the parts that have changed.
anim = animation.FuncAnimation(fig, animate, init_func=init, fargs = (2,),
                               frames=200, interval=100, blit=True)


<IPython.core.display.Javascript object>

In [27]:
fig = plt.figure()
Fitness = np.loadtxt("Square/Fitness.dat")
gen = len(Fitness)
n = np.arange(gen)
plt.plot(n, Fitness)
plt.xlabel('Generation number')
plt.ylabel('Lunghezza')
plt.grid()

print("Lunghezza media finale: " ,Fitness[gen-1])

<IPython.core.display.Javascript object>

Lunghezza media finale:  1.40921


Nel caso del quadrato giustamente l'algoritmo è più lento a trovare la soluzione in particolare vicino alle coordinate $(0.6, 0.8)$ dove si ammassano 4 città molto vicine, ma $200$ rimane un numero di generazioni sufficienti. La lunghezza media a fine simulazione è di $1.41$, molto prossima alla lunghezza di $1$ del cammino migliore: questo indica che la popolazione è molto omogenea, con i vari individui che si discostano solo per tratti piccoli del percorso che cambiano di poco la lunghezza.