# PRÁCTICA 3 - ALGORITMOS DE OPTIMIZACIÓN BASADO EN HORMIGAS

# Base

In [40]:
import os 
import sys
import time
import numpy as np
import matplotlib.pyplot as plt
import networkx as nx

In [14]:
def tsp_to_matrix(path):
    """
    Convierte un archivo .tsp a una matriz con todas las coordenadas encontradas en el mismo. Cada fila de la matriz correspondera
    a una lista de dos posiciones donde se guardara la coordenada x e y
    
    Parametros
        path : str
            Ruta donde se encuentra el archivo .tsp
            
    Return
        Devuelve un numpy array
    """
    # Comprobamos que exista el fichero
    if os.path.isfile(path):

        # Convertimos los datos en un matriz de dos dimensiones. Donde cada entrada 
        # es la posicion de una ciudad, columna 0 es la 'x' y la columna 1 la 'y'
        with open(path) as f:
            data = f.readlines()

        # Las 5 primeras lineas de los datos se pueden descartar. Y la ultima tambien
        size_data = len(data)
        data = data[6:size_data-1]
        matrix = np.array([])
        for line in data:
            # Dividimos la linea por espacios y seleccionamos las elementos 1 y 2
            aux = line.split(' ')
            
            # Comprobamos que la variable aux tenga 3 valores: [numero, coord x, coord y]
            if len(aux) > 3:
                fix_aux = []
                for c in aux: # Character en aux
                    # Descartamos los espacios
                    if c != '' and c != ' ': 
                        fix_aux += [c]
                        
                aux = fix_aux
            
            pos = np.array([float(aux[1]), float(aux[2])])

            if len(matrix) != 0:
                matrix = np.append(matrix, [pos], axis=0)
            else:
                matrix = np.array([pos])

        return matrix
    else:
        raise Exception("The file it doesn't exist")

In [15]:
def euclidean_distance(coord_node_a, coord_node_b):
    """
    Calcula la distancia euclidea entre dos nodos
    
    Parametros
        coord_node_a : list
            Lista de dos posiciones con las coordenadas x e y del primer nodo. Ejemplo: [x,y]
        coord_node_b : list
            Lista de dos posiciones con las coordenadas x e y del segundo nodo. Ejemplo: [x,y]
            
    Return
        Devuelve la distancia calculada redondeada(int)
    """
    xd = coord_node_a[0] - coord_node_b[0]
    yd = coord_node_a[1] - coord_node_b[1]
    return round(np.sqrt(xd*xd + yd*yd))

In [71]:
def create_sh_graph(m):
    """
    A partir de una matriz de coordenadas, se creara un grafo interconectando todos los nodos.
    
    Atributos de cada nodo:
        
        -'coord': lista de dos posiciones con las coordenadas x e y del nodo. Ejemplo: [x,y]
        -'nearest': lista de nodos mas cercanos al nodo. 
    
    Atributos de cada arista:
    
        -'distance': distancia entre los nodos que la forman
        -'pheromone': cantidad de feromonas que tiene la arista
        -'heuristic': heuristica de la arista
        
    Parametros
        m : numpy ndarray
            Matriz de coordenadas, donde cada fila es igual a una lista de dos valores: [x,y]
        init_pheromone : float
            Valor inicial de feromonas que tendra la arista
            
    Return
        Devuelve un objeto networkx
    """
    # Creamos el grafo
    g = nx.Graph()
    nodes_n = len(m) # Numero de nodos a crear
    
    # Creamos una lista de strings para nombrar los nodos y los aniadimos
    nodes_list = [] # Lista con los nombres
    for i in range(0,nodes_n):
        nodes_list = nodes_list + [f"Node_{i}"] # Guardamos el nombre
        g.add_node(nodes_list[i]) # Aniadimos el nodo
        g.nodes[nodes_list[i]]["coord"] = m[i] # Le asignamos las coordenadas
    
    # Aniadimos las aristas, interconectamos todos los nodos
    for i in range(0,nodes_n):
        for j in range(i+1,nodes_n):
            g.add_edge(nodes_list[i], nodes_list[j]) # Creamos la arista
            ed = euclidean_distance(m[i],m[j]) # Euclidean distance
            g.edges[nodes_list[i], nodes_list[j]]["distance"] = ed # Guardamos
            g.edges[nodes_list[i], nodes_list[j]]["heuristic"] = 1/ed # La  heuristica es igual a: 1 / distancia_entre_nodos
            g.edges[nodes_list[i], nodes_list[j]]["pheromone"] = 0 # Guardamos el valor de pheromonas inicial
            
    # Hacemos que cada nodo tenga una lista ordenada de los nodos mas cercanos
    for i in range(0,nodes_n):
        edges = list(g.edges(nodes_list[i])) # Conseguir aristas, transformamos objeto EdgeDataView a list()
        
        # Creamos una lista con las distancias de cada una de las aristas
        distances = []
        for j in range(0,len(edges)):
            edge_start = edges[j][0] # Nodo inicial de la arista - Arista j, elemento 0 (nodo inicial)
            edge_end = edges[j][1] # Nodo final de la arista - Arista j, elemento 1 (nodo final)
            edge_attributes = g.get_edge_data(edge_start,edge_end) # Devuelve un diccionario con los atributos de la arista
            distances = distances + [edge_attributes["distance"]] # Conseguimos el atributo deseado y lo guardamos en la lista
        
        # Ordenamos las aristas de menor a mayor distancia. Para ello comprobamos cual es la que tiene menor valor y aniadimos el final a la lista
        distances = np.array(distances) # Convertimos a un array numpy
        tidy_edges = [] # Aristas ordenadas
        max_value = distances.max() + 1 # Fijamos un numero maximo, de forma que cuando guardemos una arista. No vuelva a ser seleccionada
        for j in range(0,len(edges)):
            argmin = distances.argmin() # Seleccionamos la posicion del valor mas pequenio
            tidy_edges = tidy_edges + [edges[argmin][1]] # Seleccionamos la arista con argmin y luego seleccionamos el nodo final de la arista
            distances[argmin] = max_value
            
        # Aniadimos la lista al nodo
        g.nodes[nodes_list[i]]["nearest"] = tidy_edges
            
    return g
    

In [69]:
def draw_route(g, route, cost):
    """
    Muestra por pantalla la ruta en el grafo
    
    Parametros
        g : networkx
            Grafo de hormigas
        route : str list
            Lista con los nombres de los nodos recorridos
        cost : int
            Coste de la ruta recorrida
    """
    
    # OBTENEMOS TODAS LAS COORDENADAS
    nodes_list = list(g.nodes)
    x = [] # Lista de coordenadas x
    y = [] # Lista de coordenadas y
    for node in nodes_list:
        coord = g.nodes[node]['coord'] # Seleccionamos las coordenadas de un nodo
        x += [coord[0]] # Coord 0 es la coordenada x
        y += [coord[1]] # Coord 1 es la coordenada y
        
    plt.figure(figsize=(14, 8))
    plt.title(f"Coste del camino: {cost}")
    
    plt.plot(x,y,"blue") # Dibujamos la linea continua que une los puntos
    plt.scatter(x,y, c = "black") # Dibujamos todos los puntos
    plt.scatter(x[0],y[0],c="green") # Resaltamos el nodo inicial
    plt.scatter(x[-1],y[-1],c="red") # Resaltamos el nodo final
    
    plt.legend(["Ruta","Ciudades","Ciudad inicial","Ciudad final"])
    
    plt.show()    

## Construcción de grafos - Estructuras para ch130 y a280

In [17]:
def graph_construction():
    """
    Construye los grafos para los archivos .tsp: ch130 y a280. Una vez creados se almacenan en la 
    carpeta './build_graph'        
    """
    m = tsp_to_matrix("./tsp/ch130.tsp") # Cargamos los datos
    g = create_sh_graph(m) # Creamos le grafo
    nx.write_gpickle(g, "./build_graph/graph_ch130.gpickle") # Guardamos el grafo

    m = tsp_to_matrix("./tsp/a280.tsp") # Cargamos los datos
    g = create_sh_graph(m) # Creamos le grafo
    nx.write_gpickle(g, "./build_graph/graph_a280.gpickle") # Guardamos el grafo

graph_construction()
g_ch130 = nx.read_gpickle("./build_graph/graph_ch130.gpickle")
g_a280 = nx.read_gpickle("./build_graph/graph_a280.gpickle")

## Clase Hormiga

In [1]:
class ant:
    '''
    Contiene los atributos de una hormiga
    '''
    def __init__(self):
        '''
        Inicializador de  la clase
        '''
        self.route = [] # Lista de nodos por el que ha pasado la hormiga
        self.not_route = [] # Lista de nodos no visitados por la hormiga
        self.cost = 0 # Coste de la ruta seguida por la hormiga

# Algoritmos

## Greedy

### Teoría

Para generar la solución greedy recorreremos el grafo seleccionando el nodo más cercano al actual que no se haya seleccionado previamente

### Codigo

In [33]:
def greedy(g):
    """
    Calcula la solucion greedy del grafo. Para ello seleccionara la ciudad al nodo actual hasta recorrer todos los nodos
    
    Parametros
        g : networkx
            Grafo de hormigas
            
    Return
        Devuelve una lista de dos posiciones. [ruta_encontrada, coste_de_la_ruta]
    """
    
    # INICIALIZAMOS LOS PARAMETROS
    route = [] # Ruta greedy
    cost = 0 # Coste greedy
    
    # Establecemos el primer nodo
    nodes_list = list(g.nodes()) # Cogemos la lista de nodos
    init_node = nodes_list[0] # Seleccionamos el primero
    route += [init_node] # Lo aniadimos a la ruta
    
    # CALCULAMOS LA RUTA GREEDY
    gr, cost = greedy_route(g, route, cost) # Greedy route
    
    return gr, cost

#### Métodos auxiliares

In [35]:
def greedy_route(g, route, cost):
    """
    Calcula de forma recursiva el camino mas rapido del grafo
    
    Parametros
        g : networkx
            Grafo de hormigas
        route : list
            Lista vacia donde ir guardando la ruta
        cost : int
            Variable iniciada a 0 donde ir guardando el coste 
    
    Return
        Devuelve una lista de dos posiciones. [ruta_encontrada, coste_de_la_ruta]
    """
    # IMPLEMENTAMOS UN ALGORITMO RECURSIVO, PARAMOS CUANDO LA RUTA TENGA EL MISMO NUMERO DE ELEMTNOS QUE EL GRAFO
    if len(route) < g.number_of_nodes():
        # BUSCAMOS EL NODO MAS CERCANO AL ULTIMO NODO DE LA RUTA
        actual_node = route[len(route)-1] # Seleccionamos el ultimo nodo - Nodo actual
        
        # Obtenemos la lista de las ciudades mas cercanas a nuestro nodo actual
        nearest = g.nodes[actual_node]["nearest"]
        
        # Recorremos la lista de nodos cercanos y seleccionamos el primero que no haya sido seleccionado previamente
        for next_node in nearest:
            if (next_node in route) == False: # Si el siguiente nodo no esta la ruta lo agregamos
                route += [next_node] 
                edge_attributes = g.get_edge_data(actual_node, next_node) # Devuelve un diccionario con los atributos de la arista
                cost += edge_attributes["distance"]
                break # Salimos del bucle
                
        # VOLVEMOS A LLAMAR A LA FUNCION
        return greedy_route(g, route, cost)
    else:
        return route, cost

## Sistema de Hormigas (SH)

### Teoría

Las hormigas naturales son capaces de resolver problemas de camino mínimo como el TSP. Los algoritmos de OCH reproducen el compartamiento de las hormigas reales en una colonia artificial de hormigas para resolver problemas complejos de camino mínimo.

Cada hormiga _artificial_ es un mecanismoprobabilístico de construcción de soluciones al problema que utiliza:
* **Unos rastros de feromonas(_artificiales_), τ(tau)** que cambian con el tiempo para reflejar la experienca adquirida por los agentes en la resolución del problema
* **Información heurística η(eta)** sobre la instancia concreta del problema

     ![title](img/Hormigas_graph.png)
     
La **hormiga artificial** es un agente que:
* Recuerda los nodos que ha recorrido, utilizando para ello una lista de nodos visitados (**L**). Al finalizar, esta lista contiene la solución construida por la hormiga
* En cada paso, estando en la ciudad _r_ elige hacia qué ciudad _s_ moverse de entre las vecinas de _r_ que no hayan sido visitados aun, según una **regla probabilística de transición**
* La decición tomada por esta _regla_ depende de la preferencia heurística η_rs = 1/d_rs y la feromona τ_rs
    
 ![title](img/Regla_probabilistica_de_transicion.png)
    
**Actualización de feromona**
1. **APORTE**: Se usa una retroalimentación positiva para reforzar en el futuro los componentes de la buenas soluciones mediante un aporte adicional de feromona. **Cuanto mejor sea la solución, más feromona se aporta**
2. **EVAPORACIÓN**: Se usa la evaporación de feromona para evitar un incremento ilimitado de los rastros de feromona y para permitir olvidar las malas decisiones tomadas

La evaporación es la misma para todos los rastros, eliminándose un porcentaje de su valor actual, según un parámetro de evaporación ρ(ro), el cual toma valor en el intervalo: 0≤ρ≤1

Es un mecanismo de evaporación más activo que la natural, lo que evita la perduración de los rastros de feromon y, por tanto, el estancamiento de óptimos locales.

   ![title](img/Regla_actualizacion_feromona.png)

**Algoritmo**

   ![title](img/sh_1.png)
   ![title](img/sh_2.png)

### Codigo

In [None]:
def sh(seed, g, n, m, alpha, beta, ro):
    """
    Calcula el camino del grafo usando un algoritmo de hormigas
    
    Parametros
        seed : int 
            Semilla con la que generar numeros aleatorios
        g : networkx
            Grafo creado con el metodo: create_sh_graph(m)
        n : int
            Numero de ejecuciones a realizar
        m : int
            Numero de hormigas
        alpha : float
            Valor que establece la importania de la informacion memoristica en la regla probabilistica de transicion 
        beta : float 
            Valor que establece la importancia de la información heristica en la regla probabilistica de transicion 
        ro : float
            Valor del parametro de evaporacion en la actualizacoin de feromona (0<ro<1)
    Return
        Devuelve una lista de tres posiciones: [best_actual_route, best_actual_cost, ev]
    """
    
    # CALCULAMOS EL VALOR DE FEROMONAS INICIAL Y LO ESTABLECEMOS
    gr, gr_cost =  greedy(g) # Para ello necesitamos calcular el coste de la solucion greedy
    ro_init = 1 / (g.number_of_nodes() * gr_cost) # Formula: init_pheromone = 1 / (number of nodes * cost of greedy solution)
    init_pheromones(g, ro_init) # Inicializa las feromonas de cada arista
    
    # INICIALIZAMOS LOS PARAMETROS
    np.random.seed(seed) # Inicializamos la semilla
    ev = 0 # Numero de evaluaciones realizadas
    t = 0 # Variable que usaremos para actualizar el tiempo que llevamos buscando una solucion
    time_start = time.time()
    max_time = 300 # 300s = 5 min
    
    L = [] # Matriz de rutas. Nodos visitados por cada hormiga. Lista de listas
    not_L = [] # Matriz de nodos no visitados. Nodos no visitados para cada hormiga. Lista de listas
    C = [] # Lista de costes de cada camino recorrido por las hormigas
    init_node = list(g.nodes)[0] # Nodo inicial
    
    best_global_route = [] # Mejor ruta encontrada
    best_global_cost = sys.maxsize # Coste de la mejor ruta
    
    # BUCLE DE ITERACIONES
    i = 0
    t = time.time() - time_start # Tiempo transcurrido desde time_start
    while i < 10000*n and t < t_max:
        # ASIGANAMOS EL NODO INICIAL PARA CADA HORMIGA
        for j in range(0,m):
            L += [[init_node]] # Hacemos que L sea una lista de listas
            not_visited += [list(g.nodes)[1:]] # Cogemos todos los nodos menos el primero
        
        # CADA HORMIGA ENCUENTRA UNA SOLUCION
        L, C = ants_find_route(g, L, not_L, C, alpha, beta) # Devuelve la matriz de rutas actualizada
        
        # ESCOGEMOS LA MEJOR SOLUCION ENCONTRADA
        index = C.index(min(C)) # Seleccionamos la ruta que tenga menor coste
        best_actual_route = L[index] # Guardamos la ruta
        best_actual_cost = C[index] # Guardamos el coste
        
        # ACTUALIZAMOS LAS FEROMONAS

        # COMPROBAMOS SI LA SOLUCION ACTUAL ES MEJOR QUE LA MEJOR ENCONTRADA HASTA EL MOMENTO
        if best_actual_cost < best_global_cost:
            best_global_cost = best_actual_cost
            best_actual_route = best_actual_route.copy()
            
    return best_actual_route, best_actual_cost, ev
    

#### Métodos auxiliares

In [72]:
def init_pheromones(g, init_pheromone):
    """
    Inicializa el parametro 'pheromone' de todas las aristas del grafo
    
    Parametros
        g : networkx
            Grafo de hormigas
        init_pheromone : float
            Valor de feromonas inicial
    """
    for edge in g.edges: # edge es una tupla con el nombre de cada nodo que forma la arista
        g.edges[edge[0],edge[1]]['pheromone'] = init_pheromone

In [74]:
def ants_find_route(g, L, not_L, C, alpha, beta):
    """
    Calcula de forma recursiva el recorrido de una o varias hormigas por el grafo
    
    Parametros
        g : networkx
            Grafo de hormigas
        L : list
            
        not_L : list
        
        C : list
        
        alpha : int
        
        beta : int
        
    Return
    
    """
    if len(L[0]) < g.number_of_nodes():
        m = len(L) # Numero de hormigas
        # Calculamos el camino a seguir por cada hormiga
        for i in range(0,m):
            actual_node = L[i][-1] # Cogemos el ultimo nodo visitado para la hormiga i
            
            L[i] += transition_rule(g, actual_node, not_L[i], alpha, beta) # Aniadimos el nuevo nodo alcanzado
            not_L[i].remove(L[i][-1]) # Eliminamos el nodo que acabamos de meter en L[i]
            
            C[i] += g.edges[L[i][-2], L[i][-1]]# Actualizamos el coste del camino de la hormiga i. Para ello seleccionamos los 2 ultimos nodos aniadidos a la ruta
            
        return ants_find_route(g, L, not_L, C, alpha, beta)
    else:
        return L.copy(), C.copy()

In [None]:
def transition_rule(g, actual_node, not_visited, alpha, beta):
    """
    Calcula el nodo siguiente de la hormiga
    
    Parametros
        g : networkx
        
        actual_node : str
        
        not_visited : list
        
        alpha : int
        
        beta : int
        
    Return
    
    """
    
    '''
    La regla de transicion nos cual es el siguiente nodo a seguir. Para ello emplearemos
    la siguiente formula
    
    La probabilidad de ir desde r hasta s es igual a:
    probabilidad(r,s) = (ro_rs**alpha * eta_rs**beta) / (sum(ro_ru)**alpha * eta_ru**beta)
    
    - ro_rs es la cantidad de feromonas de la arista entre r y s
    - eta_rs cantidad de inf. heuristica de la arista entre r y s
    - ro_ru cantidad de feromonas para cada una de las aristas alcanzables desde r
    - eta_ru cantidad de inf. heuristica para cada una de las aristas alcanzables desde r
    
    Una vez calculado todas las probabilidades elegimos la que tiene mayor probabilidad
    '''
    p = [] # Probabilidad de cada arista
    ro = [] # Feromona de cada arista
    eta = [] # Heuristica de cada arista
    
    # OBTENEMOS LOS ATRIBUTOS DE CADA ARISTA
    for i in range(0,len(not_visited)):
        edge = g.edges[actual_node, not_visited[i]] # Arista
        ro += edge['pheromone'] # Obtenemos la feromona
        eta += edge['heuristic'] # Obtenemos la heuristica
        
    # Convertimos a un numpy array para facilitar los calculos
    ro_list = np.array(ro)
    eta_list = np.array(eta)
    
    # CALCULAMOS LA PROBABILIDAD DE CADA ARISTA
    addition = sum(ro_list**alpha * eta_list**beta)  # sumatorio
    for i in range(0,len(not_visited)):
        # Formula explicada arriba
        p += (ro[i]**alpha * eta[i]**beta) / addition
    
    # SELECCIONAMOS LA ARISTA CON MEJOR PROBABILIDAD
    index = p.index(max(p)) # Buscamos el index en la lista de probabilidad, eso nos dara el nodo no visitado a seleccionar
    
    return not_visited[index]