Copyright **`(c)`** 2025 Giovanni Squillero `<giovanni.squillero@polito.it>`  
[`https://github.com/squillero/computational-intelligence`](https://github.com/squillero/computational-intelligence)  
Free under certain conditions — see the [`license`](https://github.com/squillero/computational-intelligence/blob/master/LICENSE.md) for details.  

In [1]:

import logging
from itertools import combinations

import numpy as np
import matplotlib.pyplot as plt
import networkx as nx

from icecream import ic

Cost: $d + (d \cdot \alpha \cdot w)^\beta$ with $\alpha \ge 0$ and $\beta \ge 0$

## ACO 

In [3]:
import numpy as np
import networkx as nx

class ACO_Solver:
    def __init__(self, problem, n_ants=15, n_iterations=50, alpha_aco=1.0, beta_aco=3.0, rho=0.2):
        self.prob = problem
        self.graph = problem.graph
        self.n_ants = n_ants
        self.n_iterations = n_iterations
        self.alpha_aco = alpha_aco
        self.beta_aco = beta_aco
        self.rho = rho
        
        # Precalcoliamo i cammini minimi per "sapere dove andare"
        self.all_pairs_dist = dict(nx.all_pairs_dijkstra_path_length(self.graph, weight='dist'))
        self.dist_to_depot = nx.shortest_path_length(self.graph, target=0, weight='dist')
        
        # tutti i feronomoni inizializzati a 1.0, stessa probabilità
        self.pheromones = {edge: 1.0 for edge in self.graph.edges()}
        for (u, v) in list(self.pheromones.keys()):
            self.pheromones[(v, u)] = 1.0

    def get_eta(self, u, v, current_weight, visited_gold, current_trip_cost):
        # quanto è "buono" andare da u a v
           
        d_uv = self.graph[u][v]['dist']
        
        if current_weight == 0:
            cost_imm = current_trip_cost + d_uv
            #print("current_weight is zero, adjusting eta calculation, portiamo l'esplorazione verso città con oro.")
            # cerca la città raggiungibile con oro più vicina
            gold_cities = [n for n in self.graph.nodes if n not in visited_gold and self.graph.nodes[n]['gold'] > 0]
            if gold_cities:
                nearest_gold = min(gold_cities, key=lambda x: self.all_pairs_dist[u][x])
                d_to_gold = self.all_pairs_dist[u][nearest_gold]
                cost_andata = cost_imm + d_to_gold  # sommo al trip totale la distanza per arrivare all'oro (senza carico)
                # dalla città con oro a tornare al deposito, considerando il peso dell'oro raccolto
                distanza_ritorno= self.dist_to_depot[nearest_gold]
                cost_ritorno= distanza_ritorno + (self.prob.alpha * distanza_ritorno * self.graph.nodes[nearest_gold]['gold']) ** self.prob.beta
                return 1.0 / (cost_andata + cost_ritorno + 1e-9)
            else:
                # nessuna città con oro rimasta, procedi normalmente
                print("No more gold cities reachable from node {}.".format(u))
                return 0
        else:
            # stiamo già trasportando dell'oro
            cost_imm = d_uv + (self.prob.alpha * d_uv * current_weight) ** self.prob.beta
            # di ritorno al deposito
            # raccolgo l'oro nella città v se non l'ho già fatto e considero il costo di tornare indietro 
            gold_v= self.graph.nodes[v]['gold'] if v not in visited_gold else 0
            new_weight = current_weight + gold_v
            # calcolo costo per tornare al deposito 
            d_deposito = self.all_pairs_dist[v][0]
            cost_fut = d_deposito + (self.prob.alpha * d_deposito * new_weight) ** self.prob.beta

            return 1.0 / (current_trip_cost + cost_imm + cost_fut + 1e-9)


    def _build_ant_path(self):
        current_node = 0
        visited_gold = {0}
        path = [0]
        total_cost = 0
        current_weight = 0
        num_total_nodes = len(self.graph.nodes)
        print("FORMICA NUOVA")
        print("0-> ", end="")
        
        current_trip_cost=0
        current_trip=[0]

        while len(visited_gold) < num_total_nodes:
            neighbors = list(self.graph.neighbors(current_node))
            
            # --- SOLUZIONE AL LOOP ---
            # Selezioniamo solo i vicini che portano verso l'oro o che sono "nuovi"
            # Impediamo il ritorno immediato al nodo precedente se non c'è oro
            valid_neighbors = []
            for n in neighbors:
                # Non tornare al deposito se non abbiamo oro (già presente)
                if n == 0 and current_weight == 0: continue

                # se il carico è zero, non torniamo indietro
                if current_weight == 0 and n in current_trip: continue


                # Evita di rimbalzare tra due nodi senza oro
                if len(path) > 1 and n == path[-2] and current_node in visited_gold:
                    continue
                valid_neighbors.append(n)
            
            if not valid_neighbors: 
                print("Warning: no valid neighbors, relaxing constraints.")
                valid_neighbors = neighbors

            probs = []
            for n in valid_neighbors:
                edge = (current_node, n) if (current_node, n) in self.pheromones else (n, current_node)
                tau = self.pheromones[edge]
                eta = self.get_eta(current_node, n, current_weight, visited_gold, current_trip_cost)
                
                # A COSA SERVONO ALPHA ACO E BETA ACO?
                probs.append((tau ** self.alpha_aco) * (eta ** self.beta_aco) )

            probs = np.array(probs) / sum(probs)
            next_node = np.random.choice(valid_neighbors, p=probs)

            # Calcolo costo e aggiornamento
            d = self.graph[current_node][next_node]['dist']
            current_trip_cost += d + (self.prob.alpha * d * current_weight) ** self.prob.beta
            total_cost += d + (self.prob.alpha * d * current_weight) ** self.prob.beta

            
            if next_node not in visited_gold:
                # Raccogli l'oro
                # NOTA posso valutare di prenderne solo una parte quando vantaggioso, PER DOPO
                current_weight += self.graph.nodes[next_node]['gold']
                visited_gold.add(next_node)

                
            
            current_node = next_node
            print(str(current_node), end="")

            
            if current_node ==0 :
                print("\n Ritornato al deposito, peso attuale: {}, costo totale finora: {}".format(current_weight, total_cost))
                current_weight = 0  # svuota il peso al deposito 
                current_trip_cost=0
                current_trip=[0]
                print("0-> ", end="")
            else:
                print("->", end="")
                current_trip.append(current_node)
                
            path.append(current_node)
            

        # Ritorno forzato al deposito
        if current_node != 0:
            ret_path = nx.shortest_path(self.graph, source=current_node, target=0, weight='dist')
            for i in range(len(ret_path)-1):
                u, v = ret_path[i], ret_path[i+1]
                total_cost += self.prob.cost([u, v], current_weight) # Usiamo la funzione del problema
                path.append(v)

        return path, total_cost

    def _update_pheromones(self, paths, costs):
        # Evaporazione
        # gli edge migliori (sopra la media) ricevono un contributo proporzionale alla qualità del percorso (1/costo), più il feromone è alto più è probabile che venga scelto, ma anche l'eta (inverso del costo) influenza la scelta
        for edge in self.pheromones: self.pheromones[edge] *= (1 - self.rho)
        # Consideriamo solo le formiche migliori (sopra la media) per il deposito
        avg_cost = np.mean(costs)
        for path, cost in zip(paths, costs):
            if cost <= avg_cost:
                contribution = 1.0 / (cost + 1e-6)
                for i in range(len(path)-1):
                    u, v = path[i], path[i+1]
                    if (u, v) in self.pheromones: self.pheromones[(u, v)] += contribution
                    elif (v, u) in self.pheromones: self.pheromones[(v, u)] += contribution

    def solve(self):
        best_path, best_cost = None, float('inf')
        for gen in range(self.n_iterations):
            results = [self._build_ant_path() for _ in range(self.n_ants)]
            paths, costs = zip(*results)
            min_idx = np.argmin(costs)
            if costs[min_idx] < best_cost:
                best_cost, best_path = costs[min_idx], paths[min_idx]
            self._update_pheromones(paths, costs)
            if gen % 10 == 0: print(f"Gen {gen}: Costo {best_cost:.2f}")
        return best_path, best_cost


## Genetico

In [None]:
class Path:
    #```python
#[(c1, g1), (c2, g2), …, (cN, gN), (0, 0)]
#where:
# c1, …, cN represent the sequence of cities visited.
# g1, …, gN represent the corresponding gold collected at each city.
    def __init__(self, city_gold_list=[]):
        self.city_gold_list = city_gold_list
    
    def add_step(self, city, gold):
        self.city_gold_list.append((city, gold))


In [None]:
from importlib.resources import path
import numpy as np
import networkx as nx
import random

class GA_Solver:

    def __init__(self, problem, pop_size=50, generations=100, offprint=20):
        self.prob = problem
        self.graph = problem.graph
        # Tutte le città tranne il deposito
        self.cities_to_visit = [n for n in self.graph.nodes if n != 0]
        # Precalcolo cammini minimi
        self.all_paths = dict(nx.all_pairs_dijkstra_path(self.graph, weight='dist'))
        self.pop_size = pop_size
        self.generations = generations
        self.offprint = offprint

    def _calc_path_cost(self, path : list[int], weight: float) -> float:
        c = 0
        current_w = weight
        for u, v in zip(path, path[1:]):
            d = self.graph[u][v]['dist']
            # Formula del costo: d + (alpha * d * w)^beta
            c += d + (self.prob.alpha * d * current_w) ** self.prob.beta
        return c

    def _evaluate_and_segment(self, chromosome: list[int]) -> tuple[list[tuple[int, float]], float]:
        """Decoder Greedy: decide se tornare al deposito per scaricare."""
        route = []
        total_cost = 0
        current_node = 0
        current_weight = 0

        route.append((0, 0)) 
        for next_target in chromosome:
            # Opzione A: Diretto
            path_direct = self.all_paths[current_node][next_target]
            cost_direct = self._calc_path_cost(path_direct, current_weight)
            
            # Opzione B: Passando dal deposito
            path_to_depot = self.all_paths[current_node][0]
            path_from_depot = self.all_paths[0][next_target]
            cost_unload = (self._calc_path_cost(path_to_depot, current_weight) + 
                           self._calc_path_cost(path_from_depot, 0))
            
            if current_weight > 0 and cost_unload < cost_direct:
                # Scarico al deposito
                for v in path_to_depot[1:]:
                    route.append((v, 0))
                current_weight = 0
                # Vado al target
                for v in path_from_depot[1:]:
                    gold = self.graph.nodes[v].get('gold', 0) if v == next_target else 0
                    route.append((v, gold))
                    current_weight += gold
                total_cost += cost_unload
            else:
                # Vado diretto
                for v in path_direct[1:]:
                    gold = self.graph.nodes[v].get('gold', 0) if v == next_target else 0
                    route.append((v, gold))
                    current_weight += gold
                total_cost += cost_direct
            current_node = next_target

        # Ritorno finale
        path_home = self.all_paths[current_node][0]
        total_cost += self._calc_path_cost(path_home, current_weight)
        for node in path_home[1:]:
            route.append((node, 0))
            
        return route, total_cost

    def _create_individual(self) -> tuple[list[tuple[int, float]], float]:
        ind = list(self.cities_to_visit)
        random.shuffle(ind)
        return self._evaluate_and_segment(ind)

    def _path_cost(self, path: list[tuple[int, float]]) -> float:
        total_cost = 0
        current_weight = 0
        for i in range(len(path)-1):
            u, v = path[i][0], path[i+1][0]
            d = self.graph[u][v]['dist']
            total_cost += d + (self.prob.alpha * d * current_weight) ** self.prob.beta
            if v==0:
                current_weight = 0  # Svuota il peso al deposito
            else:
                current_weight += path[i+1][1]  # aggiungo oro raccolto al peso
        return total_cost  


    def _mutate(self, ind: list[tuple[int, float]] ) -> tuple[list[tuple[int, float]], float]:
        """
        Mutation: 2 possibilità 
        1. Scambio casuale di due città nel percorso (swap mutation).
        2. Ottimizzazione locale: Scompone il percorso in tour (segmenti tra i depositi) e li ri-decodifica.
        """
        #print(ind)
        
        ratio= random.random()

        if ratio < 0.3:
            # OPZIONE 1:
            # Swap mutation
            chromo = set([n for n, g in ind if n != 0])
            chromo= list(chromo)  # rimuoviamo eventuali duplicati
            # Applichiamo uno swap casuale per diversità
            if len(chromo) >= 2:
                i, j = random.sample(range(len(chromo)), 2)
                chromo[i], chromo[j] = chromo[j], chromo[i]
            
            return self._evaluate_and_segment(chromo)
        
        else:
            # OPZIONE 2:
            # Ottimizzazione locale: ri-decodifica dei tour
            tours = []
            current_tour_cities = []
                
            # 1. Dividiamo il percorso originale in tour che partono e tornano a zero (escludendo gli 0)
            for n, w in ind:
                if n == 0:
                    if current_tour_cities:
                        #print("Tour trovato:", current_tour_cities)
                        tours.append(current_tour_cities)
                        current_tour_cities = []
                else:
                    current_tour_cities.append(n)
                        
            # Aggiungiamo l'ultimo tour se il percorso non finiva con 0
            if current_tour_cities:
                #print("Tour trovato:", current_tour_cities)
                tours.append(current_tour_cities)

            #print("Eseguo ottimizzazione locale sui tour")
            mutated_ind = []
            mutated_ind.append((0, 0))
            # Il percorso deve iniziare con il deposito
            golden_city= set()
            # 2. Per ogni tour trovato, proviamo a ri-eseguire il decoder greedy
            for t in tours:
                # t è una lista di soli nomi di città (interi)
                # escludiamo le città dove ho già raccolto l'oro
                t = [city for city in t if city not in golden_city]
                # trasformiamo t in un set
                t_set = set(t)
                #print ("Tour da ri-decodificare (escludendo città già raccolte):", t_set)
                if len(t_set) > 0:
                    # Re-decodifichiamo il segmento di città
                    new_segment_route, _ = self._evaluate_and_segment(t_set)
                    #print("Nuovo segmento dopo ri-decodifica:", new_segment_route)
                    mutated_ind.extend(new_segment_route[1:])  # escludiamo il primo 0 del segmento, già presente
                    
                    # Aggiorniamo l'insieme delle città dove abbiamo raccolto l'oro
                    golden_city.update(t_set)

            #print("Individuo mutato finale:", mutated_ind)  
            cost= self._path_cost(mutated_ind)
            #print("Costo dell'individuo mutato:", cost) 
            return mutated_ind, cost


    def _run_ga_logic(self)-> list[tuple[int, float]]:
        population = [self._create_individual() for _ in range(self.pop_size)]
        #print("Popolazione iniziale creata.")
        #print(  [cost for cromo, cost in population] )
        # ordina la popolazione in base al costo (decrescnente)
        population = sorted(population, key=lambda x: x[1])
        best_chromo = population[0][0]
        #print(best_chromo)

        best_cost = population[0][1]
        #print(f"Best cost iniziale: {best_cost}")
        stagnation_counter = 0

        for gen in range(self.generations):
            print(f"Generazione {gen}, miglior costo: {best_cost}")
            next_gen = []
            for _ in range(self.offprint//2):
                parents = []
                for _ in range(2):
                    candidates = random.sample(population, 2)
                    parents.append(min(candidates, key=lambda x: x[1])[0])
                # per ogni iterazione 2 figli

                # estraggo un valore tra 0 e 1
                ratio = 0.5#random.random()
                if ratio < 0.7:
                    # mutation
                    print("MUTAZIONE")
                    #print("Genitore 1:", parents[0])
                    #print("Genitore 2:", parents[1])
                    offspring1=self._mutate(parents[0])
                    offspring2=self._mutate(parents[1])
                else:
                    # crossover
                    print("CROSSOVER")
                    offspring1 = self._crossover(parents[0], parents[1])
                    offspring2 = self._crossover(parents[1], parents[0])
                
                next_gen.extend([offspring1, offspring2])

            
            next_gen = [(ind, cost) for ind, cost in sorted(next_gen, key=lambda x: x[1])]  
            population = next_gen[:self.pop_size]  # mantieni solo i migliori
        
            if population[0][1] < best_cost:
                best_chromo, best_cost = population[0]
                stagnation_counter = 0
            else:
                stagnation_counter += 1
            # se il costo rimane lo stess per 20 generazioni, interrompiamo
            #if stagnation_counter >= 20:
            #    break

        return best_chromo

    def solution(self):
        best_chromo = self._run_ga_logic()
        return best_chromo, self._path_cost(best_chromo)

In [95]:
from Problem import Problem

p = Problem(num_cities=20, density=0.2, alpha=1, beta=1)
print(f"Baseline Cost: {p.baseline()}")
    
solver = GA_Solver(p,  pop_size=100, generations=200, offprint=30)
best_path, best_cost = solver.solution()
print(f"\n\nGA Cost: {best_cost}")
print (f"Relative cost: {best_cost/p.baseline()*100:.2f}")

Baseline Cost: 7330.745373832984
Generazione 0, miglior costo: 8140.639979945571
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
Generazione 1, miglior costo: 7819.7547142229305
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
Generazione 2, miglior costo: 7645.491155370489
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
Generazione 3, miglior costo: 7645.491155370489
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
Generazione 4, miglior costo: 7645.491155370489
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZIONE
MUTAZI

In [20]:
from Problem import Problem

logging.getLogger().setLevel(logging.WARNING)

problems= [
    Problem(100, density=0.2, alpha=1, beta=1), 
    Problem(100, density=0.2, alpha=2, beta=1),
    Problem(100, density=0.2, alpha=1, beta=2),
    Problem(100, density=1, alpha=1, beta=1),
    Problem(100, density=1, alpha=2, beta=1),
    Problem(100, density=1, alpha=1, beta=2),
    Problem(1_000, density=0.2, alpha=1, beta=1),
    Problem(1_000, density=0.2, alpha=2, beta=1),
    Problem(1_000, density=0.2, alpha=1, beta=2),
    Problem(1_000, density=1, alpha=1, beta=1),
    Problem(1_000, density=1, alpha=2, beta=1),
    Problem(1_000, density=1, alpha=1, beta=2),
]

for p in problems:
    print(f"\n\n--- PROBLEM: {p.graph.number_of_nodes()} cities, alpha {p.alpha}, beta {p.beta} ---")
    print(f"Baseline Cost: {p.baseline()}")
    
    solver = GA_Solver(p)
    best_path, best_cost = solver.solution()
    print(f"\n\nGA Cost: {best_cost}")
    print (f"Relative cost: {best_cost/p.baseline()*100:.2f}")



--- PROBLEM: 100 cities, alpha 1, beta 1 ---
Baseline Cost: 25266.40561851071


GA Cost: 25486.188928274336
Relative cost: 100.87


--- PROBLEM: 100 cities, alpha 2, beta 1 ---
Baseline Cost: 50425.309618179184


GA Cost: 51447.64765230416
Relative cost: 102.03


--- PROBLEM: 100 cities, alpha 1, beta 2 ---
Baseline Cost: 5334401.927002504


GA Cost: 5685829.266802699
Relative cost: 106.59


--- PROBLEM: 100 cities, alpha 1, beta 1 ---
Baseline Cost: 18266.185795826725


GA Cost: 18371.634832506974
Relative cost: 100.58


--- PROBLEM: 100 cities, alpha 2, beta 1 ---
Baseline Cost: 36457.91846237206


GA Cost: 36587.869912529764
Relative cost: 100.36


--- PROBLEM: 100 cities, alpha 1, beta 2 ---
Baseline Cost: 5404978.08899582


GA Cost: 4924550.084012681
Relative cost: 91.11


--- PROBLEM: 1000 cities, alpha 1, beta 1 ---
Baseline Cost: 195402.95810394033


GA Cost: 203903.1187601078
Relative cost: 104.35


--- PROBLEM: 1000 cities, alpha 2, beta 1 ---
Baseline Cost: 390028.72126288

KeyboardInterrupt: 

In [12]:
np.array(best_path)

array([[ 16.        ,   0.        ],
       [ 17.        ,   0.        ],
       [ 18.        , 569.17245476],
       [ 17.        ,   0.        ],
       [ 16.        ,   0.        ],
       [  0.        ,   0.        ],
       [ 16.        ,   0.        ],
       [  5.        ,   0.        ],
       [  4.        , 313.05427474],
       [  5.        , 832.42754159],
       [ 16.        , 780.94830199],
       [  0.        ,   0.        ],
       [ 10.        ,   0.        ],
       [ 19.        ,   0.        ],
       [ 14.        , 665.18600574],
       [ 19.        , 140.65720113],
       [ 10.        ,   0.        ],
       [  0.        ,   0.        ],
       [ 16.        ,   0.        ],
       [ 13.        ,   0.        ],
       [  8.        ,   0.        ],
       [  7.        , 388.09090065],
       [  8.        , 289.03977583],
       [ 13.        ,   0.        ],
       [ 16.        ,   0.        ],
       [  0.        ,   0.        ],
       [  1.        , 437.71476695],
 

In [16]:
def check_path(problem, path):
    total_cost = 0
    current_weight = 0
    is_correct=True
    total_gold= sum(problem.graph.nodes[ n ]['gold'] for n in problem.graph.nodes if n !=0 )

    for i in range(len(path)-1):
        u, v = path[i][0], path[i+1][0]
        d= problem.graph[u][v]['dist']
        total_cost += d + (problem.alpha * d * current_weight) ** problem.beta
        # Aggiorna il peso se si raccoglie oro
        if v != 0:  # Non raccogliere oro al deposito
            current_weight += path[i+1][1]
            total_gold -= path[i+1][1]
                
        else:
            current_weight = 0  # Svuota il peso al deposito
    if total_gold !=0:
        is_correct=False
    return total_gold, total_cost

calculated_cost = check_path(p, best_path)
print(f"Calcolated Cost from path: {calculated_cost}")

Calcolated Cost from path: (-2.2737367544323206e-12, np.float64(7322.014788757396))
