In [35]:
# Imports
import numpy as np          # Importerar numpy-biblioteket, ett populärt paket för vetenskapliga beräkningar och arbete med stora flerdimensionella matriser.
import random               # Importerar random-modulen, som tillhandahåller funktioner för att generera slumpmässiga tal och val.
from datetime import datetime # Importerar datetime-klassen från datetime-modulen, används för att arbeta med datum och tid.


In [54]:
# Parameters
n_population = [10, 20, 50, 100]  # Olika populationsstorlekar att testa
mutation_rate = [0.9, 0.6, 0.3, 0.1]  # Olika mutationsfrekvenser att testa
n_cities = 20            # Definierar antalet städer i problemet, troligen för ett resande säljare-problem (TSP) eller liknande optimeringsproblem.


In [55]:
# Generating a list of coordinates representing each city
coordinates_list = [[x,y] for x,y in zip(np.random.randint(0,100,n_cities), np.random.randint(0,100,n_cities))]
# Skapar en lista med koordinater för varje stad. Koordinaterna är slumpmässigt genererade med heltal mellan 0 och 100, både för x- och y-värden. 
# Listförståelse används här för att skapa en lista med par [x, y] för varje stad.

names_list = np.array(['Berlin', 'London', 'Moscow', 'Barcelona', 'Rome', 'Paris', 'Vienna', 'Munich', 'Istanbul', 'Kyiv', 
                       'Bucharest', 'Minsk', 'Warsaw', 'Budapest', 'Milan', 'Prague', 'Sofia', 'Birmingham', 'Brussels', 'Amsterdam'])
# Skapar en NumPy-array som innehåller namn på 20 städer. Varje namn motsvarar en stad.

cities_dict = { x:y for x,y in zip(names_list, coordinates_list)}
# Skapar en dictionary (ordbok) där varje stadsnamn (från names_list) mappas till en uppsättning koordinater (från coordinates_list). 
# Detta gör det enkelt att slå upp en stads koordinater baserat på namnet.

# Function to compute the distance between two points
def compute_city_distance_coordinates(a,b):
    return ((a[0]-b[0])**2+(a[1]-b[1])**2)**0.5
# Denna funktion beräknar avståndet mellan två punkter (a och b) med hjälp av Euklidiskt avstånd. 
# a och b är listor som innehåller två värden (x, y), och formeln används för att beräkna distansen mellan dessa punkter.

def compute_city_distance_names(city_a, city_b, cities_dict):
    return compute_city_distance_coordinates(cities_dict[city_a], cities_dict[city_b])
# Denna funktion tar två städers namn som argument (city_a och city_b) och använder cities_dict för att slå upp deras koordinater.
# Sedan används funktionen compute_city_distance_coordinates för att beräkna avståndet mellan städerna baserat på deras koordinater.

cities_dict
# Returnerar ordboken (cities_dict) så att du kan se eller använda den i senare kod.


{'Berlin': [89, 23],
 'London': [22, 27],
 'Moscow': [25, 53],
 'Barcelona': [79, 88],
 'Rome': [97, 20],
 'Paris': [94, 80],
 'Vienna': [65, 26],
 'Munich': [70, 90],
 'Istanbul': [81, 23],
 'Kyiv': [52, 69],
 'Bucharest': [42, 36],
 'Minsk': [12, 89],
 'Warsaw': [77, 7],
 'Budapest': [87, 98],
 'Milan': [91, 96],
 'Prague': [92, 81],
 'Sofia': [84, 75],
 'Birmingham': [1, 42],
 'Brussels': [2, 66],
 'Amsterdam': [81, 14]}

In [56]:
# First step: Create the first population set
def genesis(city_list, n_population):
    # Skapar en funktion som genererar den initiala populationen av lösningar.
    # city_list är en lista över alla städer, och n_population är antalet lösningar som ska genereras.

    population_set = []  # Skapar en tom lista för att lagra varje genererad lösning.
    for i in range(n_population):  # Loopar n_population gånger för att generera varje lösning.
        # Randomly generating a new solution
        sol_i = city_list[np.random.choice(list(range(n_cities)), n_cities, replace=False)]
        # Genererar en slumpmässig lösning genom att slumpmässigt välja n_cities städer från city_list utan återplacering.
        # np.random.choice används för att slumpmässigt välja index och sedan hämta motsvarande städer.

        population_set.append(sol_i)  # Lägger till den genererade lösningen till population_set-listan.

    return np.array(population_set)  # Returnerar populationen som en NumPy-array för mer effektiv hantering.

population_set = genesis(names_list, n_population)  # Genererar den första populationen av lösningar.
population_set  # Visar populationen.


TypeError: 'list' object cannot be interpreted as an integer

In [45]:
def fitness_eval(city_list, cities_dict):
    # Denna funktion beräknar fitness-värdet (eller kostnaden) för en viss lösning (city_list) genom att summera avstånden mellan alla städer.
    # city_list är en lista över städer i den ordning de besöks, och cities_dict är en ordbok med stadens namn som nyckel och koordinater som värde.

    total = 0  # Initialiserar totalavståndet till noll.
    for i in range(n_cities - 1):  # Loopar genom varje stad i lösningen fram till den näst sista staden.
        a = city_list[i]  # Hämtar den aktuella staden.
        b = city_list[i + 1]  # Hämtar nästa stad i listan.
        total += compute_city_distance_names(a, b, cities_dict)  
        # Beräknar avståndet mellan den aktuella staden (a) och nästa stad (b), 
        # och lägger till detta avstånd till totalvärdet.

    return total  # Returnerar den totala distansen för staden i den aktuella ordningen.


In [61]:
def get_all_fitnes(population_set, cities_dict):
    # Denna funktion beräknar fitness-värdet för varje lösning i hela populationen.
    # population_set är en uppsättning av alla lösningar, och cities_dict är en ordbok med städers namn och koordinater.

    fitnes_list = np.zeros(n_population)
    # Skapar en NumPy-array fylld med nollor som kommer att lagra fitness-värdet för varje lösning. Arrayen har storleken n_population.

    # Looping over all solutions computing the fitness for each solution
    for i in range(n_population):  # Loopar genom varje lösning i populationen.
        fitnes_list[i] = fitness_eval(population_set[i], cities_dict)
        # Beräknar fitness-värdet för den i:te lösningen genom att använda fitness_eval-funktionen och lagrar resultatet i fitnes_list.

    return fitnes_list  # Returnerar listan med fitness-värden.

fitnes_list = get_all_fitnes(population_set, cities_dict)  # Anropar funktionen för att beräkna fitness för hela populationen.
fitnes_list  # Visar listan med fitness-värden.


array([1199.50230676, 1077.27389055,  829.40946736,  994.07589997,
        971.02321216, 1173.9401563 , 1309.2255078 , 1360.20664759,
       1124.12911358, 1043.21793579])

In [48]:
def progenitor_selection(population_set, fitnes_list):
    # Denna funktion väljer progenitorer (föräldrar) för nästa generation genom att använda ett sannolikhetsbaserat urval.
    # population_set är hela populationen, och fitnes_list är en lista med fitness-värden för varje lösning i populationen.

    total_fit = fitnes_list.sum()
    # Summerar alla fitness-värden i populationen. Detta används för att normalisera sannolikheterna.

    prob_list = (total_fit / fitnes_list)
    # Beräknar sannolikheten för varje lösning att bli vald som progenitor.
    # De lösningar med lägre fitness får en högre sannolikhet, eftersom fitness-värden är lägre för bättre lösningar (omvänd proportion).

    prob_list = prob_list / prob_list.sum()
    # Normaliserar sannolikheterna så att de summerar till 1, vilket krävs för att kunna använda dem i np.random.choice.

    # Notice there is the chance that a progenitor mates with oneself
    progenitor_list_a = np.random.choice(list(range(len(population_set))), len(population_set), p=prob_list, replace=True)
    # Väljer en uppsättning progenitorer (föräldrar) från populationen med sannolikheterna angivna av prob_list.
    # replace=True betyder att en progenitor kan väljas flera gånger, vilket innebär att en individ kan para sig med sig själv.

    progenitor_list_b = np.random.choice(list(range(len(population_set))), len(population_set), p=prob_list, replace=True)
    # Samma som ovan, men för den andra uppsättningen progenitorer (andra föräldern i varje par).

    progenitor_list_a = population_set[progenitor_list_a]
    progenitor_list_b = population_set[progenitor_list_b]
    # Använder de valda indexen för att hämta motsvarande lösningar från population_set och skapa listor över progenitorer.

    return np.array([progenitor_list_a, progenitor_list_b])
    # Returnerar en array där progenitor_list_a och progenitor_list_b representerar föräldraparen.

progenitor_list = progenitor_selection(population_set, fitnes_list)
# Anropar funktionen för att välja progenitorer baserat på den aktuella populationen och deras fitness-värden.

progenitor_list[0][2]  # Visar den tredje progenitorn i den första progenitor-listan.


array(['Milan', 'Birmingham', 'Minsk', 'Sofia', 'Vienna', 'Barcelona',
       'Rome', 'Munich', 'Istanbul', 'Brussels', 'Bucharest', 'Moscow',
       'Warsaw', 'London', 'Kyiv', 'Prague', 'Amsterdam', 'Budapest',
       'Paris', 'Berlin'], dtype='<U10')

In [51]:
def mate_progenitors(prog_a, prog_b):
    # Denna funktion parar två progenitorer (prog_a och prog_b) och genererar en avkomma (offspring).
    
    offspring = prog_a[0:5]
    # Tar de första 5 städerna från progenitor A (prog_a) som en grund för avkomman.

    for city in prog_b:
        # Itererar över alla städer i progenitor B (prog_b).
        
        if not city in offspring:
            # Om staden från prog_b inte redan finns i offspring (ingen dubblett),
            offspring = np.concatenate((offspring, [city]))
            # Läggs staden till offspring genom att kombinera (concatenate) listan med den nya staden.

    return offspring
    # Returnerar den färdiga avkomman.

def mate_population(progenitor_list):
    # Denna funktion genererar en ny population genom att para alla progenitorpar.
    
    new_population_set = []
    # Skapar en tom lista för att lagra den nya populationen (avkommor).

    for i in range(progenitor_list.shape[1]):
        # Loopar igenom varje par av progenitorer i progenitor_list.
        
        prog_a, prog_b = progenitor_list[0][i], progenitor_list[1][i]
        # Hämtar respektive progenitor (prog_a och prog_b) från progenitor_list för index i.

        offspring = mate_progenitors(prog_a, prog_b)
        # Skapar en avkomma genom att para prog_a och prog_b.

        new_population_set.append(offspring)
        # Lägger till den nya avkomman i new_population_set.

    return new_population_set
    # Returnerar den nya populationen (listan med alla avkommor).

new_population_set = mate_population(progenitor_list)
# Anropar funktionen för att skapa en ny population genom att para progenitorerna.

new_population_set[0]
# Visar den första avkomman i den nya populationen.


array(['Berlin', 'London', 'Sofia', 'Amsterdam', 'Brussels', 'Bucharest',
       'Paris', 'Birmingham', 'Barcelona', 'Prague', 'Munich', 'Milan',
       'Moscow', 'Kyiv', 'Minsk', 'Istanbul', 'Warsaw', 'Budapest',
       'Vienna', 'Rome'], dtype='<U10')

In [20]:
def mutate_offspring(offspring):
    # Denna funktion applicerar mutation på en enskild avkomma genom att byta plats på städer i resvägen.

    for q in range(int(n_cities * mutation_rate)):
        # Loopar ett antal gånger som är baserat på antalet städer multiplicerat med mutationsfrekvensen.
        # Det anger hur många mutationer (bytesoperationer) som ska göras.

        a = np.random.randint(0, n_cities)
        b = np.random.randint(0, n_cities)
        # Väljer två slumpmässiga index inom avkommans lista över städer.

        offspring[a], offspring[b] = offspring[b], offspring[a]
        # Byter plats på städerna vid de två slumpmässigt valda indexen (a och b).

    return offspring
    # Returnerar den muterade avkomman.

def mutate_population(new_population_set):
    # Denna funktion applicerar mutation på hela den nya populationen av avkommor.

    mutated_pop = []
    # Skapar en tom lista för att lagra den muterade populationen.

    for offspring in new_population_set:
        # Loopar igenom varje avkomma i den nya populationen.
        mutated_pop.append(mutate_offspring(offspring))
        # Muterar varje avkomma med funktionen mutate_offspring och lägger till den i listan mutated_pop.

    return mutated_pop
    # Returnerar den muterade populationen.

mutated_pop = mutate_population(new_population_set)
# Anropar funktionen för att mutera den nya populationen.

mutated_pop[0]
# Visar den första muterade avkomman i den nya populationen.


array(['Budapest', 'Brussels', 'Barcelona', 'Sofia', 'Munich',
       'Birmingham', 'London', 'Istanbul', 'Bucharest', 'Milan', 'Berlin',
       'Amsterdam', 'Vienna', 'Rome', 'Prague', 'Minsk', 'Kyiv', 'Warsaw',
       'Paris', 'Moscow'], dtype='<U10')

In [70]:
n_population = [10, 20, 50, 100]  # Olika populationsstorlekar att testa
mutation_rate = [0.9, 0.6, 0.3, 0.1]  # Olika mutationsfrekvenser att testa


for pop_size in n_population:
    for mut_rate in mutation_rate:
        #print(f"Running GA with population size: {n_population} and mutation rate: {mutation_rate}")
        best_solution = [-1, np.inf, np.array([])]
        # Initialiserar en variabel som kommer att hålla den bästa lösningen som hittats. 
        # Formatet är: [generation_index, best_fitness_value, best_solution_path].
        # -1 indikerar att ingen lösning ännu har sparats.
        # np.inf anger att vi söker en fitness-lösning bättre än oändligt (börjar med ett mycket stort värde).
        # np.array([]) är en tom array som senare kommer att fyllas med den bästa lösningen (resväg).
        
        # Sätt de nya parametrarna
        n_population = pop_size
        mutation_rate = mut_rate
        
        # Generera initial population
        population_set = genesis(names_list, n_population)
        
        # Initiera populationen
        mutated_pop = population_set

        for i in range(10000):  # Loopar över 10 000 generationer (iterationer) i den genetiska algoritmen.
            if i % 50 == 0: 
                print(i, best_solution[1], fitnes_list.mean(), datetime.now().strftime("%d/%m/%y %H:%M"))
                # Varje 50:e iteration skrivs ut aktuell generation, bästa lösningens fitness, det genomsnittliga fitness-värdet i populationen, och tiden.

            fitnes_list = get_all_fitnes(mutated_pop, cities_dict)
            # Beräknar fitness-värdena för den muterade populationen efter varje generation.

            # Saving the best solution
            if fitnes_list.min() < best_solution[1]:
                # Om den minsta fitness-värdet i den nuvarande populationen är bättre (lägre) än det bästa hittills,
                best_solution[0] = i
                # Spara nuvarande iteration som generationen där den bästa lösningen hittades.
                best_solution[1] = fitnes_list.min()
                # Uppdatera bästa fitness-värdet med det nya minsta värdet.
                best_solution[2] = np.array(mutated_pop)[fitnes_list.min() == fitnes_list]
                # Sparar den bästa lösningen som motsvarar det minsta fitness-värdet i populationen.

            progenitor_list = progenitor_selection(population_set, fitnes_list)
            # Väljer progenitorer (föräldrar) för nästa generation baserat på de nuvarande fitness-värdena.

            new_population_set = mate_population(progenitor_list)
            # Skapar en ny population av avkommor genom att para de valda progenitorerna.

            mutated_pop = mutate_population(new_population_set)
            # Applicerar mutation på den nya populationen för att skapa variation och nya lösningar.


0 inf 1092.1826841618577 03/10/24 00:48
50 750.8307983187048 1093.8982240795563 03/10/24 00:48
100 750.8307983187048 1109.4893939398873 03/10/24 00:48
150 731.9728626159907 1125.1532650385434 03/10/24 00:48
200 721.0299171989055 1162.3879572736198 03/10/24 00:48
250 721.0299171989055 1147.3955648407455 03/10/24 00:48
300 721.0299171989055 1114.1191480809555 03/10/24 00:48
350 721.0299171989055 1113.5802516649428 03/10/24 00:48
400 721.0299171989055 1083.2153692064946 03/10/24 00:48
450 721.0299171989055 1007.8073248133338 03/10/24 00:48
500 721.0299171989055 1074.1532130139126 03/10/24 00:48
550 721.0299171989055 1139.0701098639443 03/10/24 00:48
600 721.0299171989055 1157.2252075601064 03/10/24 00:48
650 704.1833840901916 1132.7097127928669 03/10/24 00:48
700 704.1833840901916 1084.2290042254238 03/10/24 00:48
750 704.1833840901916 1089.0298142821055 03/10/24 00:48
800 695.3763773035226 1094.4020440788017 03/10/24 00:48
850 695.3763773035226 1095.9443023282024 03/10/24 00:48
900 695.3

TypeError: 'float' object is not iterable

In [63]:
best_solution

[2532,
 545.997048143603,
 array([['Vienna', 'Amsterdam', 'Istanbul', 'Warsaw', 'Moscow',
         'Bucharest', 'Birmingham', 'Brussels', 'Minsk', 'Kyiv', 'Sofia',
         'Munich', 'Budapest', 'Prague', 'Milan', 'Barcelona', 'Paris',
         'Rome', 'Berlin', 'London']], dtype='<U10')]