# 2. Programmierprojekt: Local Search

## $n$-Damen Problem

Wir modellieren das $n$-Damen Problem wie folgt: Jeder Zustand im Suchraum ist eine Permutation des Vektors $(0, \dotsc, n-1)$. Damit sind die Aktionen die von einem Zustand möglich sind Vertauschungen von Zahlen.

In [1]:
import random

def generate_random_conf(n: int) -> list:
  # Generate random permutation of (0,...,n-1)
  conf = [i for i in range(n)]
  random.shuffle(conf)
  return conf

def swap(conf, i, j):
  # Swap positions i,j inplace
  conf[i], conf[j] = conf[j], conf[i]

In [2]:
conf = generate_random_conf(8)
swap(conf, 3, 5)
conf

[3, 7, 5, 6, 4, 2, 1, 0]

Implentieren Sie die folgende Funktion `conflicts`, welche für jede Dame die Anzahl der Bedrohungen aufsummiert. Überlegen Sie, welche Art von Bedrohungen durch die Modellierung überhaupt möglich sind.

In [4]:
def conflicts(queens) -> int:
  """ Heuristic that indicates number of beatable queens on the right"""
  
  conflicts = 0
  for i in range(len(queens)):
    # For better initialization
    if queens[i] == float("-inf"):
        continue
    for j in range(i + 1, len(queens)):
        conflicts += int(queens[i] == queens[j] or queens[i] + j - i == queens[j] or queens[i] - j + i == queens[j])
  return conflicts

In [69]:
conf1 = [0, 1, 2, 3, 4, 5, 6, 7] # conflicts = 28
conf2 = [17, 22, 11, 5, 2, 6, 12, 15, 21, 19, 10, 8, 0, 3, 1, 20, 23, 9, 14, 18, 13, 24, 16, 4, 7] # conflicts = 0
conf3 = [15, 12, 9, 16, 0, 18, 6, 11, 19, 7, 13, 3, 10, 4, 1, 2, 8, 5, 14, 17] # conflicts = 12


assert conflicts(conf1) == 28
assert conflicts(conf2) == 0
assert conflicts(conf3) == 12

Nutzen sie die obige Funktion als Heuristik für den A*-Algorithmus. Testen sie bis zu welchem $n$ der Algorithmus eine Lösung in unter zwei Minuten findet. Starten Sie dabei immer von einer zufälligen Startkonfiguration.

In [70]:
from queue import PriorityQueue


def queens_a_star(n: int) -> list[int]:
    """ Find solution with A*; not feasible for n >= 50 """
    
    conf = generate_random_conf(n)
    
    queue = PriorityQueue()
    # stores f, h, g, configuration
    queue.put((conflicts(conf), conflicts(conf), 0, conf))
    visited = []
    
    while not queue.empty():
        entry = queue.get()
        g_score, state = entry[2], entry[3]
        visited.append(state)

        for successor in successors_astar(state):
            if not conflicts(successor):
                return successor
            if successor in visited:
                continue
                
            new_g_score = g_score + 1
            h = conflicts(successor)
            f_score = h + new_g_score
            queue.put((f_score, h, new_g_score, successor))
            visited.append(successor)

    return [-1]


def successors_astar(queens) -> list[list[int]]:
    """ Returns list of successor states; action is swapping """
    successors = []
    for i in range(len(queens)):
        for j in range(len(queens)):
            if i == j:
                continue
            copy = queens.copy()
            swap(copy, i, j)
            successors.append(copy)
    return successors
    

Wir wollen im Folgenden einen Local-Search Ansatz nutzen, um das Problem zu lösen. Implementieren Sie nun den Hill-Climbing Algorithmus aus der Vorlesung. Der Algorithmus sollte zusätzlich maximal $k$ Seitwärtszüge erlauben.

In [6]:
def queens_hill_climb(n, k=0) -> tuple[list[int], int]:
    return hill_climb_core(generate_random_conf(n), k)
  
def hill_climb_core(conf, k=0) -> tuple[list[int], int]:
    """ Searches solution by hill-climbing; k: possible side steps """  
    conflicts_amount = conflicts(conf)
    improvement, side_steps = 1, 0
    visited = []
  
    while side_steps <= k  and conflicts_amount != 0:
        visited.append(conf)
        new_conf, new_conflict_amount = successors(conf, visited)
      
        improvement = conflicts_amount - new_conflict_amount
      
        if improvement:
            side_steps = 0
        else:
            side_steps += 1
          
        conf, conflicts_amount = new_conf, new_conflict_amount
      
    return conf, conflicts(conf)


def successors(queens, visited) -> list[list[int]]:
    """ Returns best successor"""
    best_successor = (queens, conflicts(queens))
    for i in range(len(queens)):
        for j in range(len(queens)):
            if i == j:
                continue
            copy = queens.copy()
            swap(copy, i, j)
            best_successor = (copy, conflicts(copy)) if (conflicts(copy) <= best_successor[1] and copy not in visited) else best_successor
    return best_successor


Evaluieren Sie den Algorithmus empirisch. Testen sie für verschiedene $n$ und $k$, wie groß die Erfolgsrate des Algorithmus ist. Überlegen Sie sich eine geeignete Visualisierung ihrer Ergebnisse.

In [100]:
n_samples = 40
k = [0, 5, 10, 20, 50, 100]

total_amount, total_hits = 0, 0
for i in k:
    amount, hits = 0, 0
    for n in range(8, n_samples):
        amount += 1
        hits += int(not queens_hill_climb(n, i)[1])
    print("Success rate for k = " + str(i) + " : " + str((hits / amount) * 100) + "%")
    total_amount += amount
    total_hits += hits
print("Overall success rate: " + str((total_hits / total_amount) * 100) + "%")

Success rate for k = 0 : 40.625%
Success rate for k = 5 : 81.25%
Success rate for k = 10 : 93.75%
Success rate for k = 20 : 100.0%
Success rate for k = 50 : 100.0%
Success rate for k = 100 : 96.875%
Overall success rate: 85.41666666666666%


Implementieren sie nun Hill-Climbing mit Random-Restarts, um immer optimale Lösungen zu finden. Berechnen Sie auch, wie viele Restarts nötig waren, um eine optimale Lösung zu finden. Bis zu welchem $n$ können sie mit diesem Ansatz in weniger als zwei Minuten Lösungen finden? (Probieren sie auch verschiedene $k$)

In [75]:
def queens_random_restart(n, k=0) -> tuple[list[int], int]:
    """ Restart hill climbing till solution is found; not feasible for n >= 65   """
    restart = 0
    conf, conflict_amount = queens_hill_climb(n, k)
    while conflict_amount:
        restart += 1
        conf, conflict_amount = queens_hill_climb(n, k)
    return conf, restart

Eine weitere Verbesserung kann erreicht werden, in dem die initiale Konfiguration nicht rein zufällig gewählt wird. Es kann versucht werden, anfangs eine Konfiguration zu finden, in der möglichst viele Damen bereits konfliktfrei gesetzt sind. Die restlichen Damen sollten dann mit möglichst wenigen Konflikten gesetzt werden.

Implementieren Sie darauf basierend einen verbesserten Generator für die Startkonfiguration und testen Sie, ob damit noch größere Probleminstanzen gelöst werden können.

In [82]:
from random import randrange
import numpy as np


def better_initial_configuration(n: int, k=0) -> tuple[list[int], int]:
    """ Initialize conf with minimal conflicts """
    conf = [float("-inf")] * n
    possible_queens = [i for i in range(n)]
    conf[0] = possible_queens.pop(randrange(n))
    #f = np.zeros((n, n), int)
    #update(f, 0, conf[0])
    #print(f)
    for i in range(1, n):
        copy = conf.copy()
        min_conflicts = possible_queens[0], float("inf"), float("inf")  # index, conflicts_amount, overlap_ammount
        
        for j in possible_queens:
            #f_c = np.copy(f)
            copy[i] = j
            #update(f_c, i, j)
            if conflicts(copy) <= min_conflicts[1]:
                #if f_c.sum() <= min_conflicts[2]:
                min_conflicts = j, conflicts(copy)#, f_c.sum()

        
        conf[i] = min_conflicts[0]
        #update(f, i, conf[i])
        #print(f)
        possible_queens.remove(conf[i])
    print(conf)
    return hill_climb_core(conf, k)

def update(f, x, y):
    f[:, x] = 1
    f[y, :] = 1
    i, j = 1, 1
    
    while x + i < f.shape[0] and y + i < f.shape[0]:
        f[y + i, x + i] = 1
        i += 1
        
    while x + j < f.shape[0] and y - j > -1:
        f[y - j, x + j] = 1
        j += 1 

print(better_initial_configuration(8)[1])
print(queens_hill_climb(8)[1])

[6, 4, 7, 5, 3, 2, 0, 1]
2
1


In [74]:
n_samples = 40
k = [0, 5, 10, 20, 50, 100]

total_amount, total_hits = 0, 0
for i in k:
    amount, hits = 0, 0
    for n in range(8, n_samples):
        amount += 1
        hits += int(not better_initial_configuration(n, i)[1])
    print("Success rate for k = " + str(i) + " : " + str((hits / amount) * 100) +"%")
    total_amount += amount
    total_hits += hits
print("Overall success rate: " + str((total_hits / total_amount) * 100) +"%")

[4, 7, 0, 1, 2, 3, 6, 5]
[2, 8, 6, 1, 3, 0, 7, 4, 5]
[8, 5, 0, 1, 2, 3, 4, 9, 7, 6]
[6, 10, 2, 0, 1, 9, 8, 3, 4, 7, 5]
[2, 11, 10, 7, 0, 1, 3, 4, 5, 6, 9, 8]
[7, 12, 1, 2, 0, 5, 11, 9, 3, 10, 8, 4, 6]
[2, 13, 12, 9, 0, 1, 4, 3, 8, 11, 7, 10, 6, 5]
[11, 14, 7, 0, 1, 2, 3, 4, 5, 6, 13, 12, 10, 8, 9]
[8, 15, 4, 1, 6, 0, 10, 2, 3, 14, 13, 11, 9, 12, 5, 7]
[8, 16, 14, 1, 2, 0, 9, 4, 3, 5, 7, 13, 11, 6, 15, 12, 10]
[15, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 17, 16]
[11, 18, 7, 0, 1, 2, 3, 12, 17, 4, 5, 6, 8, 9, 10, 14, 13, 15, 16]
[18, 15, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 19, 17, 16]
[1, 2, 19, 16, 13, 8, 3, 0, 7, 18, 15, 14, 20, 17, 12, 9, 6, 5, 10, 4, 11]
[2, 21, 20, 17, 14, 9, 0, 1, 4, 5, 18, 19, 3, 13, 12, 6, 8, 16, 11, 15, 7, 10]
[18, 22, 14, 1, 2, 9, 17, 21, 0, 3, 4, 5, 6, 7, 8, 11, 12, 19, 15, 20, 10, 16, 13]
[14, 23, 20, 1, 2, 7, 18, 3, 0, 19, 6, 15, 16, 21, 4, 5, 22, 10, 8, 13, 17, 9, 11, 12]
[3, 24, 21, 20, 17, 10, 1, 2, 23, 16, 7, 22, 0, 6, 15, 14, 4, 

KeyboardInterrupt: 



---



## Travelling-Salesman Problem

In diesem Teil soll das TSP mithilfe von Local Search approximiert werden. Für diese Aufgabe betrachten wir ausschließlich das symmetrische TSP, bei dem die Kanten der Graphen ungerichtet sind. Es gibt folglich für einen Graph nur eine Tour.

Wir verwenden zur Darstellung der Graphen das Paket `networkx` (https://networkx.org/documentation/latest/). Außerdem das Paket `tsplib95` (https://tsplib95.readthedocs.io/en/stable/index.html) um die Algorithmen mit Benchmarks zu testen.

In [46]:
import networkx as nx
import tsplib95
import os
from random import randrange
import math

Implementieren Sie die Funktion `import_benchmarks`, welche die verschiedenen TSP Instanzen zusammen mit den Lösungen aus dem Ordner `tsp_benchmarks` importiert und eine Liste aus Tupeln der Form `(G, optimal_solution)` zurückgibt, bestehend aus dem Graphen als `networkx`-Objekt und dem Gewicht der optimalen Lösung.

In [6]:
def import_benchmarks(path='./tsp_benchmarks/') -> list[tuple[nx.Graph, int]]:
    """ Loads TSP problems with optimal solution """
    res = []
    dir_list = sorted(os.listdir(path))
    for i in range(len(dir_list) - 1):
        # make sure tsp and tour belong to each other
        if dir_list[i].split('.')[0] != dir_list[i+1].split('.')[0]:
            continue

        opt = tsplib95.load(path + dir_list[i])
        problem = tsplib95.load(path + dir_list[i+1])
        G = problem.get_graph()
        
        try:
            optimal_solution = problem.trace_tours(opt.tours)[0]
        except IndexError:
            optimal_solution = None
            
        res.append((G, optimal_solution))
        
    return res
a = import_benchmarks()

a280.tsp a280.opt.tour
att48.tsp att48.opt.tour
bayg29.tsp bayg29.opt.tour
bays29.tsp bays29.opt.tour
berlin52.tsp berlin52.opt.tour
brg180.tsp brg180.opt.tour
ch130.tsp ch130.opt.tour
ch150.tsp ch150.opt.tour
eil101.tsp eil101.opt.tour
eil51.tsp eil51.opt.tour
eil76.tsp eil76.opt.tour
fri26.tsp fri26.opt.tour
gr120.tsp gr120.opt.tour
gr202.tsp gr202.opt.tour
gr24.tsp gr24.opt.tour
gr48.tsp gr48.opt.tour
gr666.tsp gr666.opt.tour
gr96.tsp gr96.opt.tour
kroA100.tsp kroA100.opt.tour
kroC100.tsp kroC100.opt.tour
kroD100.tsp kroD100.opt.tour
lin105.tsp lin105.opt.tour
pa561.tsp pa561.opt.tour
pcb442.tsp pcb442.opt.tour
pr1002.tsp pr1002.opt.tour
pr2392.tsp pr2392.opt.tour
pr76.tsp pr76.opt.tour
rd100.tsp rd100.opt.tour
st70.tsp st70.opt.tour
tsp225.tsp tsp225.opt.tour
ulysses16.tsp ulysses16.opt.tour
ulysses22.tsp ulysses22.opt.tour


Implementieren Sie nun die folgenden drei Local-Search Algorithmen um das TSP zu lösen. Genau wie beim $n$-Damen Problem, kann auch beim TSP eine Lösung als Permutation der Knoten des Graphen gesehen werden. Für das Hill-Climbing und dem Simulated Annealing, besteht eine Aktion daraus, zwei Knoten auf dem Rundweg zu vertauschen. Beim EX3-Algorithmus ist die Aktion unten beschrieben.

**1. Simple Hill-Climbing**

In [56]:

def successors_hc(G, conf, visited) -> list[list[int]]:
    """ Returns best successor """
    best_successor = (conf, calculate_tour_cost(G, conf))
    for i in range(len(conf)):
        for j in range(len(conf)):
            if i == j:
                continue
            copy = conf.copy()
            swap(copy, i, j)
            best_successor = (copy, calculate_tour_cost(G,copy)) if (calculate_tour_cost(G, copy) <= best_successor[1] and copy not in visited) else best_successor
    return best_successor


def tsp_hill_climb(G: nx.Graph, succ=successors_hc) -> int:
    """ Simple Hill Climbing """
    conf = list(G.nodes)
    tour_cost = calculate_tour_cost(G, conf)
    visited = []
    improvement = 1
    while improvement :
        visited.append(conf)
        new_conf, new_tour_cost = succ(G, conf, visited)
        improvement = tour_cost - new_tour_cost
          
        conf, tour_cost = new_conf, new_tour_cost
    return calculate_tour_cost(G, conf)
    

def calculate_tour_cost(G, t) -> int:
    """ Given tour add start to end, then return cost """
    total_cost = 0
    tour = t + [t[0]]
    for i in range(len(tour) - 1):
        u, v = tour[i], tour[i + 1]
        # Add the weight of the edge (u, v)
        total_cost += G[u][v]['weight']
    return total_cost

print(tsp_hill_climb(a[2][0]))

1831


**3. Simulated Annealing**

In [63]:
def tsp_simulated_annealing(G: nx.Graph, temperature: float=len(G)**2) -> int:
    """ Takes worse steps dependend on temperature """
    conf = list(G.nodes)
    tour_cost = calculate_tour_cost(G, conf)
    visited = []
    
    for t in range(temperature, -1, -1):
        if t ==  0:
            return calculate_tour_cost(G, conf)
            
        visited.append(conf)
        sucessor = conf.copy()
        #random.shuffle(sucessor)
        i, j = randrange(len(conf)), randrange(len(conf))
        swap(sucessor, i, j)
        #while sucessor in visited: # dangeer infinity
            #sucessor = random.shuffle(conf)
        new_tour_cost = calculate_tour_cost(G, sucessor)
        
        delta = tour_cost - new_tour_cost
        if delta > 0:
            conf = sucessor
            tour_cost = new_tour_cost
        else:
            p = math.exp(delta / t) # TODO p right?
            if random.random() < p:
                conf = sucessor
                tour_cost = new_tour_cost
                
print(tsp_simulated_annealing(a[2][0], 3000))

2761


**2. EX3-Algorithmus**

Der EX3-Algorithmus funktioniert ähnlich wie Hill-Climbing, benutzt allerdings eine etwas andere Nachfolgerfunktion. Die Nachfolger eines Rundweges werden bestimmt, indem zunächst zufällig **drei** Kanten aus dem bisherigen Rundweg ausgewählt werden. Dies zerlegt den Rundweg in drei Teilrundwege. Für das erneute zusammenfügen gibt es danach 8 Möglichkeiten (wie im Bild unten zu sehen ist). Der Algorithmus testet nun für jede 3 Kanten alle Nachfolger und wählt denjenigen aus, der die Kosten am stärksten verringert. Dies wird so lange gemacht, bis sich der Rundweg nicht mehr verkürzt.

![EX3 Visualisation](three_opt.png "EX3")

In [None]:


def tsp_ex3(G: nx.Graph) -> int:
    tsp_simulated_annealing(G, successors_ex3)

def successors_ex3(G, conf, visited) -> list[list[int]]:
    """ Returns best successor of ex3 """
    best_successor = (conf, calculate_tour_cost(G, conf))
    l = len(conf)
    x, y, z = randrange(l), randrange(l), randrange(l) # TODO sorted
    copy = conf.copy()
    on = copy[O:x]
    tw = copy[x:y]
    th = copy[y::]
    # TODO

    return best_successor
    

**Evaluierung**

Vergleichen Sie die drei Algorithmen miteinander. Nutzen Sie dafür die bereitgestellten Benchmarks und die Länge der Optimallösung. Sie sollten Ihre Ergebnisse geeignet visualisieren.

In [None]:
bm = import_benchmarks()
average_deviation_hc, average_deviation_sa, average_deviation_hex = 0, 0, 0
for b in bm:
    if b[1] == None:
        continue
    hc, sa, ex, opt = tsp_hill_climb(b[0]), tsp_simulated_annealing(b[0]), tsp_ex3(b[0]), b[1]
    ad_hc, ad_sa, ad_hex += hc / opt - 1, sa / opt - 1, ex / opt - 1

l = len(bm)
# TODO *100
print("Average deviation from optimum    HC: " + str(ad_hc/l) + "%, SA: " + str(ad_hc/l)) + "%, EX3: " + str(ad_hc/l)) + "%") 