# Datenstrukturen und Algorithmen

## Praktische Aufgabe 5

In dieser Praktischen Aufgabe werden Sie sich mit Graphalgorithmen beschäftigen. Dazu werden Sie einerseits den Algorithmus von Dijkstra implementieren und andererseits mit Hilfe von `networkx` Labyrinthe generieren und lösen. Bei `networkx` handelt es sich um ein Paket welches das Erstellen, Bearbeiten und Analysieren von Graphen erlaubt.

Die Abgaben werden mit der `nbgrader` Erweiterung korrigiert. Das System erwartet, dass der Code zum Lösen der Aufgaben nach der `#YOUR CODE HERE` Anweisung kommt. Außerdem darf die Zellenreihenfolge nicht geändert werden. Damit Sie selbst Ihre Lösungsvorschläge validieren können, werden Ihnen Unittests zur Verfügung gestellt. Beachten Sie, dass diese Tests keine Garantie sind für das Erreichen der vollen Punktzahl, da Sie nur einen Teil der Funktionalität überprüfen.

Wichtig: Füllen Sie zunächst die erste Zelle mit `#YOUR ANSWER HERE` unter dem Titel `Abgabeteam` mit ihren Namen und Matrikelnummern vollständig aus. Dies ermöglicht uns auch bei technischen Problemen die Abgaben eindeutig zuordnen zu können. Ändern Sie außerdem nicht den Namen der Datei. 

**Übersicht der Aufgaben** (20 Punkte):

1. **Implementierung von Dijkstra** - insgesamt: 10 Punkte
   - initialize_single_source() - 2P.
   - relax() - 3P.
   - dijkstra() - 5P.
2. **Labyrinthe: Generieren und Lösen** - insgesamt: 10 Punkte
   - generate_maze() - 6P.
   - solve_maze() - 4P.

## Abgabeteam
Bitte füllen Sie die untenstehende Zelle aus mit 

Nummer des Tutoriums,

Voranme Nachname Matrikelnummer 1,

Vorname Nachname Matrikelnummer 2,

(Vorname Nachname Matrikelnummer 3)

Tutorium Musterlösung

Max Mustermann 123456

Erika Mustermann 123457

(Paul Mustermann 123458)

## Module importieren
Zuerst werden die benötigten Module importiert und weitere Hilfsfunktionen definiert. Sie dürfen keine weiteren Module impotieren.

Wenn in Ihrer Entwickungsumbegung (z.B Google Colab oder Deepnote) bestimmte Module nicht verfügbar sind, dann kommentieren Sie die erste Zeile aus um die Module in der Umgebung zu installieren.

In [None]:
#!pip install nose
#!pip install networkx
from random import randint
from nose.tools import assert_equal
from networkx import draw_networkx_nodes, draw_networkx_edges, grid_2d_graph, shortest_path
from networkx.algorithms.tree import minimum_spanning_tree


# unittests helper functions
import pickle

def save_data(idx, name, data):
    with open(f'data/{idx}/{name}.pkl', 'wb') as f:
        pickle.dump(data, f)

def load_data(idx, name):
    with open(f'data/{idx}/{name}.pkl', 'rb') as f:
        return pickle.load(f)

# Algorithmus von Dijkstra

Implementieren Sie den Algorithmus von Dijkstra indem Sie die folgenden Funktionen nacheinander implementieren: `initialize_single_source()`, `relax()` und `dijkstra()`. Orientieren Sie sich bei ihrer Implementierung an dem in der Vorlesung vorgestellten Code. 

Der untenstehende Code definiert die Klasse `Graph`. In dieser Klasse wird ein Graph als Adjazenzliste dargestellt. Sie können direkt über `G.Adj` auf die Adjazenzliste oder über `G.V` auf die Knoten des Graphen zugreifen.

Die Funktion `extract_minimum()` wird Ihnen zur Verfügung gestellt. Beachten Sie, dass hier in jedem Extract-Schritt eine Sortierung aller verbliebenen Elemente vorgenommen wird. In der Praxis würde diese Funktion über einen Min-Heap effizient implementiert werden. Um die Implementierung kurz und übersichtlich zu gestalten, wird hier auf Effizienz zu Gunsten der Lesbarkeit verzichtet.

In [None]:
class Graph:
    def __init__(self, adjazencyList):
        self.Adj = adjazencyList

    @property
    def V(self):
        return list(self.Adj.keys())


def extract_minimum(Q, key):
    Q = {u: key[u] for u in Q}
    Q = sorted(Q.items(), key=lambda i: i[1])
    Q = [u for u, k in Q]
    return Q[0], Q[1:]

In [None]:
A = {
    'a': ['b', 'c'],
    'b': ['a', 'c', 'e'],
    'c': ['a', 'b', 'd', 'f'],
    'd': ['c', 'e', 'f'],
    'e': ['b', 'd', 'g', 'h'],
    'f': ['c', 'd', 'h'],
    'g': ['e', 'h', 'i'],
    'h': ['e', 'f', 'g', 'i'],
    'i': ['g', 'h']
}
G = Graph(A)

print("Knoten:")
print(G.V)

print("Adjazenzliste:")
print(G.Adj)

## a) initialize_single_source() - 2P.

Zuerst soll die Funktion `initialize_single_source()` implementiert werden. Als Eingabe erwartet sie den Graphen `G`, sowie den Startknoten `s`. Die Funktion erstellt zwei Dictionaries die für jeden Knoten aus aus `G` einen Wert initialisieren. Im ersten Dictionary sollen die Distanzen zum Startknoten gespeichert werden. Initialisieren Sie alle Einträge bis auf den Startknoten mit `float("Inf")`. Die Distanz des Startknotens wird mit 0 initialisiert. Das zweite Dictionary soll jeweils einen Verweis auf seine Vorgänger speichern. Initialisieren Sie hier alle Einträge vorerst mit `None`. Am Ende gibt die Funktion als erstes das Dictionary mit den Distanzen und als zweites das Dictionary mit den Vorgängern zurück. 

In [None]:
def initialize_single_source(G, s):
    # YOUR CODE HERE
    raise NotImplementedError()

## a) Tests

In [None]:
# unittests

In [None]:
#helper functions
def load_data_initialize_single_source(idx):
    A = load_data(idx, "A")
    s = load_data(idx, "s")
    d = load_data(idx, "d")
    p = load_data(idx, "p")
    return A, s, d, p

def test_initialize_single_source(A, s, d, p):
    print("source is vertex:", s)
    G = Graph(A)
    d_out, p_out = initialize_single_source(G, s)
    assert_equal(d, d_out)
    assert_equal(p, p_out)

In [None]:
test_initialize_single_source(*load_data_initialize_single_source(1))

In [None]:
test_initialize_single_source(*load_data_initialize_single_source(2))

In [None]:
test_initialize_single_source(*load_data_initialize_single_source(3))

## b) relax() - 3P.

Implementieren Sie die Funktion `relax()`, die für zwei gegebene Knoten `u` und `v` vergleicht, ob der Weg von dem Startknoten über `u` nach `v` kürzer ist, als der bisher kürzeste Weg von dem Startknoten zu `v`. Falls dies der Fall ist, so wird dieser Weg ausgewählt und die neue Distanz im Distanz-Dictionary `d` für den Knoten `v` gespeichert. Zusätzlich speichern wir in dem Vorgänger-Dictionary `p` den neuen Vorgänger-Knoten. Die Distanzen zwischen den Knoten werden durch die Gewichte `w` beschrieben.

In [None]:
def relax(u, v, w, p, d):
    # YOUR CODE HERE
    raise NotImplementedError()

## b) Tests

In [None]:
# unittests

In [None]:
def load_data_relax(idx):
    u = load_data(idx, "u")
    v = load_data(idx, "v")
    w = load_data(idx, "w")
    p_1 = load_data(idx, "p_1")    
    d_1 = load_data(idx, "d_1")
    p_2 = load_data(idx, "p_2")
    d_2 = load_data(idx, "d_2")
    return u, v, w, p_1, d_1, p_2, d_2

def test_relax(u, v, w, p_1, d_1, p_2, d_2):
    relax(u, v, w, p_1, d_1)

    print("p_groundtruth:", p_2)
    print("p            :", p_1)

    print("---------------------")

    print("d_groundtruth:", d_2)
    print("d            :", d_1)

    assert_equal(p_1, p_2)
    assert_equal(d_2, d_2)
    print("-- > correct!")

In [None]:
test_relax(*load_data_relax(11))

In [None]:
test_relax(*load_data_relax(22))

In [None]:
test_relax(*load_data_relax(33))

## c) dijkstra() - 5P.

Implementieren Sie abschließen die Funktion `dijkstra()`, die den Algorithmus von Dijkstra implementiert, um den kürzesten Weg von einem Knoten `s` zu jedem anderen Knoten in dem Graphen `G` zu berechnen. Zusätzlich bekommt die Funktion die positiven Kantengewichte `w` übergegeben. Orientieren Sie sich an dem in der Vorlesung vorgestellten Code.

Hinweis: Sie dürfen die zuvor implementierten Funktionen `initialize_single_source()`, `extract_minimum()`, sowie `relax()` verwenden.

In [None]:
def dijkstra(G, w, s):
    # YOUR CODE HERE
    raise NotImplementedError()

## c) Tests

In [None]:
def load_data_dijkstra(idx):
    A = load_data(idx, "A")
    w = load_data(idx, "w")
    s = load_data(idx, "s")
    d = load_data(idx, "d")
    p = load_data(idx, "p")
    return A, w, s, d, p

def test_dijkstra(A, w, s, d, p):
    print("A:", A)
    print("s:", s)
    print("====================")
    G = Graph(A)
    d_out, p_out = dijkstra(G, w, s)

    print("d_ground_truth:", d)
    print("d             :", d_out)
    print("--------------------")
    print("p_ground_truth:", p)
    print("p             :", p_out)

    assert_equal(d, d_out)
    assert_equal(p, p_out)

In [None]:
test_dijkstra(*load_data_dijkstra(111))

In [None]:
#c can not be reached starting from a
test_dijkstra(*load_data_dijkstra(222))

In [None]:
#a only has outgoing edges and d has only incoming edges
test_dijkstra(*load_data_dijkstra(333))

# Labyrinthe: Generieren und Lösen

In dieser Aufgabe werden Sie verschiedene Algorithmen nutzen, um einfache Labyrinthe automatisch zu erzeugen und anschließend zu lösen. Sie dürfen in dieser Teilaufgabe Funktionen aus dem Package `networkx` verwenden, das verschiedene Algorithmen auf Graphen implementiert. Machen Sie sich zunächst mit `networkx` vertraut. Der untenstehende Code `visualize_maze()` implementiert die Visualisierung. Schwarze Linien stellen hier Pfade dar. Der Start `s` ist grün und das Ziel `t` ist rot markiert. Falls eine Lösung `p` übergeben wurde, wird dieser Weg als eine blaue Linie gezeichnet.

In [None]:
def visualize_maze(G, s, t, p = None):
    # draw all edges of G
    n_size = 5000 / G.number_of_nodes()
    pos = dict( (n, n) for n in G.nodes() )
    draw_networkx_edges(G, pos=pos)

    # draw the source node in green
    S = G.subgraph(s)
    draw_networkx_nodes(S, pos, node_color="green", node_size=n_size)

    # draw the target node in red
    T = G.subgraph(t)
    draw_networkx_nodes(T, pos, node_color="red", node_size=n_size)

    if p is not None:
        P = G.subgraph(p)
        draw_networkx_edges(P, pos, edge_color="blue", width=2)

## a) create_maze() - 6P.

Implementieren Sie die Funktion `create_maze()`, die ein zufälliges Labyrinth erstellt. Hierbei kann die Größe des Labyrinths über die zwei Eingabeparameter `horizontal_size` und `vertical_size` bestimmt werden. Das Erstellen des Labyrinths soll dabei wie folgt funktionieren: 

- Erstellen Sie einen regulären Graphen mit Hilfe der Funktion `grid_2d_graph()`.
- Weisen Sie den Kanten zufällige Gewichte zu. Nutzen Sie dazu die Funktion `G.edges(data=True)`, die eine Liste von Tripeln der Form (node1, node2, edge) zurück gibt. Sie können auf die Gewichte zugreifen und sie verändern mit: `edge['weight']`. 
- Berechnen Sie den minimalen Spannbaum (MST = Minimum Spanning Tree) mit Hilfe der Funktion `minimum_spanning_tree()`. Hierbei soll der Startknoten in einer Ecke liegen und der Zielknoten in der gegenüberliegenden Ecke. Sie können hier z.B. den ersten und letzten Knoten im Graphen als Start- und Zielknoten wählen.

Die Funktion soll das Labyrinth als einen Graphen, sowie den Start- und Zielknoten zurückgeben.

Hinweis: Lesen Sie die Dokumentation von `networkx`, um mehr über die verwendeten Funktionen zu erfahren.

In der folgenden Abbildung sehen Sie wie ein 4x4 Labyrinth in vier Schritten erstellt wird. Zunächst wird der Graph erstellt, dann werden zufällige Kantengewichte generiert, anschließend ein MST berechnet und letztendlich die Start- und Zielknoten ausgewählt:

![create_maze_example](img/create_maze_example.png)

In [None]:
def create_maze(horizontal_size = 4, vertical_size=4):
    # YOUR CODE HERE
    raise NotImplementedError()

## a) Tests

In [None]:
# unittests
G, s, t = create_maze(20, 10)
visualize_maze(G, s, t)

In [None]:
# unittests
G, s, t = create_maze(4, 4)
visualize_maze(G, s, t)

In [None]:
# unittests
G, s, t = create_maze(2, 2)
visualize_maze(G, s, t)

In [None]:
# unittests

In [None]:
# unittests

In [None]:
# unittests

## b) solve_maze() - 4P.

Implementieren Sie die Funktion `solve_maze()`, die ein Labyrinth mit einem gegebenen Start- und einem Ziel-Knoten löst. Die Funktion soll eine Liste von Knoten, die den kurzestem Weg zwischen dem Start und dem Ziel beschreiben (inklusive des Start- und Ziel-Knotens) zurückgeben. Zusätzlich soll die Funktion die Länge des kürzesten Pfades zurückgeben. Der Abstand zwischen zwei direkt benachbarten Knoten auf dem Gitter beträgt hierbei immer `1`.

Hinweis: Verwenden Sie die Funktion `shortest_path()` in Ihrer Implementierung, um den kürzesten Pfad zu berechnen.

In der folgenden Abbildung sehen Sie den kürzesten Weg für ein zufälliges 300x150 Labyrinth mit einer Pfadlänge von 1191:
![solve_maze_example](img/solve_maze_example.png)

In [None]:
def solve_maze(G, s, t):
    # YOUR CODE HERE
    raise NotImplementedError()

## b) Tests

In [None]:
def test_random_maze(horizontal, vertical):
    maze, begin, end = create_maze(horizontal, vertical)
    path, path_length = solve_maze(maze, begin, end)
    visualize_maze(maze, begin, end, path)
    return path_length


def test_solve_maze(maze, begin, end, path):
    path_length = len(path) - 1
    path_out, path_length_out = solve_maze(maze, begin, end)
    visualize_maze(maze, begin, end, path_out)
    assert_equal(path_length, path_length_out)
    assert_equal(path_out, path)
    

def load_data_maze(idx):
    maze = load_data(idx, "maze")
    path = load_data(idx, "path")
    begin = path[0]
    end = path[-1]
    return maze, begin, end, path


In [None]:
test_random_maze(20, 1)

In [None]:
test_random_maze(10, 2)

In [None]:
test_random_maze(13, 7)

In [None]:
test_solve_maze(*load_data_maze(1111))

In [None]:
test_solve_maze(*load_data_maze(2222))


In [None]:
test_solve_maze(*load_data_maze(3333))

In [None]:
test_solve_maze(*load_data_maze(4444))

In [None]:
test_solve_maze(*load_data_maze(5555))

In [None]:
test_solve_maze(*load_data_maze(6666))

## Jupyter Notebook Stolperfalle
Bei der Benutzung von Jupyter Notebooks, wird der globale Zustand aller Variablen zwischen der Ausführung von verschiedenen Zellen erhalten. Dies ist auch der Fall, wenn Zellen gelöscht oder hinzugefügt werden.
Um sicher zu gehen, dass nicht ausversehen notwendige Variablen überschrieben oder gelöscht wurden, kann der Befehl `Kernel -> Restart & Run All` ausgeführt werden.