<img src="./img/logo_wiwi.png" width="23%" align="left">
<img src="./img/decision_analytics_logo.png" width="17%" align="right">

<br><br><br><br><br><br><br><br>


## Algorithmen und Datenstrukturen
Wintersemester 2022/23


# Übung 7: Dijkstra und DAGs


<br><br><br>
J-Prof. Dr. Michael Römer, Till Porrmann 

# Überblick

1. Wiederholung Vorlesung
2. Dijkstra-Algorithmus
3. Directed Acyclic Graphs (DAGs)
4. Vergleich (Laufzeitkomplexität)

# 1. Wiederholung Vorlesung


# Wiederholung Vorlesung
## Dijkstra-Algorithmus 


- Der Dijkstra-Algorithmus sucht nach kürzesten Wegen
- Dabei nicht die Anzahl der Schritte relevant, sondern der Aufwand, der mit den Schritten verbunden ist (Kantengewichte) --> Voraussetzung ist gewichteter Graph

**Idee:**
- Vom Startknoten aus wird geschaut, wie weit die direkt verbundenen Knoten entfernt sind 
- Wir gehen vom nächstgelegenen Knoten aus und bestimmen die Entfernungen seiner Nachbarn **zum Startknoten**
- Danach wird er als abgeschlossen markiert und wir wiederholen den Vorgang mit dem Knoten, der jetzt am nächsten zum Startknoten ist
- Wenn alle Knoten abgeschlossen sind, hat der Algorithmus den kürzesten Weg gefunden

# Wiederholung Vorlesung
## Ablauf Dijkstra

<img src="./img/dijkstra_ablauf.jpg" width="45%" align="left">

# Wiederholung Vorlesung
## DAGs

- Directed Acyclic Graph
- Spezieller Fall von Graphen
- Gerichtet und ohne Zyklen (nicht notwendigerweise gewichtet)
- Gut geeignet zur Darstellung von zeitlichen Abläufen (und vielem mehr)
- Struktur von DAGs kann für effiziente Implementierungen genutzt werden

<img src="./img/dag_einfach.jpg" width="45%" align="left">

# Wiederholung Vorlesung
## Kürzeste Wege in DAGs

- DAGs mit topologisch sortierten Knoten als Grundlage für verbesserten Kürzeste Wege Algorithmus
- Algorithmus ähnelt Dijkstra
- Laufzeit wird verkürzt
- Nächster betrachteter Knoten muss nicht mehr gesucht werden, sondern wird aus topologisch sortierter Liste der Knoten entnommen

# 2. Dijkstra-Algorithmus

- Allgemein
- Ablauf des Algorithmus
- Übungsaufgabe
- Implementierung

# Dijkstra-Algorithmus

## Allgemein

- Algorithmus zum Finden des kürzesten Weges zwischen zwei beliebigen Knoten in einem Graph
- Knoten werden gelabelt (temporäre und permanente Labels)
- Alle Knoten werden im Laufe des Algorithmus als Ausgangspunkt genommen (je nach Implementierung ggf nur relevante Teilmenge)


- Visualisierung zum Verständnis sehr hilfreich
- Gutes [Online-Tool](https://algorithms.discrete.ma.tum.de/graph-algorithms/spp-dijkstra/index_en.html)
- Ablauf im Graph und in den Tabellen (siehe Vorlesung) nachvollziehbar

# Dijkstra-Algorithmus

## Ablauf


**Der Algorithus im Überblick:**
0. Setze die Startwerte für die Knoten-Labels


1. Finde den Knoten, der dem Start am nächsten ist und noch nicht bearbeitet wurde
2. Aktualisiere die Labels seiner Nachfolger

Wiederhole 1. und 2., bis alle Knoten abgearbeitet wurden

<br>

**Ablauf von Schritt 2:**
- Für alle Nachfolger des Knotens:
- 2.1 Berechne eigenes Label + Distanz zum Nachfolger
- 2.2 Wenn Ergebnis kleiner ist als Label des Nachfolgers:
    - 2.2a Setze Ergebnis als neues Label des Nachfolgers

# Dijkstra-Algorithmus

## Ablauf


> <div class="alert alert-block alert-info">
<b>Wende den Dijkstra-Algorithmus auf den unten stehenden Graphen an.</b>
</div>

<img src="./img/dijkstra_aufgabe.jpg" width="65%" align="middle">

# Dijkstra-Algorithmus

## Bestimmen des kürzesten Weges

- Nach Abschluss des Algorithmus ist Entfernung vom Start zum Ziel bekannt
- Kürzester Weg kann ermittelt werden, ist aber vom Algorithmus selbst nicht gegeben
- Auf Basis der Vorgänger wird vom Ziel aus rückwärts vorgegangen

# Dijkstra-Algorithmus

## Python-Implementierung

In [None]:
def dijkstra(graph, start_node):
    
    #initalisierung der Datenstrukturen
    processed = set()
    parents = {}
    costs = {}
    
    for node in graph: # iteriere über alle Knoten 
        costs[node] = float("inf")  # wir setzen zunächst alle Kosten auf unendlich
    costs[start_node] = 0  # dann setzen wir die Kosten des Startknotens auf 0
    
    node = start_node # wir beginnen mit dem Startknoten    
    
    while node is not None: # solange wir einen zu bearbeitenden Knoten haben
        
        # iteration über die "innere" Hash-Tabelle von node (Schlüssel: Nachbar, Wert: Kantengewicht (distanz))
        for neighbor, edge_weight in graph[node].items(): # .items() sorgt dafür, dass Schlüssel-Wert-Paar genutzt wird
            
            # wenn: Entfernung des node vom Startknoten + Distanz von node zu neighbor < bisherige Enferung(neighbor)
            if costs[node] + edge_weight < costs[neighbor]: 
                costs[neighbor] = costs[node] + edge_weight  # aktualisiere Entfernungslabel costs von neighbor
                parents[neighbor] = node # aktualisiere den Vorgänger auf dem kürzesten Weg zum neighbor
        
        processed.add(node) # füge den Knoten zur Menge der beabeiteten hinzu       
        
        node = find_lowest_cost_node(costs, processed) # finde den nächsten Knoten (None, wenn alle bearbeitet wurden) 
    
    return costs, parents # gib sowohl die Kosten als auch die parents zurück


# Dijkstra-Algorithmus

## Python-Implementierung

In [None]:
def find_lowest_cost_node(costs, processed):
    lowest_cost = float("inf") # initialisierung: Enfernung / Kosten auf unendlich
    lowest_cost_node = None #initialisierung
    
    for node, cost in costs.items(): # .items() gibt uns pro Iteration ein Schlüssel-Wert Paar
        
        # wenn die Entfernung des aktuellen Knotens < die bisher kürzeste Entfernung UND der Knoten noch nicht bearbeitet wurde:
        if cost < lowest_cost and node not in processed: 
            lowest_cost = cost   # aktualisiere die bisher besten Kosten
            lowest_cost_node = node 
    return lowest_cost_node

# 3. Directed Acyclic Graphs (DAGs)

- Allgemein
- Topologische Sortierung
- Topologische Sortierung - Algorithmus
- Übungsaufgabe
- Kürzeste Wege in DAGs - Algorithmus
- Übungsaufgabe
- Implementierung

# Directed Acyclic Graphs (DAGs)

## Allgemein

- Graphen, die gerichtet und ohne Zyklen sind
- Erlaubt Nutzung von speziellen Algorithmen, die nicht für alle Graphen funktionieren
    - Für uns vor allem wichtig: 
        - Topologische Sortierung 
        - Kürzeste Wege Verfahren 
- Spezialform: Bäume

<img src="./img/dag_bsp.jpg" width="45%" align="middle">

# Directed Acyclic Graphs (DAGs)

## Topologische Sortierung

- Nur für DAGs möglich
- Oft nicht eindeutig
- Algorithmus zum Finden von topologischer Sortierung kann genutzt werden, um Graphen auf Zyklen zu überprüfen (wenn unklar ob Graph DAG ist oder nicht)

# Directed Acyclic Graphs (DAGs)

## Topologische Sortierung - Algorithmus

- Schritt 0: Erstelle eine leere Liste


- Schritt 1: Finde einen Knoten ohne Vorgänger und füge ihn der Liste hinzu
- Schritt 2: Entferne den Knoten aus dem Graphen


- Wiederhole 1 und 2 solange, wie es Knoten ohne Vorgänger im Graphen gibt


<br>

**Anmerkung:** Wenn es keine Knoten ohne Vorgänger mehr gibt, sind alle Knoten abgearbeitet. Sollte es doch noch Knoten geben, handelt es sich nicht um einen DAG.

# Directed Acyclic Graphs (DAGs)

## Topologische Sortierung - Übungsaufgabe

> <div class="alert alert-block alert-info">
<b>Wende den Algorithmus zur topologischen Sortierung auf den folgenden Graphen an:</b>
</div>

**Knoten:**
- Programmieren lernen
- AuD bestehen
- Zur Schule gehen
- Abitur
- Bachelor-Abschluss
- Master-Abschluss
- Nobel-Preis gewinnen

**Kanten:**
- Programmieren lernen --> AuD bestehen
- Abitur --> Bachelor-Abschluss
- AuD bestehen --> Bachelor-Abschluss
- Bachelor-Abschluss --> Master-Abschluss
- Zur Schule gehen --> Abitur

# Directed Acyclic Graphs (DAGs)

## Kürzeste Wege

- In Graphen kürzeste Wege zwischen Knoten oft relevant
- Bereits kennengelernt: Dijkstra (und Breitensuche)
- Verbessertes Verfahren für DAGs möglich
- Ziel ist geringe Laufzeit

# Directed Acyclic Graphs (DAGs)

## Kürzeste Wege

- Ähnlicher Ansatz wie bei Dijkstra: Knoten können temporär und permanent gelabelt werden
- Durchlaufen aller Knoten und jeweils Aktualisierung der Nachfolger


- **Aber:** Nutzung der topologischen Sortierung:
    - Es muss nicht in jedem Schritt nächster Knoten zu Start gefunden werden
    - Wenn topologische Sortierung vorliegt, existiert Reihenfolge der Knoten so, dass alle Nachfolger in der Reihenfolge **nach** ihren Vorgängern kommen
    - Dadurch kann topologische Sortierung als Reihenfolge der Knoten-Abarbeitung genutzt werden ohne Gefahr einzugehen, dass permanent gelabelter Knoten noch geändert werden muss

# Directed Acyclic Graphs (DAGs)

## Kürzeste Wege - Algorithmus

- (ggf. Vorbereitung: DAG topologisch sortieren)

- Schritt 0: Setze Entfernung für alle Knoten auf $\infty$, außer Startknoten (Entfernung $0$)


- Schritt 1: Nimm den nächsten Knoten aus der topologisch sortierten Liste  
- Schritt 2: Aktualisiere alle Nachfolger-Knoten, wenn Weg über betrachteten Knoten kürzer ist  

  
- Wiederhole Schritte 1 und 2 solange, bis Liste leer ist

# Directed Acyclic Graphs (DAGs)

## Kürzeste Wege - Beispiel

> <div class="alert alert-block alert-info">
<b>Wende den Algorithmus für kürzeste Wege in DAGs auf den folgenden Graphen (von a zu e) an:</b>
</div>

### Topologische sortierte Liste: ```[a, b, c, d, f, e]```

<img src="./img/dag_aufgabe.jpg" width="45%" align="middle">

| Knoten | Entfernung Schritt 0 |Entfernung Schritt 1 | Entfernung Schritt 2 | Entfernung Schritt 3 | Entfernung Schritt 4 | Entfernung Schritt 5 |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| **a** | 0 |    |    |    |   
| **b** | $\infty$ |    |    |    |   
| **c** | $\infty$ |    |    |    |   
| **d** | $\infty$ |    |    |    |   
| **e** | $\infty$ |    |    |    |   
| **f** | $\infty$ |    |    |    |   

# Directed Acyclic Graphs (DAGs)

## Implementierung

In [1]:
def dag_shortest_path(graph, start_node, topo_sorted_nodes): # Wir übergeben die sortierten Knoten bereits als list
    
    #initalisierung der Datenstrukturen
    parents = {}
    costs = {}
    
    #Setzen der Startwerte
    for node in graph: # iteriere über alle Knoten 
        costs[node] = float("inf")  # wir setzen zunächst alle Kosten auf unendlich
    costs[start_node] = 0  # dann setzen wir die Kosten des Startknotens auf 0

    
    for node in topo_sorted_nodes: # für jeden Knoten, in topologischer Sortierung
        
        # iteration über die "innere" Hash-Tabelle von node (Schlüssel: Nachbar, Wert: Kantengewicht (distanz))
        for neighbor, edge_weight in graph[node].items(): # .items() sorgt dafür, dass Schlüssel-Wert-Paar genutzt wird

            # wenn: Entfernung des node vom Startknoten + Distanz von node zu neighbor < bisherige Enferung(neighbor)
            if costs[node] + edge_weight < costs[neighbor]: 
                costs[neighbor] = costs[node] + edge_weight  # aktualisiere Entfernungslabel costs von neighbor
                parents[neighbor] = node # aktualisiere den Vorgänger auf dem kürzesten Weg zum neighbor
            
    return costs, parents # gib sowohl die Kosten als auch die parents zurück

# Directed Acyclic Graphs (DAGs)

## Implementierung - Übungsaufgabe

> <div class="alert alert-block alert-info">
<b>Implementiere den Graph mit Hash-Tabellen und nutze die Funktion "dag_shortest_path" um den kürzesten Weg zu finden.</b>
</div>

### Topologische sortierte Liste: ```[a, b, c, d, f, e]```

<img src="./img/dag_aufgabe.jpg" width="45%" align="middle">

# 4. Vergleich

- Laufzeiten Dijkstra
- Laufzeiten kürzeste Wege in DAGs

# Vergleich

## Laufzeit Dijkstra

><div class="alert alert-block alert-info">
<b>Welche Laufzeitkomplexität hat das Verfahren?</b></div>

In [None]:
def dijkstra(graph, start_node):
    processed = set()
    parents = {}
    costs = {}
    
    for node in graph:
        costs[node] = float("inf")
    costs[start_node] = 0  
    node = start_node 
    
    while node is not None:
        for neighbor, edge_weight in graph[node].items(): 
            if costs[node] + edge_weight < costs[neighbor]: 
                costs[neighbor] = costs[node] + edge_weight
                parents[neighbor] = node 
        
        processed.add(node) 
        node = find_lowest_cost_node(costs, processed) 
        
    return costs, parents

In [None]:
def find_lowest_cost_node(costs, processed):
    lowest_cost = float("inf")
    lowest_cost_node = None 
    
    for node, cost in costs.items(): 
        if cost < lowest_cost and node not in processed: 
            lowest_cost = cost  
            lowest_cost_node = node 
    return lowest_cost_node

# Vergleich

## Laufzeit Dijkstra

- Laufzeit abhängig von Anzahl Knoten $N$ und Anzahl Kanten $E$
- Dijkstra kommt insgesamt auf $O(|N|²+|E|)$ 
- ```find_lowest_cost_node``` hat Laufzeit von $O(|N|)$


- Wenn nur auf $N$ bezogen ist Laufzeit $O(|N|²)$, da $E$ maximal so groß ist wie $|N|²$

# Vergleich

## Laufzeit kürzeste Wege in DAGs

><div class="alert alert-block alert-info">
<b>Welche Laufzeitkomplexität hat das Verfahren?</b></div>

In [1]:
def dag_shortest_path(graph, start_node, topo_sorted_nodes):
    parents = {}
    costs = {}

    for node in graph: 
        costs[node] = float("inf")  
    costs[start_node] = 0  
    
    for node in topo_sorted_nodes: 
        for neighbor, edge_weight in graph[node].items():
            if costs[node] + edge_weight < costs[neighbor]: 
                costs[neighbor] = costs[node] + edge_weight  
                parents[neighbor] = node 
            
    return costs, parents 

# Vergleich

## Laufzeit kürzeste Wege in DAGs

- Laufzeit abhängig von Anzahl Knoten $N$ und Anzahl Kanten $E$
- Kürzeste Wege in DAGs insgesamt $O(|N|+|E|)$
- Einsparung von $O(|N|)$ in jedem Schritt gegenüber Dijkstra (durch gegbene Reihenfolge) 


- Wenn nur auf $N$ bezogen ist Laufzeit $O(|N|²)$, da $E$ maximal so groß ist wie $|N|²$

# Vielen Dank für Eure Aufmerksamkeit