<img src="./img/logo_wiwi.png" width="23%" align="left">
<img src="./img/decision_analytics_logo.png" width="17%" align="right">

<br><br><br><br>


## Algorithmen und Datenstrukturen
Wintersemester 2024/25


# 7a Kürzeste Wege in gerichteten azyklischen Graphen


<br><br><br>
J-Prof. Dr. Michael Römer, Jakob Schulte

## Überblick

1. Motivation: Schnellere kürzere Wege in gerichteten azyklischen Graphen
2. Topologische Sortierung von Knoten in gerichteten azyklischen Graphen
3. Ermittlung einer Topologischen Sortierung
4. Kürzeste Wege in DAGs: Algorithmus
4. Kürzeste Wege in DAGs: Python-Implementierung
6. Zusammenfassung

## Motivation: Gerichtete Azyklische Graphen

Wir kennen bereits folgende Konzpte:
- gerichtete Graphen 
- Zyklen in gerichteten Graphen 

Beides brauhen wir für folgende Definition:

> Einen gerichteten Graphen ohne Zyklen nennt man einen **gerichteten azyklischen Graph** (directed acyclic graph, **DAG**)
- gerade für Optimierungsprobleme ist diese Eigenschaft sehr wichtig, weil viele Probleme auf DAGs leichter zu lösen sind als auf allgemeinen Graphen!

Schauen wir uns doch noch einnmal unsere Beispielgraphen an:

<img src="./img/02.png" width="30%" align="left">

<img src="./img/25.png" width="30%" align="right">

..beide sind DAGs!

## Motivation: Kürzeste Wege in azyklischen Graphen

Aufgrund ihrer Struktur erlauben DAGs eine effizientere Berechung von kürzesten Wegen:
- kürzeste Wege in DAGs: $O(|N| + |E|)$ (Anzahl Knoten + Anzahl Kanten)

Zum Vergleich:
- unsere Dijkstra-Implementierung braucht $O(|N|^2 + O|E|)$
- eine effizientere Dijkstra-Implementierung braucht $O(|N| \log |N| + O|E|)$

#### In diesem Teil werden wir lernen
- wieso das so ist und
- wie der Algorithmus für kürzeste Wege in DAGs funktioniert


## Gerichtete azyklische Graphen: Relevanz in der Praxis


In der praktischen Modellierung / Problemlösung kommen folgende Fälle oft vor:
- Knoten haben Zeitinformationen (z.B. Abfahrtzeiten von Bussen, Zügen, oder Abflugzeiten an Flughäfen)
- Knoten beziehen sich auf Stufen / Phasen / Schritte (z.B. Wartungszustände, akkumulierte Arbeitszeit, Anzahl besuchter Kunden, etc.)

In diesen Fällen "kann man nicht zurück"  $\rightarrow$  der resultierende Graph ist azyklisch

<img src="./img/Kleidergraph.png" width="30%" align="right"> 

Außerdem können gerichtete Graphen genutzt werden, um **Abhängigkeiten zwischen Schritten** darzustellen
- z.B. in einem Projekt "Schritt B kann nur durchgeführt werden, wenn Schritt A fertig ist"
- siehe Beispiel rechts (Quelle: Wikipedia)
- diese Graphen sollten azyklisch sein, weil sonst ein **Deadlock** vorliegt

# 2. (Topologische) Sortierung von Knoten in DAGs

## Gerichtete Graphen: Topologische Sortierung

Eine Kerneigenschaft von DAGs ist, dass man die Knoten **topologisch sortieren** kann:

>Eine Liste der Knoten heißt **topologisch sortiert**, wenn gilt:
> - kein **Vorgänger** eines Knotens kommt in der Liste **nach** diesem Knoten 

<img src="./img/Kleidergraph.png" width="30%" align="right"> 

### Topologische Sortierung im Ankleidebeispiel
- eine topologische Sortierung gibt uns eine "zulässige" Ankleidereihenfolge!

Beispiel für topologische Sortierungen:

- Unterhose $\rightarrow$ Socken $\rightarrow$ Unterhemd  $\rightarrow$ Hose  $\rightarrow$ Pullover  $\rightarrow$ Mantel  $\rightarrow$ Schuhe

- Unterhose $\rightarrow$ Hose  $\rightarrow$  Socken  $\rightarrow$ Unterhemd  $\rightarrow$ Pullover   $\rightarrow$  Schuhe $\rightarrow$ Mantel

#### Beachte: Topologische Sortierungen sind in der Regel nicht eindeutig!

## Topologische Sortierung: Weitere Beispiele

><div class="alert alert-block alert-info">
<b> Wie sehen mögliche topologische Sortierungen für die Knoten der folgenden Graphen aus? </b></div>

<img src="./img/03.png" width="30%" align="left"> 
<img src="./img/25.png" width="35%" align="right">



# 3. Ansätze zur Ermittlung von topologischen Sortierungen

## Wie kommt man zu einer topologischen Sortierung?

Wie kann man eine topologische Sortierung ermitteln?

<center>
<img src="./img/Kleidergraph.png" width="20%" align="middle"> 
</center>

#### Ein einfacher graphischer Ansatz:
- ordne die Knoten linear nebeneinander so an, dass alle Kanten von links nach rechts zeigen
<img src="./img/Kleidergraphsortiert.png" width="75%" align="middle"> 

## Algorithmus zur Herstellung einer topologischen Sortierung

**Ziel:** Erstelle eine topologisch sortierte Liste $L$ der Knoten eines (gerichteten, azyklischen) Graphen

### Einfache Beschreibung des Algorithmus: 

Solange es Knoten ohne Vorgänger gibt:
- wähle einen solchen Knoten
- hänge ihn an die Liste $L$ an
- entferne den Knoten samt seiner ausgehenden Kanten (dadurch gibt es ggf. neue Knoten ohne Vorgänger)

(dies ist der so genannte Algorithmus von Kahn)

## Algorithmus zur Herstellung einer topologischen Sortierung


Am Beispiel-Graph:  <img src="./img/03.png" width="30%" align="center"> 

Wir beginnen mit einer leeren Liste $L$

Zunächst hat nur der Knoten "START" keine Vorgänger

<img src="./img/03_topo_2.png" width="30%" align="right"> 

**Schritt 1:**
- Hänge START an die Liste an: $L$ = \[ START \]
- Entferne START samt ausgehender Kanten
- nun hat Knoten B keinen Vorgänger mehr

<img src="./img/03_topo_3.png" width="30%" align="right"> 

**Schritt 2:**
- Hänge B an die Liste an: $L$ = \[ START, B \]
- Entferne B samt ausgehender Kanten
- nun hat Knoten A keinen Vorgänger mehr

<img src="./img/03_topo_4.png" width="30%" align="right"> 

**Schritt 3:**
- Hänge A an die Liste an: $L$ = \[ START, B, A \]
- Entferne A samt ausgehender Kanten
- nun hat Knoten ZIEL keinen Vorgänger mehr



**Schritt 4:**
- Hänge ZIEL an die Liste an: $L$ = \[ START, B, A, ZIEL \]
- ZIEL wird  entfernt
- ... alle Knoten wurden bearbeitet, und die Liste ist topologisch sortiert!

## Algorithmus zur Herstellung einer topologischen Sortierung: Etwas formaler

- $L$ sei eine leere Liste, in der die Knoten in topologischer Sortierung ablegt werden
- Bilde eine Menge $S$ an Knoten, die keine eingehenden Kanten hat
- Für jeden Knoten $v$ in der Menge $S$:
  - hänge $v$ an die Liste $L$ an
  - entferne $v$ und alle von $v$ ausgehenden Kanten
    - für jede von $v$ ausgehende Kante:
       - wenn der Zielknoten nach Entfernung der Kante keine eingehenden Kanten hat: 
         - füge ihn zu $S$ hinzu


## Anmerkung zur Implementierung

- in unserer Implementierung eines Graphen (siehe Teil 6/7) speichern wir die eingehenden Kanten eines Knotens nicht
- was wir stattdessen tun können:
  - wir speicheren bei jedem Knoten die Anzahl der eingehenden Kanten  (z.B. mit einer Hash-Tabelle)
      - dies kann entweder direkt beim Erstellen des Graphen passieren oder in einem Durchlauf durch alle Kanten 
  - bei der Entfernung eines Knotens und seiner ausgehenden Kanten reduzieren wir diese Werte jeweils
  
  
.. beachte: wir zeigen hier keine Implementierung dieses Algorithmus

## Topologische Sortierung: Komplexität

><div class="alert alert-block alert-info">
<b> Was ist die Laufzeitkomplexität des Algorithmus zur topologischen Sortierung? </b></div>

## "Natürliche" topologische Sortierungen

Nicht immer ist es nötig, die Knoten explizit topologisch zu sortieren!

In den o.g. Praxisbeispielen für DAGs gibt es eine Reihe von "natürlichen" Sortierkriterien, die eine Topologische Sortierung implizieren:
- wenn Knoten mit Zeit assoziiert sind: zeitliche Sortierung der Knoten
- wenn Knoten mit Stufen o.ä. assoziiert sind: Sortierung anhand der Stufen



# 4. Kürzeste Wege in DAGs: Algorithmus

## Kürzeste Wege in DAGs - der Algorithmus

####  Skizze des Algorithmus

- Setze zunächst die Entferungen aller Knoten auf $\infty$, außer für den Startknoten (Entferngung = 0)
- Durchlaufe die Knoten in topologischer Sortierung, für jeden Knoten $v$: 
  - für jeden Nachfolger $w$ des Knoten:
    - aktualisiere den kürzesten Weg zu $w$, falls der Weg über $v$ kürzer ist als der bisher bekannte

#### Beachte:
- falls die topologische Sortierung nicht bekannt / natürlich gegeben ist, muss sie vorher ermittelt werden!

#### Vergleich mit Dijkstra
- auch bei Dijkstra werden alle Knoten durchlaufen und die kürzesten Wege zum Nachfolger aktualisiert
- es wird allerdings der nächste zu bearbeitende Knoten in jeder Iteration **auf Basis der bisherigen kürzesten Wege bestimmt**
- $\rightarrow$ **dies kann man sich in einem DAG sparen, weil man anhand der topologischen Sortierung vorgeht!**


## Kürzeste Wege in DAGs: Beispiel:


<img src="./img/03.png" width="30%" align="center"> 

- Wir haben die topologische Sortierung $L$ = \[ START, B, A, ZIEL \]
- wir initialisierung zuerst die Entfernungen:

|Knoten|Entfernung|
|--|--|
|START | 0 |
| A | $\infty$ |
| B | $\infty$ |
| ZIEL | $\infty$ |




Topologische Sortierung $L$ = \[ START, B, A, ZIEL \]

#### Iteration 1: Knoten START

|Knoten|Entfernung|
|--|--|
|START | 0 |
| A | 6 |
| B | 2 |
| ZIEL | $\infty$ |


Topologische Sortierung $L$ = \[ START, B, A, ZIEL \]

#### Iteration 2: Knoten B

<img src="./img/03.png" width="30%" align="right"> 

|Knoten|Entfernung|
|--|--|
|START | 0 |
| A | 5 |
| B | 2 |
| ZIEL | 7 |


Topologische Sortierung $L$ = \[ START, B, A, ZIEL \]

#### Iteration 3: Knoten A

<img src="./img/03.png" width="30%" align="right"> 

|Knoten|Entfernung|
|--|--|
|START | 0 |
| A | 5 |
| B | 2 |
| ZIEL | 6 |


Topologische Sortierung $L$ = \[ START, B, A, ZIEL \]

#### Iteration 4: Knoten ZIEL

<img src="./img/03.png" width="30%" align="right"> 

.. keine Änderung, da letzer Knoten!

|Knoten|Entfernung|
|--|--|
|START | 0 |
| A | 5 |
| B | 2 |
| ZIEL | 6 |


## Kürzeste Wege in DAGs: Laufzeitkomplexität

><div class="alert alert-block alert-info">
<b> Was ist die Laufzeitkomplexität des Algorithmus für kürzeste Wege in DAGs? </b></div>

#### Vergleich mit Dijkstra
- unsere Dijkstra-Implementierung hatte eine Laufzeit von  $O(|N|^2 + O|E|)$
- eine effizientere Dijkstra-Implementierung braucht $O(|N| \log |N| + O|E|)$

... $\rightarrow$ in DAGs lassen sich kürzeste Wege sehr viel effizenter berechnen!

# 5. Kürzeste Wege in DAGs: Python-Implementierung

## Kürzeste Wege in DAGs: Python-Implementierung

In [2]:
def dag_shortest_path(graph, start_node, topo_sorted_nodes):
    
    #initalisierung der Datenstrukturen
    parents = {}
    costs = {}
    
    for node in graph: # iteriere über alle Knoten 
        costs[node] = float("inf")  # wir setzen zunächst alle Kosten auf unendlich
        
    costs[start_node] = 0  # dann setzen wir die Kosten des Startknotens auf 0
    
    node = start_node # wir beginnen mit dem Startknoten    
    
    for node in topo_sorted_nodes: # für jeden Knoten, in topologischer Sortierung
        
        # iteration über die "innere" Hash-Tabelle von node (Schlüssel: Nachbar, Wert: Kantengewicht (distanz))
        for neighbor, edge_weight in graph[node].items(): # .items() sorgt dafür, dass Schlüssel-Wert-Paar genutzt wird
            
            # wenn: Entfernung des node vom Startknoten + Distanz von node zu neighbor < bisherige Enferung(neighbor)
            if costs[node] + edge_weight < costs[neighbor]: 
                costs[neighbor] = costs[node] + edge_weight  # aktualisiere Entfernungslabel costs von neighbor
                parents[neighbor] = node # aktualisiere den Vorgänger auf dem kürzesten Weg zum neighbor
            
    return costs, parents # gib sowohl die Kosten als auch die parents zurück


## Test der Python-Implementierung

In [3]:
graph = {}
graph["start"] =  {"A":6, "B":2} # Direkte Initialisierung des dict mit Schlüssel:Wert-Paaren    
graph["A"] =  {"fin":1} 
graph["B"] =  {"A":3, "fin":5}  
graph["fin"] =  {}  
graph

sorted_nodes = ["start","B","A","fin"]

dag_shortest_path(graph, "start", sorted_nodes)

({'start': 0, 'A': 5, 'B': 2, 'fin': 6}, {'A': 'B', 'B': 'start', 'fin': 'A'})

## Zusammenfassung

- gerichtete azyklische Graphen (DAGs) sind eine wichtige und praktisch relevante Klasse von Graphen
- in diesen Graphen lassen sich kürzeste Wege deutlich effizienter berechnen als in allgemeinen Graphen
- der Algorithmus für kürzeste Wege in DAGs durchläuft alle Knoten in der Reihenfolge einer topologischen Sortierung
- alle DAGs können effizient (in Linearzeit) topologisch sortiert werden
  - manchmal liegt eine "natürliche" topologische Sortierung vor

#### Ausblick
- im nächsten Teil befassen wir uns mit **schwierigeren** Problemen
- wir lernen **Greedy-Verfahren** kennen, ein Konstruktionsprinzip für **Heuristiken**
  - d.h. Verfahren, die in kurzer Zeit (hoffentlich) gute Lösungen erzeugen.