In [1]:
import time

<img src="./img/logo_wiwi.png" width="23%" align="left">
<img src="./img/decision_analytics_logo.png" width="17%" align="right">

<br><br><br><br>


## Algorithmen und Datenstrukturen
Wintersemester 2024/25


# 4 Rekursives Problemlösen nach dem Teile-und-Herrsche-Prinzip: Quicksort und andere Beispiele


<br><br><br>
J-Prof. Dr. Michael Römer, Jakob Schulte

## Motivation und Einordnung

In der letzten Woche haben wir das Prinzip der **Rekursion** kennengelernt.

#### In diesem Teil
- beschäftigen wir uns mit **Teile-und-Herrsche**, einem Prinzip zur Problemlösung, in dem ein Problem **rekursiv** in immer kleinere Teile zerlegt wird
- wir lernen mehrere Beispiele für Algorithmen kennen, die auf dem Prinzip **Teile-und-Herrsche** beruhen,
- insbesondere betrachten wird **Quicksort**, eines der schnellsten Sortierverfahren 




## Überblick

1. Das Teile-und-herrsche(divde-and-conquer)-Prinzip
   - Aufteilung von Flächen
   - Rekursive Summenberechnung
2. Quicksort: Sortieren mit dem Teile-und-Herrsche-Prinzip
3. Vertiefung Big O-Notation
6. Zusammenfassung

# 1. Teile und herrsche

## Aufteilung einer Fläche in quadratische Parzellen

- Ein Stück Land soll in kleinere Parzellen aufgeteilt werden

<img src="./img/01.png" width="40%" align="middle">

- Diese sollen alle gleich groß und quadratisch sein
- Ziel ist es, dass die Parzellen möglichst groß sind und das gesamte Land aufgeteilt ist
  - die folgenden Lösungen sind nicht korrekt:

<img src="./img/02.png" width="50%" align="middle">


## Das Prinzip "Teile-und-herrsche" 

- Wichtiges Konzept beim Entwerfen von Algorithmen
- Eng verbunden mit Rekursion
- Idee: zerlege ein Problem in kleinere Teilprobleme (**Rekursionsfall**)
- Irgendwann sollten Teilprobleme so einfach sein, dass man sie umittelbar lösen kann / die Lösung trivial ist (**Basisfall**)

## Aufteilung einer Fläche in quadratische Parzellen: Basisfall

- Der Basisfall muss so einfach sein, dass er direkt gelöst werden kann

><div class="alert alert-block alert-info">
<b>Was wäre hier ein möglicher Basisfall?</b></div>


- Das Problem wird trivial, wenn eine Seitenlänge ein Vielfaches der anderen ist
- wir können dann ein Quadrat mit Seitenlänge der kurzen Seite des Rechtecks mehrfach einfügen

<img src="./img/03.png" width="80%" align="middle">

## Aufteilung einer Fläche in quadratische Parzellen: Idee und Vorgehen

#### Ausgehend vom Basisfall entwickeln wir folgende Idee:

- Beginnend am linken Rand: Fülle das Rechteck mit Quadraten **mit Seitenlänge der kurzen Seite**
- wenn keine Restfläche bleibt, sind wir fertig (**Basisfall!**)
- sonst bleibt eine rechteckige Restfläche:

<img src="./img/04.png" width="40%" align="middle">

- für die (rechteckige) Restfläche: **Wiederhole das Vorgehen rekursiv mit der Restfläche**
- dies ist also der **Rekursionsfall**

## Aufteilung einer Fläche in quadratische Parzellen: Durchspielen des Beispiels

- Wir starten mit der Ausgangsfläche

<img src="./img/05.png" width="70%" align="middle">

- Es folgt Anwendung des gleichen Algorithmus auf das neue Teilproblem

## Aufteilung einer Fläche in quadratische Parzellen: Durchspielen des Beispiels

- Neues Teilproblem:

<img src="./img/06.png" width="25%" align="middle">

- Wird aufgeteilt:

<img src="./img/07.png" width="40%" align="middle">

## Aufteilung einer Fläche in quadratische Parzellen: Durchspielen des Beispiels

- Neues Teilproblem und Aufteilung:

<img src="./img/08.png" width="50%" align="middle">

- Nächste Aufteilung...

<img src="./img/09.png" width="50%" align="middle">


## Aufteilung einer Fläche in quadratische Parzellen: Durchspielen des Beispiels

#### $\rightarrow$ Basisfall erreicht!
- Nun Aufteilung in gleich große Quadrate

<img src="./img/10.png" width="30%" align="middle">

<br>

- Diese Quadratgröße kann genutzt werden, um das gesamte Land aufzuteilen

<img src="./img/11.png" width="50%" align="middle">

## Aufteilung einer Fläche in quadratische Parzellen: Wieso funktioniert das?

<img src="./img/04.png" width="30%" align="right">

**Die entscheidenden Frage ist: "Wieso ist die Lösung für das "Rest-Rechteck" gleichzeitig die Lösung für das "große" Rechteck?**



#### Beachte:
- **1.** das gesuchte Quadrat muss **sowohl hinsichtlich der langen als auch hinsichtlich der kurzen Seite** des Rechtecks **restlos passen** (d.h. es bleibt weder in der Länge noch in der Breite Fläche übrig)
- **2.** ein Quadrat, das **hinsichtlich der kurzen Seite (des Ausgangsrechtecks) ohne Rest passt**, passt auch ohne Rest in ein **Quadrat mit Seitenlänge der kurzen Seite**

#### Daher gilt:
- wenn es ein Quadrat gibt, das für das "Restrechteck" eine Lösung darstellt, d.h. das Restrechteck restlos ausfüllt,
- so muss es hinsichtlich der kurzen Seite des Ausgangsrechtecks passen
- und somit auch für die "großen" Quadrate mit Seitenlänge der kurzen Seite des Ausgangsrechtecks!

## Beobachtung: Der Euklidische Algorithmus

- unser Algorithmus ist nichts anderes als eine geometrische Interpretation des berühmten **Euklidischen Algorithmus** zur Berechnung des größten gemeinsamen Teilers (ggT) zweier ganzer Zahlen
- dabei sind die Seitenlängen des Ausgangsrechtecks die beiden Zahlen
- unsere Erklärung der Funktionsweise kann als geometrischer Beweis der Korrektheit des Algorithmus dienen

..mehr zum Euklidischen Algorithmus, inkl. anderer Korrektheitsbeweise, gibt es [hier](https://de.khanacademy.org/computing/computer-science/cryptography/modarithmetic/a/the-euclidean-algorithm)!

## Das Prinzip "Teile-und-herrsche" 

- Wichtiges Konzept beim Entwerfen von Algorithmen
- Eng verbunden mit Rekursion
- Idee: zerlege ein Problem in kleinere Teilprobleme (**Rekursionsfall**)
- Irgendwann sollten Teilprobleme so einfach sein, dass man sie umittelbar lösen kann / die Lösung trivial ist (**Basisfall**)
- Wenn man vor eine konkrete Aufgabe / ein konkretes Problem  betrachtet, ist es oftmals sinnvoll, zunächst überlegen, was der Basisfall sein könnte

## Ein weiteres Beispiel: Rekursive Summenberechnung

- **Aufgabenstellung**: Zähle alle Zahlen eines Arrays zusammen
- eine **iterative** Funktion könnte so aussehen:

In [None]:
def summieren(arr):
    summe = 0
    for zahl in arr:
        summe += zahl
    return summe

><div class="alert alert-block alert-info">
<b>Wie könnte eine rekursive Funktion dafür aussehen?</b></div>

**Tipps:**
- Wir brauchen einen Basisfall
- Mit jedem rekursiven Aufruf sollten wir auf den Basisfall "hinarbeiten"
- Es sollten zwei ```return```-Befehle genutzt werden (einer für den Basis- und einer für den Rekursionsfall)

## Ein weiteres Beispiel: Rekursive Summenberechnung

In [1]:
def summieren_rekursiv(arr):
    return


- Funktionsweise des rekursiven Ansatzes:

<img src="./img/12.png" width="50%" align="middle">

## Ein weiteres Beispiel: Rekursive Summenberechnung

- Ablauf der Funktion (hier ```sum``` genannt) für das Array ```[2,4,6]```

<img src="./img/13.png" width="65%" align="middle">

<br><br>

> **Allgemeiner Tipp:** Bei rekursiven Funktionen mit Arrays ist der Basisfall meist ein leeres Array oder eines mit nur einem Element.

## Frage: Teile-und-herrsche bei binärer Suche

- wie im letzten Teil besprochen wurde, kann auch die binäre Suche rekursiv implementiert werden
- allgemein kann man die binäre Suche als Teile-und-herrsche-Verfahren bezeichnen

><div class="alert alert-block alert-info">
<b>Was ist bei der binären Suche der Basisfall und was der Rekursionsfall?</b></div>

# 2. Quicksort

## Sortieren nach dem Teile-und-herrsche-Verfahren: Quicksort

- Wir betrachten nun einen neuen Algorithmus zum sortieren eines Arrays, der das Teile-und-herrsche-Verfahren verwendet
- er ist sehr performant $\rightarrow$ in der Praxis viel eingesetzt
- ist (in Varianten) in den Standardbibliotheken vieler Programmiersprachen implementiert

><div class="alert alert-block alert-info">
<b>Was ist beim rekursiven Sortieren eines Arrays der Basisfall?</b></div>


## Quicksort: Basisfall

- Basisfall für (rekursive) Sortieralgorithmen:

<img src="./img/14.png" width="60%" align="middle">

- Basisfall in Code:

In [None]:
def quicksort(array):
    if len(array) <= 1:
        return array

# Quicksort: Zwei und mehr Elemente

- Der Fall für **zwei Elemente** ebenfalls einfach: 
  - überprüfe welches größer ist und tausche ggf.
- Frage: Wie können wir bei drei und mehr Elementen vorgehen?

<img src="./img/15.png" width="20%" align="middle">

- **Erste Idee von Quicksort:** 
> Zunächst nehmen wir **ein Element des Arrays** und vergleichen alle anderen damit

## Quicksort: Das Pivot-Element


<img src="./img/16.png" width="10%" align="middle">

- Das zu vergleichende Element wird auch als **Pivot-Element** bezeichnet
- Zur Auswahl des Pivot-Elements gibt es verschiedene Strategien, wir nehmen einfach das erste Element





- Im nächsten Schritt bilden wir zwei Teilarrays: 
  - eines mit Werten die **kleiner** als das Pivotelement sind
  - eines mit Werten die **größer** als das Pivotelement sind
- kleinere Werte werden davor, größere dahinter gestellt

<img src="./img/17.png" width="70%" align="middle">



## Quicksort: Partitionierung und Rekursionsfall

- Das Array ist jetzt aufgeteilt in:
    - Teilarray von Zahlen $\leq$ Pivot-Element
    - Pivot-Element
    - Teilarray von Zahlen > Pivot-Element
    
- Den Aufteilungsvorgang nennt man **Partitionierung**
- **Wichtig:** Die Teilarrays sind dann zwar relativ zum Pivot-Element richtig positioniert, aber **nicht sortiert**
- Wenn die Teilarrays sortiert wären, so wäre gesamtes Array sortiert


- **Daher nächster Schritt:** (Rekursives) Anwenden von Quicksort auf die beiden Teilarrays:

`quicksort([15, 10]) + [33] + quicksort([])`
- beide Fälle sind trivial!

In [2]:
## beachte: Listen können mit + zusammengeführt werden:
lange_liste = [1,2,3] + [5] + [6,9,8]
lange_liste

[1, 2, 3, 5, 6, 9, 8]

><div class="alert alert-block alert-info">
<b>Was wäre bei anderer Wahl des Pivot-Elements passiert?</b></div>

## Quicksort: Allgemeine Beschreibung

- Wir wollen ein Array mit $n$ Elementen sortieren
- im Fall von **n $\leq$ 1** haben wir den **Basisfall**
- ansonsten wählen wir ein **Pivotelement** und **partitionieren** das Array wie folgt:
    - Teilarray mit kleineren Werten (zwischen $0$ und $n-1$ Elemente)
    - Pivotelement
    - Teilarray mit größeren Werten (zwischen $0$ und $n-1$ Elemente)
- dann wenden wir für beide Teilarrays Quicksort **rekursiv** an (**Rekursionsfall**)

## Quicksort: Beispiel für $n=5$

- Zu sortierendes Array: ```[3, 5, 2, 1, 4]```
- Alle möglichen Fälle für Wahl des Pivots:

<img src="./img/18.png" width="60%" align="middle">

## Quicksort: Beispiel für $n=5$

- Vorgehen für Pivot = 3

<img src="./img/19.png" width="50%" align="middle">

- ```qsort([2,1])``` und ```qsort([5,4])``` liefern sortierte Arrays
- Dadurch vollständige Sortierung sichergestellt

## Quicksort: Implementierung in Python


- Der Basisfall ist durch folgenden Code abgedeckt:

In [9]:
def quicksort(array):
    # Basisfall:
    if len(array) <= 1:  
        return array
    
    # Rekursionsfall:  


><div class="alert alert-block alert-info">
<b>Wie lässt sich der Rekursionsfall implementieren?</b></div>

In [11]:
quicksort([10,7,9,15,4,12])

[7, 9, 4]  --  [10]  --  [15, 12]
[4]  --  [7]  --  [9]
[12]  --  [15]  --  []


[4, 7, 9, 10, 12, 15]

## Quicksort: Effizientere Implementierung des Partitionsschritts
- die obige Implementierung zeigt die Funktionsweise von Quicksort sehr gut
- allerdings ist sie nicht sehr effizient, weil im Partitionierungsschritt immer wieder neue Arrays angelegt werden
  - dies ist sehr "teuer", da immer wieder Speicher allokiert wird (s. Teil 2 zu Datenstrukturen)
- daher wird der Partitionsschritt in der Regel so implementiert, dass innerhalb des bestehenden Arrays "Plätze getauscht" werden
- eine gute Erklärung finden Sie  [hier](https://de.khanacademy.org/computing/computer-science/algorithms/quick-sort/a/linear-time-partitioning)

## Quicksort: Wie kann man zeigen, dass der Algorithmus funktioniert?
- in der Informatik geht es oftmals darum, zu beweisen, ob Algorithmen funtionieren
- bei rekursiven Algorithmen bietet sich eine Strategie an, die man **vollständige Induktion** nennt
- dabei beginnt man mit dem Basisfall (**Induktionsanfang**) und zeigt, dass der Basisfall (hier: n $\leq$ 1) korrekt funktioniert
- dann schaut man sich den "nächstgrößeren" Fall an (hier: n=2), der den Basisfall aufruft, und zeigt, dass für den Fall dass der Basisfall funktioniert, der Algorithmus für diesen Fall auch funktioniert
- allgemein zeigt man:
  - falls im "aktuellen" Schritt **die rekursiven Aufrufe das korrekte Ergebnis** liefern, dann **ist der aktuelle Schritt korrekt**
  - dies nennt man den **Induktionsschritt**

## Illustration der Logik des Induktionsbeweises für Quicksort

- wir wissen, dass der Basisfall (**n $\leq$ 1**) funktioniert
- für **n=2** gilt: Schon Pivot+Partitionierung gibt uns ein sortiertes Array

- für **n=3** gilt: Pivot+Partitionierung gibt uns Aufrufe für Quicksort mit maximal n $\leq$ 2 (und da wissen wir, dass es funktioniert), und weil die Partitionierungsbedingungen gelten (Teilarray 1 $\leq$ Pivot-Element $\leq$ Teilarray 2), funktioniert es

- für **n=4** gilt: Pivot+Partitionierung gibt uns Aufrufe für Quicksort mit maximal n $\leq$ 3 (und da wissen wir, dass es funktioniert), und weil die Partitionierungsbedingungen gelten (Teilarray 1 $\leq$ Pivot-Element $\leq$ Teilarray 2), funktioniert es
- ... usw.

# 3. Laufzeit von Quicksort / Vertiefung Big-O-Notation

## Big-O-Notation: Wiederholung


- Möglichkeit zum Messen des Laufzeitverhaltens
- Wird in Abhängigkeit zur Problemgröße $n$ angegeben
- Typische Laufzeiten:
    - $O(1)$
    - $O(\log({n}))$   Bsp: Binäre Suche
    - $O(n)$ Bsp: Lineare Suche
    - $O(n \log({n}))$
    - $O(n²)$ Bsp: Selection Sort
    - $O(n!)$ Bsp: Enumeration aller Traveling Salesperson-Touren
- Bisher nur Worst-Case Betrachtung



## Laufzeitkomplexität: Quicksort

- Quicksort ist in der Praxis sehr verbreitet
- Laufzeit hängt von Wahl der Pivot-Elemente ab
- Worst-case Laufzeit ist $O(n²)$

><div class="alert alert-block alert-info">
<b>Was muss in Bezug auf das Pivot-Element passieren, damit der worst case eintritt?</b></div>


- Andere Sortieralgorithmen (z.B. Mergesort) haben worst-case Laufzeiten von $O(n \cdot log({n}))$
- Trotzdem wird oft Quicksort bevorzugt

><div class="alert alert-block alert-info">
<b>Was könnten Gründe dafür sein?</b></div>

## Big-O-Notation: Die Relevanz der konstanten Operationen

- Big-O beachtet nur die Größenordnung der Anzahl der Operationen
- die Dauer der einzelnen Operationen (bzw. die Anzahl von Schritten pro Operation) wird dabei vernachlässigt
- Vergleiche die Laufzeit folgender Funktionen:

In [10]:
def print_items(liste):
    for item in liste:
        print(item)

In [11]:
def print_items2(liste):
    for item in liste:
        time.sleep(1)
        print(item)

## Big-O-Notation: Die Relevanz der konstanten Operationen

- Beide Funktionen haben Laufzeit $O(n)$
- Laufzeiten weichen trotzdem deutlich voneinander ab

In [12]:
silben = ['Al','go','rith','men']

In [13]:
%%time
print_items(silben)

Al
go
rith
men
CPU times: total: 0 ns
Wall time: 0 ns


In [14]:
%%time
print_items2(silben)

Al
go
rith
men
CPU times: total: 0 ns
Wall time: 4.04 s


## Big-O-Notation: Die Relevanz der konstanten Operationen bei unterschiedlichen Größenordnungen

- Bisher haben wir Konstanten in big O-Notation nicht beachtet
- In vielen Fällen sind sie wenig relevant:
- Angenommen Binary Search braucht 100-mal solange für einen Schritt wie Linear Search:
    
<img src="./img/20.png" width="60%" align="middle">


- Trotzden für große $n$ (hier 4 Mrd) Binary Search signifikant schneller
    
<img src="./img/21.png" width="80%" align="middle">

## Big-O-Notation: Die Relevanz der konstanten Operationen bei ähnlichen Größenordnungen
- Bei gleicher Laufzeit-Komplexität wird der konstante Aufwand pro Operation jedoch relevant 
- Mergesort hat höhere Konstante pro Operation als Quicksort
    - $\rightarrow$ dies ist einer der Gründe für häufigere Nutzung von Quicksort

- würde man nur allerdings nur den Worst Case betrachten, wäre das egal, denn es gilt im Worst Case:
  - Mergesort: $O(n  \log(n))$
  - Quicksort $O(n^2)$
  
$\rightarrow$ **In der Praxis ist aber nicht nur worst-case wichtig!**

## Big-O-Notation: Average Case vs Worst Case

- der Worst Case für Quicksort tritt beispielsweise auf, wenn das erste Element als Pivotelement gewählt wird und die Liste bereits sortiert ist:

<img src="./img/22.png" width="60%" align="left">

- Hier in jeder Zeile $n$ Operationen (Vergleiche mit Pivotelement)
- $n$ Vergleiche mal $n$ Zeilen $\rightarrow$ Komplexität $O(n²)$

## Big-O-Notation: Average Case vs Worst Case

- Beispiel für Best Case für Quicksort:
  - Liste ist bereits sortiert und immer mittleres Element als Pivot


- Das Array wird in jedem Schritt halbiert
- $n$ Vergleiche mal $log(n)$ Zeilen $\rightarrow$ Komplexität $O(n  \log(n))$


<img src="./img/23.png" width="80%" align="left">

## Big-O-Notation: Average Case vs Worst Case

- Laufzeiten ergeben sich (in beiden Fällen) aus Anzahl der Ebenen und Schritten pro Ebene
- Für best-case:

<img src="./img/24.png" width="80%" align="middle">

## Big-O-Notation: Average Case vs Worst Case

- **Der große Vorteil von Quicksort:**
> Bei Quicksort ist der average-case gleich dem best-case!

- dabei wird davon ausgegangen, dass das Pivot-Element zufällig ausgewählt wird bzw. die Position des Pivot-Elements in der ungeordneten Liste zufällig ist

#### Gründe für die Relevanz von Quicksort sind also:
- eine kleine Konstante pro Operation
- in der praktischen Umsetzung ist oft der average case relevant, nicht worst case

# 4. Zusammenfassung

# Zusammenfassung

#### Wir haben in diesem Teil:
- das wichtige und auf **Rekursion** basierende **Teile-und-Herrsche-Prinzip** zum Entwerfen von Algorithmen kennengelernt
- insbesondere **Quicksort** betrachtet, einen der besten Sortieralgorithmen, der auf diesem Prinzip beruht
    - Quicksort teilt eim Array anhand eines Pivot-Elements in Teilarrays auf
    - diese werden wieder mit Quicksort sortiert
- gelernt, dass für die Laufzeit nicht nur der Worst Case relevant ist, und dass auch Konstanten können bei Laufzeiten in der Praxis eine Rolle spielen

#### Im nächsten Teil:
- beschäftigen wir uns mit **Hash Maps**, die es ermöchlichen, in **konstanter Zeit** Elemente zu suchen