# Einführung: Algorithmen

Modul Algorithmen und Datenstrukturen | Kapitel 1 | Notebook 1

***
Herzlich willkommen zu deiner ersten Übung im Modul Algorithmen und Datenstrukturen! In dieser Übung werden wir die rekursive Implementierung von Algorithmen kennenlernen. 
Nach dieser Übung kannst du: 
* rekursive und iterative Algorithmen unterscheiden, 
* benennen, wann rekursive Algorithmen vorteilhaft sind, 
* den Binärsuchalgorithmus rekursiv implementieren.

***

## Der lineare Suchalgorithmus

Kehren wir nochmal zu unserem Buchsuchbeispiel aus der Textlektion zurück. 
Unser Algorithmus wurde folgendermaßen beschrieben: 

1)	Beginne ganz links im Regal mit der Suche.  
2)	Wenn kein Buch an der Position vorhanden ist, beende die Suche und melde, dass der gesuchte Titel nicht gefunden wurde.  
3)	Wenn ein Buch vorhanden ist, schaue dir den Titel des Buches an. Wenn der Titel dem gesuchten entspricht, gib das Buch und dessen Position aus und beende die Suche.
4)	Bewege dich eine Position nach rechts und wiederhole alle Schritte ab Schritt 2.


Wir haben gesehen, dass dieser Algorithmus eine Laufzeitkomplexität von $O(n)$ hat, und dass wir von einem *linearen Suchalgorithmus* sprechen. Wir haben außerdem diskutiert, dass es keinen schnelleren Algorithmus geben kann - zumindest nicht, wenn die Bibliothek nicht sortiert ist. Anders sieht es aus, wenn unsere Bibliothek schon sortiert ist. Der schnellere Algorthmus, den wir in diesem Zusammenhang kennengelernt haben, ist der *Binärsuchalgorithmus*. Diesen wollen wir später in dieser Übung implementieren.


Unseren linearen Suchalgorithmus können wir in Code übersetzen. Bei der Implementierung von Funktionen oder Algorithmen stehen uns oft zwei konzeptionelle Ansätze zur Verfügung: der iterative und der rekursive Ansatz.

* Bei der **iterativen** Methode betrachten wir das Problem "von vorne". Wir verwenden Schleifenstrukturen, wie `for` oder `while`, um die Daten zu durchsuchen. Diese Strukturen sind in der Regel intuitiv und uns vertraut.

* Bei der **rekursiven** Methode ruft sich eine Funktion selbst mit geänderten Argumenten auf, bis eine Basisbedingung erfüllt ist, die den rekursiven Aufruf beendet. Rekursion kann oft eleganter und kürzer in der Schreibweise sein. Der Ansatz ist allerdings etwas gewöhnungsbedürftig und erfordert ein wenig Übung. 

Für unseren linearen Suchalgorithmus werden wir uns zuerst die iterative Version anschauen. Konzeptionell werden wir durch unsere Datenliste gehen und jedes Element überprüfen, bis wir entweder das gesuchte Element finden oder feststellen, dass es nicht in der Liste vorhanden ist.
 

##### <font color="#17415F">Codebeispiel I</font>
> Die Funktion `linear_search_iter()` ist ein Beispiel für eine iterative Implementierung unseres linearen Suchalgorithmus. 

In [None]:
def linear_search_iter(title, library): 
    """
    Return book with given title as well as position in library and None as well as -1 if nothing is found. 
    
    Args: 
        title (str): book title to be searched for. 
        library (list): list of book titles in the library. 
        
    Returns: 
        (title, index position in library) and (None, -1) if title was not found.
        
    """
    
    if len(library) > 0: 
      pos = 0
      while pos < len(library): 
          if title == library[pos]: 
              return (title, pos)
          pos += 1
    return (None, -1)

In dieser Implementierung nutzen wir eine `while`-Schleife, um alle Einträge von `library` linear zu durchsuchen. 
Wir hatten bereits festgestellt, dass der lineare Suchalgorithmus, wie oben beschrieben, eine Laufzeitkomplextität von $O(n)$ hat. Unsere Implementierung sollte dieselbe Laufzeitkomplexität haben. Ist das auch wirklich so?

In `linear_search_iter()` haben wir eine bereits eingebaute Methode für Listen genutzt: `len()`. Wenn wir die Laufzeitkomplexität unseres Algorithmus bewerten wollen, müssen wir ebenfalls die Laufzeit von `len()` betrachten. Eine naive Implementierung, in der alle Listenelemente durchgegangen und dabei gezählt werden, hätte eine lineare Laufzeit. Allerdings ist die Laufzeitkomplexität der Funktion `len()` tatsächlich $O(1)$. Das hängt damit zusammen, wie `list` als Datenstruktur implementiert ist. Darauf werden wir im zweiten Teil des Moduls nochmal stossen. Soviel jedoch schonmal vorweg: In Python ist die Länge einer Liste als Attribut gespeichert, so dass beim Aufruf der Methode `len()`  dieser Wert direkt abgerufen wird, ohne dass die Liste durchlaufen werden muss. 
Diese konstante Laufzeit ist damit vernachlässigbar im Vergleich zur linearen Laufzeit, welche wir in jedem Fall haben, da unsere `while`-Schleife im Zweifel alle Einträge durchläuft, wenn vorher keine Treffer gefunden wurden. 

Wenden wir uns nun der rekursiven Lösung zu. Hierbei gestalten wir unsere Implementierung so, dass sich die Funktion immer wieder selbst aufruft. Dabei verkleinert sich der Suchbereich bei jedem Aufruf, solange, bis das gesuchte Element gefunden wird oder der Suchbereich erschöpft ist. 

##### <font color="#17415F">Codebeispiel II</font>
> Die Funktion `linear_search_rec()` ist ein Beispiel für eine rekursive Implementierung unserer linearen Suche. 

In [None]:
def linear_search_rec(title, library, index=0): 
    """
    Recursively return book with given title as well as position in library and None as well as -1 if nothing is found. 
    
    Args: 
        title (str): book title to be searched for. 
        library (list): list of book titles in the library.
        index (int): index to be checked in current recursive step.
        
    Returns: 
        (title, index position in library) and (None, -1) if title was not found.
        
    """
    
    if index == len(library): #base case 1: no title found
        return (None, -1)
    if library[index] == title: #base case 2: title found 
        return (title, index)
    return linear_search_rec(title, library, index+1) #recursion 

Betrachten wir genauer, wie diese rekursive Implementierung funktioniert. Neben den Parametern `title` und `library` gibt es ein zusätzliches Argument `index`. Dieses dient als Zeiger, der uns durch die Bücherliste führt und im Verlauf der Rekursion angepasst wird.

In jeder rekursiven Funktion gibt es einen oder mehrere Basisfälle, die die Rekursion beenden. In unserer Implementierung haben wir zwei solcher Fälle:

1. Wenn das Ende des Regals (oder der Liste) erreicht ist und das gesuchte Buch nicht gefunden wurde.
2. Wenn das Buch an der aktuellen Position (`index`) mit dem gesuchten Titel übereinstimmt.

Falls keiner dieser Basisfälle eintritt, geht die Funktion in den rekursiven Schritt und ruft sich selbst mit einem inkrementierten `index` auf. Dies ermöglicht es uns, systematisch durch die Bücherliste zu gehen, ohne eine Schleife zu verwenden. Durch das Anpassen des `index`-Wertes bei jedem rekursiven Aufruf wird sichergestellt, dass die Suche voranschreitet und schließlich einen Basisfall erreicht.

Zusammengefasst zeichnet sich eine Rekursion durch folgende Merkmale aus:

* Es gibt **mindestens einen Basisfall**, der die Rekursion beendet.
* Oftmals werden **zusätzliche Argumente** verwendet, die speziell für den rekursiven Prozess wichtig sind. Es ist sinnvoll, diesen Argumenten Standardwerte zuzuweisen, um die Benutzerfreundlichkeit zu erhöhen.
* Die Funktion **ruft sich selbst auf**, wobei die Argumente so angepasst werden, dass der rekursive Prozess Fortschritte macht und schließlich einen Basisfall erreicht.

Nun bist du dran. Versuche nun selbst, einen Algorithmus rekursiv zu implementieren. Der Algorithmus ist vergleichbar mit unserem bisherigen linearen Suchalgorithmus, mit dem Unterschied, dass die Suche nun rechts im Regal beginnen sollte. Schreibe deinen Code direkt in die Zelle, wir benötigen für diese Übung kein Skript. 

##### <font color="#3399DB">Aufgabe 1</font>
> Schreibe eine rekursive Funktion `linear_search_rec_inv()`. Gehe dazu analog zu `linear_search_rec()` vor, starte allerdings deine Suche rechts. Die Indexpositionen sollen wie bisher ausgegeben werden. Nutze zum Testen deines Codes die vorbereiteten Tests in der darauffolgenden Zelle.

In [None]:
#Test your code 
lib = ['great_gatsby', 'tonio_krueger', 'infinite_jest', 'garp', 'python_for_dummies', 'linear_algebra_1', 'crimson_labyrinth', 'garp', 'ulysses', 'don_quixote' ]
assert linear_search_rec_inv('ulysses', lib) == ('ulysses', 8)
assert linear_search_rec_inv('garp', lib) == ('garp', 7)
assert linear_search_rec_inv('great_gatsby', lib) == ('great_gatsby', 0)
assert linear_search_rec_inv('lord_of_the_rings', lib) == (None, -1)
print('tests passed')

Rekursive Ansätze sind nicht immer die erste Wahl, besonders wenn die iterative Lösung offensichtlich und intuitiv ist, wie in unserem vorherigen Beispiel. Jedoch gibt es Szenarien, in denen Rekursion die Problemlösung erheblich vereinfacht. Insbesondere wenn sich ein Problem in mehrere kleinere, aber im Wesentlichen identische Unterprobleme zerlegen lässt, kann die rekursive Struktur diese Zerlegung natürlich und klar darstellen. Rekursiver Code kann oft kürzer und prägnanter sein, da er auf viele Fallunterscheidungen verzichten kann. Dies führt zu einer erhöhten Lesbarkeit und Eleganz, reduziert die Wahrscheinlichkeit von Fehlern und macht den Debugging-Prozess übersichtlicher. Ein klassisches Beispiel für die Stärke der Rekursion ist der Binärsuchalgorithmus, den wir als Nächstes betrachten werden.


## Der Binärsuchalgorithmus

Wenn unsere Bibliothek alphabetisch nach Titeln sortiert ist, können wir einen schnelleren Suchalgorithmus anwenden: den Binärsuchalgorithmus. Wir hatten ihn in der letzten Textlektion bereits betrachtet. Dieser Algorithmus nutzt die sortierte Struktur der Bibliothek aus und erreicht eine sehr gute Laufzeitkomplexität von $O(\log n)$. Hier ist die Vorgehensweise:

1. Falls das Regal leer ist, beende die Suche. Ansonsten beginne mit dem Buch in der Mitte des Regals. Ist die Anzahl der Bücher gerade, nimm das Buch direkt links von der Mitte.
2. Prüfe den Titel des Buches. Stimmt er mit dem gesuchten Titel überein, gib den Buchtitel und seine Position im Regal aus und beende die Suche.
3. Falls nicht, entscheide basierend auf dem Anfangsbuchstaben des gesuchten Titels: Liegt dieser im Alphabet vor dem Buchtitel des aktuellen Buches, fahre mit der linken Hälfte des Regals fort. Liegt er dahinter, konzentriere dich auf die rechte Hälfte. Starte den Suchprozess in dem ausgewählten Bereich erneut von Schritt 1.


Durch die wiederholte Halbierung des Suchraums verringert der Binärsuchalgorithmus effektiv die Anzahl der benötigten Schritte, um das gewünschte Buch zu finden oder festzustellen, dass es nicht im Regal steht. Seinen Namen trägt der Algorithmus, weil er den den Suchraum sukzessive in zwei (nicht notwendigerweise gleich große) Teile teilt.
Wir werden diesen Algorithmus gleich rekursiv implementieren. 

Die Abbildung stellt den Prozess beispielhaft für die Suche nach einem im Regal nicht vorhandenen Buch dar: 
    
<img src="pyp_ads_nb1_binaersuchalgo.png" alt="Binärsuchalgorithmus" style="width: 600px;"/>

In dem Regal mit 10 Büchern betrachten wir zunächst das fünfte (Indexposition 4) (Schritt 1). Der Titel entspricht nicht dem gesuchten (Schritt 2). Der Titel liegt im Alphabet weiter vorne, daher wenden wir uns der Regalhälfte links von Indexposition 4 zu (Schritt 3). Hierfür wiederholen wir den Prozess. Nach der dritten Iteration würden wir wieder die Regalhälfte links vom Buch mit dem Titel 'garp' betrachten. Die Regalhälfte ist leer, daher beendet Schritt 1 den Prozess. 

Bei der Implementierung des Binärsuchalgorithmus stehen wir vor einigen Herausforderungen. Um uns einen klaren Überblick über die bevorstehenden Schritte zu verschaffen, ist es sinnvoll, zuerst einen **Pseudocode** zu erstellen.

Pseudocode ist eine Art Zwischenschritt zwischen der verbalen Beschreibung eines Algorithmus und dem eigentlichen Code. Hierbei formulieren wir den Ablauf unseres Algorithmus in einer strukturierten Weise, die der Logik einer Programmiersprache folgt, ohne uns jedoch in spezifischen syntaktischen Details zu verfangen. Es dient als Brücke, die es uns ermöglicht, den Fokus auf die Kernlogik des Algorithmus zu legen, bevor wir mit der eigentlichen Programmierung beginnen.

Der Pseudocode von `linear_search_rec()`, der rekursiven Version unseres linearen Algorithmus von oben, könnte beispielsweise so aussehen: 

> **Input:** `library` (`list` of books), `title` (`str` containing title), `index` (helper variable for recursion)
>
> **Process:**
> * **Base case 1**: If index out of range (library fully searched) -> Return `(None, -1)`
> * **Base case 2**: If title found at current index: -> Return `(title, index)`
>
> **Recursive step:**
> * Else if library not fully searched and title not found:
>   * `index += 1`
>   * Recursively call function with new `index` (and return it)


Der Pseudocode sieht unserem finalen Code bereits sehr ähnlich. Das liegt daran, dass Python eine *high-level* Programmiersprache ist. Die Syntax ähnelt unserer Sprache und Denkweise. Dadurch ist der Weg von Pseudocode zu Code auch nicht mehr weit. Nichtsdestotrotz kann Pseudocode dabei helfen, die eigenen Gedanken zu ordnen.

Bevor wir mit der rekursiven Implementierung unseres Binärsuchalgorithmus beginnen, skizzieren wir die Struktur und den Ablauf des Algorithmus mithilfe von Pseudocode. Wichtig ist uns dabei, dass die Funktion nicht nur den gesuchten Buchtitel, sondern auch dessen Position im Regal zurückgibt.

Es ist unser Ziel, dass die Implementierung eine Laufzeitkomplexität von $O(\log n)$ erreicht. Um dies sicherzustellen und nicht von externen Faktoren beeinflusst zu werden, verzichten wir darauf, bereits vorhandene Methoden zu verwenden – mit einer Ausnahme: Die Listenmethode `len()`, die eine konstante Laufzeitkomplexität von $O(1)$ besitzt, darf genutzt werden, da sie keinen Einfluss auf unsere angestrebte Gesamtkomplexität hat.

##### <font color="#3399DB">Aufgabe 2</font>
> Schreibe nun zunächst Pseudocode für den Binärsuchalgorithmus in unserem Bibliotheksbeispiel. Welche zusätzlichen Variablen benötigst du für die Rekursion? Welches sind die Basisfälle? Du darfst annehmen, dass die Titel in alphabetischer Reihenfolge vorliegen. Außerdem darfst du in deinem späteren Code die Listenmethode `len()` verwenden. Nutze davon abgesehen keine bereits implementieren Methoden. Denke daran, dass der Algorithmus sowohl den Titel als auch die Indexposition ausgeben soll, falls das Buch gefunden wurde. 

In der folgenden Box kannst du den Docstring zu einer möglichen Lösung sehen. Er gibt dir einen Hinweis darauf, welche zusätzlichen Variablen du für den rekursiven Prozess nutzen kannst. 

**Hinweis:** Klappe diese Box nun auf, um den Docstring zu einer möglichen Lösung zu sehen:

<div class="details">

```python 
def binary_search_rec(title, library, low=0, high=None): 
    """
    Recursively return book title and position in library and None and -1 if nothing is found. 
    
    Args: 
        title (str): book title to be searched for. 
        library (list): list of book titles in the library.
        low (int): lower index bound for recursion. Defaults to 0.
        high (int): higher index bound for recursion. Defaults to None. 
        
    Returns: 
        (title, index position in library) and (None, -1) if no title was found.
        
    """
```
</div>

Sieht dein Pseudocode andere Rekursionsvariablen vor oder nur eine solche Variable? Dann nutze für die Implementierung gerne deine eigene Version. Wenn du möchtest, teile deine Lösung gerne im Forum. 

##### <font color="#3399DB">Aufgabe 3</font>
> Implementiere nun `binary_search_rec()` in der folgenden Codezelle. Denke daran, keine bereits implementierten Methoden zu nutzen. Eine Ausnahme ist die Listenmethode `len()`.
> Nutze zum Testen deines Codes die vorbereiteten Tests in der darauffolgenden Zelle.

In [None]:
#Test your code 
lib_sorted = ['crimson_labyrinth',
 'don_quixote',
 'garp',
 'garp',
 'great_gatsby',
 'infinite_jest',
 'linear_algebra_1',
 'python_for_dummies',
 'tonio_krueger',
 'ulysses']

assert binary_search_rec('ulysses', lib_sorted) == ('ulysses', 9)
assert binary_search_rec('garp', lib_sorted) == ('garp', 2)
assert binary_search_rec('crimson_labyrinth', lib_sorted) == ('crimson_labyrinth', 0)
assert binary_search_rec('infinite_jest', lib_sorted) == ('infinite_jest', 5)
assert binary_search_rec('lord_of_the_rings', lib_sorted) == (None, -1)
print('tests passed')

**Glückwunsch:** Du hast eine binäre Suche rekursiv implementiert. Sie ist ein Beispiel für einen Algorithmus, der auf dem *Divide-And-Conquer* Prinzip basiert: Das eigentliche Problem wird immer wieder in im Prinzip identische Unterprobleme aufgeteilt. Die Rekursion bildet damit die natürliche Struktur der Suche ab.  

**Vertiefung:** der Quicksort-Algorithmus. 
<div class="details">
In unserer Übung haben wir angenommen, dass unsere Bibliothek alphabetisch sortiert ist. Unsere Suche können wir deshalb in $O(\log n)$ implementieren, anstatt, wie vorher, in $O(n)$. Doch die Sortierung ist selbst mit Aufwand verbunden. In der vorigen Textlektion sind wir in Frage 2 davon ausgegangen, dass eine Sortierung in $O(n \log n)$ möglich ist. Tatsächlich ist $O(n \log n)$ die beste Laufzeitkomplexität, die wir für die Sortierung erreichen können. Sie wird unter anderem durch den <i>Quicksort</i>-Algorithmus erreicht. In dem Algorithmus wird in jedem Rekursionsschritt ein so genanntes <i>Pivot</i>-Element mit allen anderen Elementen verglichen. Größere Elemente werden rechts des Pivots, kleinere links davon angeordnet. 
Wenn du mehr darüber erfahren möchtest, schaue doch zum Beispiel mal 
<a href="https://realpython.com/sorting-algorithms-python/#the-quicksort-algorithm-in-python">hier</a>.
</div>

Später im Modul werden wir die Datenstruktur Binärsuchbaum kennenlernen. Wollen wir in dieser Datenstruktur eine Suchmethode implementieren, nutzen wir dafür ebenfalls einen Binärsuchalgorithmus. 
In der folgenden Textlektion schauen wir uns aber erstmal an, was Datenstrukturen überhaupt sind und warum wir uns Gedanken um sie machen sollten. 

**Merke:** 
* Viele Probleme können sowohl iterativ, als auch rekursiv gelöst werden.
* Rekursive Implementierungen sind vorteilhaft für Probleme, deren natürliche Struktur sich in identische Teilprobleme zerlegen lässt.
* Die binäre Suche ist ein Beispiel für ein solches Problem.
* Pseudocode kann uns dabei helfen, unsere Gedanken vorzustrukturieren.

***
Hast du eine Frage zu dieser Übung? Schau ins Forum, ob sie bereits gestellt und beantwortet wurde.
***
Fehler gefunden? Kontaktiere den Support unter support@stackfuel.com.
***