# Binärbäume 1 (Lösung)
Modul 5 | Kapitel 1 | Notebook 2
***
Willkommen bei deiner zweiten Übung zu Algorithmen und Datenstrukturen. In dieser Übung wirst du die Datenstruktur Binärbaum implementieren.  

In diesem Notebook wirst du: 
* einen einfachen Binärsuchbaum implementieren  
* rekursive Algorithmen nutzen, um `insert_last(self, node)`, `delete_first(self)` und `find(self)` zu implementieren.
 
***

**Szenario**: Die Firma, deren Warenwirtschaftssystem wir bereits in der vorigen Übung betrachtet haben, ist inzwischen sehr erfolgreich auf dem Markt. Aufträge gehen fast im Sekundentakt ein. Leider führt das gestiegene Auftragsvolumen auch dazu, dass sich die Stornierungen vor Versand der Artikel häufen. Deine zuvor implementierte Linked List hat bisher gute Dienste geleistet, ist allerdings nicht auf die erhöhten Anforderungen ausgerichtet. 

In der vorigen Übung hast du bereits gesehen, dass eine Linked List sich zwar hervorragend als Queue eignet, allerdings Schwächen aufweist, wenn es darum geht, auf Elemente in der Mitte zuzugreifen. 

In der vorangegangenen Textlektion hast du dir eine Menge Gedanken zu den Effizienzeigenschaften des Binärbaums für unser Anwendungsbeispiel gemacht. 
Außerdem haben wir uns Gedanken über das Design unserer Datenstruktur gemacht: sollten wir zum Beispiel `first` und `last` Pointer in der Baumstrukur anlegen? Vielleicht sogar bereits in den Nodes? 

In dieser Übung werden wir eine Baumstruktur mit den Methoden `insert_last(self, node)`, `delete_first(self)` und `find_node(self, order_id)` implementieren. `delete_node(self, order_id)` ist etwas aufwendiger. 
Wenn du magst, kannst du die Methode anschließend in der folgenden optionalen Übung implementieren. 




## Die Grundstruktur

Wir werden hier einen Binärbaum ohne die Pointer `first` und `last` anlegen. Im vorigen Textteil haben wir gesehen, dass sowohl die Version mit, als auch ohne die beiden Pointer, in unserem Szenario vertretbar scheinen.
Die Version ohne Pointer ist einfacher, denn die Aktualisierung beim Löschen eines Auftrags (am Anfang oder in der Mitte) ist potentiell aufwendig und bringt keine Effizienzvorteile im Sinne der O-Notation. 
`test_tree.py` sollte allerdings unabhängig hiervon ohne Fehler durchlaufen. Wenn du also magst, kannst du dich auch an der Version mit den Pointern versuchen. Im Folgenden gehen wir aber davon aus, dass du ohne Pointer arbeitest.  

Den `parent`-Pointer in der Node hingegen solltest du mit anlegen. Tust du das nicht, kann `test_tree.py` deine Lösung nicht überprüfen. 

Wie die Linked List auch ist der Binärbaum eine Pointer-basierte Datenstruktur. D.h. ausgehend von einem Startknoten können alle anderen Knoten bzw. Blätter erreicht werden. Jeder Knoten ist damit nichts anderes als selbst ein Binärbaum. 

Als Doctring für die Grundstruktur kannst du folgenden nutzen: 




```python
class BinaryTree: 
    """A basic binary tree data structure. 

    Attributes: 
        root(BinaryNode): the root node. Defaults to None.

    """
    
class BinaryNode: 
    """A Node in BinaryTree 
    
    Args: 
        order_id (int): unique order id
        *kwargs: additional information to be stored.

    Attributes: 
        left (BinaryNode): left child. Defaults to None.
        right (BinaryNode): right child. Defaults to None. 
        parent (BinaryNode): parent node. Defaults to None. 
        order_id (int): order_id
        order_info (dict): additional information to be stored.

    """
    
```


!Aufgabe 
Lege die Grundstruktur im Skript an. Du kannst wie immer dein Notebook nutzen, um deine Klasse zu testen.

In [1]:
#Lösung
#siehe Script 

Mit der folgenden Zelle kannst du deine Grundstruktur überprüfen.

In [22]:
!pytest test_tree.py::test_node_init test_tree.py::test_node_init_errors

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 2 items                                                              [0m

test_tree.py [32m.[0m[32m.[0m[32m                                                          [100%][0m



## Einen Knoten im Binärbaum finden 

Erinnere dich kurz: die Linked List ist wenig geeignet, ein Element aus der Mitte zu entfernen, und übrigens auch, in die Mitte einzusetzen. 
Das Entfernen oder Einsetzen selbst ist zwar effizient in *O(1)* zu machen, allerdings ist das Auffinden mit einem hohen Aufwand verbunden *(O(n))*. 
Der Binärbaum ist hier besser, zumindest, wenn er einigermaßen ausgeglichen ist. Das Auffinden können wir in *O(h)* implementieren, wobei *h* die Höhe ist, also die Anzahl der Knoten von der Wurzel bis zum am weitesten entfernten Kind.  
In diesem Abschnitt werden wir uns lediglich um das Auffinden kümmern. Das Löschen selbst ist etwas komplizierter. Wenn du möchtest, kannst du das in der nächsten optionalen Übung tun. 


Zuerst wollen wir also `find(self, order_id)` implementieren. 
Um eine binäre Suche durchführen zu können, müssen unsere Datenpunkte mit einem Key versehen sein, der einer bestimmten Ordnung gehorcht. In unserem Fall werden die Auftragsnummern fortlaufend vergeben. 
Sie müssen allerdings nicht lückenlos vertreten sein. Wenn die Reihenfolge gegeben ist, weißt du automatisch, sobald du die root-Node besuchst, ob sich der gesuchte Knoten links oder rechts befindet. 
Das Problem sollte dir bekannt vorkommen: die Binärsuche haben wir im ersten Notebook bereits implementiert. 





Unsere Baumstruktur soll also das Element mit einer bestimmten, einmal vergebenen Auftragsnummer finden. 
Der Docstring für `find_node(self, order_id)` liest sich wie folgt. Er gehört zur Klasse `BinaryTree`.

``` python 
def find_node(self, order_id): 
    """
    Return BinaryNode with corresponding order_id. Return None if no node found or if tree is empty.

    Args: 
        order_id (int): order_id to be searched for. 

    Returns: 
       BinaryNode with specified order_id, or None if nothing found. 

    """
```


!Aufgabe
Bevor du `find_node(self, order_id)` in deiner Klasse `BinaryTree` (rekursiv) implementierst, mach dir nochmal kurz ein paar Gedanken hierzu. 
Benötigst du eine oder mehrere Helferfunktion(en)? Notiere dir am besten den Pseudocode für alle verwendeten Funktionen in der folgenden Zelle. 



In [None]:
#Lösung (auch als Aufklapptext zur Verfügung stellen)

#(PSEUDO)CODE 
#BinaryTree.find_node(self, order_id): 
    #if tree empty: 
        #return None 
    #else: 
        #return self.root.find(order_id)
    
#BinaryNode.find(self, order_id):
    #if self has no order_id (is None):  
        #return None 
    #elif order_id == self.order_id: 
        #return self 
    #elif order_id < self.order_id:
        #recursively search left tree
    #else if order_id > self.order_id: 
        #recursively search right tree 



#Hint 
#Es ist hilfreich, eine Methode `find(self, order_id) in `BinaryNode` zu implementieren, und sie in BinaryTree von der root-Node aus aufzurufen. 
#Die Methode soll rekursiv, ausgehend von der entsprechenden Node, die gesuchte Node finden. 
#Eine Möglichkeit, das zu implementieren, ist, self bei jedem Rekursionsschritt neu zu besetzen.


!Aufgabe 
Implementiere nun die Methode `find_node(self, order_id)` in deiner Klasse `BinaryTree`, sowie etwaige Helferfunktionen. Implementiere die Methode wieder in `tree.py`. 
Nutze wieder den pytest, um deinen Code zu überprüfen.

In [8]:
!pytest test_tree.py::test_find_node

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 1 item                                                               [0m

test_tree.py [32m.[0m[32m                                                           [100%][0m



## Ein Element am Ende einfügen 

Nun wollen wir einen Auftrag am Ende einfügen. Dazu werden wir den neuen Auftrag an den rechtesten Knoten anhängen. 
Der Docstring für die Methode `insert_last(self, node)` im `BinaryTree` ist folgender: 
    
```python 
def insert_last(self, node): 
    """ 
    Insert node at rightmost position of tree. 
    
    Args: 
        node (BinaryNode): Node to be inserted
    Returns: 
        None 

    """

```

!Aufgabe 
Notiere die wieder zunächst den Pseudocode für `insert_last(self, node)`. Benötigst du Helferfunktionen? Wenn ja, schreibe auch den Pseudocode hierfür auf.
Dein Code sollte in *O(h)* implementiert werden. Hast du die abweichende Version mit Pointern gewählt, solltest du es sogar in *O(1)* schaffen.  

In [None]:

#Lösung (auch als Aufklapptext zur Verfügung stellen!) 
#insert_last(self, node)

    #if tree is empty: 
        #node becomes root 
    #else if tree is not empty: 
        # identify current last node (call self.root.last)
        # assign right child to current last node
        # assign parent pointer to node 

    
#in BinaryNode
#last(self): 
    #if self has no right node:
        #return self
    #if self has right node: 
        #recursively call right child
    

!Aufgabe 
Implementiere den Code nun wieder in deinem `tree.py`-Skript. Nutze den pytest, um deinen Code zu überprüfen. 

In [7]:
!pytest test_tree.py::test_insert_last

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 1 item                                                               [0m

test_tree.py [32m.[0m[32m                                                           [100%][0m



## Ein Element am Anfang entfernen 

Das Entfernen ist im Binärbaum tendenziell etwas komplizierter als das Einfügen. 
Im Textteil hatten wir bereits besprochen, wie sich ein Element am Anfang entfernen lässt. 
Hier profitieren wir davon, dass die erste Node nie zwei Kinder hat.  
Wenn du dich nicht mehr erinnerst, wie das Entfernen in diesem Fall funktioniert, wirf am besten nochmal einen Blick in den Text. 

Wir nutzen den folgenden Dostring für die Methode, die in `BinaryTree` angelegt wird. 

```python 
def delete_first(self)
""" Delete first node from self and return it. """
``` 

!Aufgabe 
Mache dir auch hier wieder zunächst Gedanken um etwaige Helferfunktionen. Notiere den Pseudocode für alle Methoden in der folgenden Zelle.


In [None]:
#Lösung (auch als Aufklapptext)

#BinaryTree.delete_first(self): 
    #if tree is empty: 
        #return None 
    #else: 
        #identify first_node in tree (call root.first() in BinaryNode) --> can be None O(h) 
        #if first_node is not root: 
            #adjust parent left pointer to right child --> can be None
        #else if first node is root: 
            #set root to right child --> can be None 
        #if right child is not None: 
            #set new parent to first_node.right. (None or parent)
        #return first_node 

#BinaryNode.first(): #O(h)
    #if self has no left child: 
        #return self
    #else if has left child: 
        #recursively call left child 

!Aufgabe 
Implementiere nun die Methode in deinem `test.py`-Skript. 
Hast du nun die Version mit `last` und/oder `first`-Pointern gewählt, solltest du unbedingt darauf acht geben, die auch mit zu aktualisieren. 



In [17]:
!pytest test_tree.py::test_delete_first

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 1 item                                                               [0m

test_tree.py [32m.[0m[32m                                                           [100%][0m



**Glückwunsch**: Du hast eine Binärbaum-Struktur angelegt, und die Methoden implementiert, die wir für unsere Standardqueue benötigen. Außerdem hast du eine Methode implementiert, die effizient die Datenstruktur durchsucht. 

**Merke**:  
Binärbäume sind oft ein guter Kompromiss zwischen anderen Datenstrukturen:
* Binärbäume sind gut darin, Elemente nach einem Key zu finden, wenn der Key eine inherente Ordnung aufweist. Je ausgeglichener der Baum ist, desto effizienter ist das Auffinden.
* Ein Element zu löschen oder hinzuzufügen, ist effizient - wenn es bereits gefunden wurde 
* Für unser Queue-Beispiel mögen die Vorteile der Linked List überwiegen, denn die Standardoperationen sind im Binärbaum insgesamt weniger effizient, auch wenn er ausgeglichen ist.  


***
Hast du eine Frage zu dieser Übung? Schau ins Forum, ob sie bereits gestellt und beantwortet wurde.
***
Fehler gefunden? Kontaktiere den Support unter support@stackfuel.com .
***