# Optional: Linked Lists II (Lösung) 
Modul Algorithmen & Datenstrukturen | Kapitel 1 | Notebook 3

***
In dieser Übung werden wir unsere Warteschleife zusätzlich mit einer Methode ausstatten, die Aufträge aus der Mitte entfernt. Außerdem werden wir die Methode `len()` implementieren und hierbei *data structure augmentation* nutzen. Nach dieser Übung kannst du: 


* die Linked List selbständig um eine (rekursiven) Methode und eventuelle Helferfunktionen erweitern, 
* *data structure augmentation* einsetzen, um Code effizienter zu gestalten. 
***

**Szenario:**
Bei dem Online-Versandhändler häufen sich inzwischen die Auftragseingänge. Leider führt das auch zu einem erhöhten Aufkommen an Stornierungen. Deine Datenstruktur leistet gute Dienste, und die Geschäftsführerung bittet dich, auch eine Methode zum Entfernen von Aufträgen anzulegen. Der jeweilige Auftrag soll über die Auftragsnummer gefunden werden. 
Sie wünscht außerdem, den Umfang der aktuell offenen Aufträge jederzeit einsehen zu können. 

In dieser Übung werden wir uns zunächst um das erste Anliegen der Geschäftsführung kümmern: Wir werden eine Methode implementieren, mithilfe derer wir Aufträge aus der Warteschleife entfernen können. Im Gegensatz zu `delete_first()` findet sich der Auftrag aber nicht notwendigerweise am Anfang der Warteschleife. Er soll über die einmalig vergebene Auftragsnummer gefunden werden. Das Attribut `order_id` haben wir in unserer Klasse `LLQueue` bereits angelegt. 

Bevor wir loslegen, ein kleiner Hinweis vorweg: 
Die Übung ist bewusst offen gehalten. Du kannst sie nutzen, um deine Fähigkeiten im Methodendesign zu vertiefen. 
Hierdurch ist durchaus möglich, dass du etwas mehr Zeit als gewöhnlich benötigst, um eine gute Struktur zu finden, und um alle Eventualitäten in deinem Code unterzubringen. Wir stellen dir den Pseudocode hier im Notebook zur Verfügung, für den Fall, dass du nicht weiterkommst. Probiere aber am besten erstmal aus, ob du die Lösung alleine finden kannst.

## Ein Element aus der Mitte entfernen

In der vorigen Übung hast du eine modifizierte Linked List implementiert, die sich hervorragend als Warteschleife eignet.  
Nun hat der Versandhändler eine neue Anforderung: wird ein Auftrag storniert, so muss er entfernt werden. 

Die Methode `delete_node()` werden wir in der Klasse `LLQueue` anlegen. 

```python 
def delete_node(self, order_id): 
    """
    Delete node with specific order_id. Return deleted node, and None if nothing found. Print message if nothing is found. 

    Args: 
        order_id (int): unique order_id of LinkedNode object to be deleted from self. 

    Returns: 
        Deleted node (LinkedNode), None is self was empty.  

    """
    
```

Wir haben uns im Vorfeld eine Menge Gedanken um die Laufzeitkomplexitäten unserer Methoden gemacht. Sowohl `delete_first()` als auch `insert_last()` ließen sich in $O(1)$ implementieren. Mit dem Entfernen von Aufträgen aus der Mitte hatten wir uns hingegen noch nicht beschäftigt. Das werden wir hier nachholen. Welches ist also die bestmögliche Laufzeitkomplexität, in Big O-Notation, von `delete_node()`?

Im Gegensatz zu `delete_first()` und `insert_last()` wissen wir nun nicht mehr, wo sich der zu entfernende Auftrag befindet. Das bedeutet, wir müssen ihn, beziehungsweise seinen Vorgänger, zunächst finden. Erst anschließend können wir die Pointer neu setzen und so den Auftrag entfernen. Die Methode `delete_node()` soll beide Aufgaben abarbeiten. In den folgenden drei Fragen sollst du dir Gedanken um die Laufzeitkomplexitäten dieser Aufgaben und der gesamten Methode machen. Die Lösungen zu den Aufgaben findest du in den folgenden aufklappbaren Boxen. 

##### <font color="#3399DB">Aufgabe 1</font>
> Welches ist die Laufzeitkomplexität für das **Auffinden** eines Auftrags nach Auftragsnummer in `LLQueue`? Welches ist der schlechteste Fall? Nutze die folgende Codezelle für deine Notizen. 

In [None]:
#Lösung 

#O(n)
#im schlechtesten Fall findet sich das Element an der (vor)letzten Stelle beziehungsweise kann nicht gefunden werden. 

**Lösung**: Auffinden eines Auftrags in der *Linked List*.

<div class="details">

Aufgrund der Art und Weise, wie die *Linked List* auf dem Speicher angelegt ist, müssen von vorne beginnend alle Aufträge besucht werden, bis das gesuchte gefunden wurde, oder kein Auftrag zu der vorgegebenen Auftragsnummer gefunden wurde. Der schlechteste Fall tritt in jedem Fall dann ein, wenn der Auftrag nicht gefunden wurde. Die Laufzeitkomplexität ist linear, also $O(n)$.  

</div>


##### <font color="#3399DB">Aufgabe 2</font>
> Welches ist die Laufzeitkomplexität für das **Entfernen** eines Auftrags in `LLQueue`, wenn der Auftrag, beziehungsweise dessen Vorgänger, bereits gefunden wurde? Nutze die folgende Codezelle für deine Notizen. 

In [None]:
#Lösung: 

#O(1)

**Lösung:** Entfernen eines Auftrags aus der *Linked List*.

<div class="details">
Für das Entfernen selbst muss lediglich der Pointer des vorangegangenen Elements umgelenkt werden. Das ist unabhängig von der Anzahl der Elemente in der *Linked List*, somit $O(1)$.
</div>

##### <font color="#3399DB">Aufgabe 3</font>
> Welches ist die Laufzeitkomplexität von `delete_node()`? Die Methode soll sowohl das Auffinden des Vorgängers als auch das Entfernen des Auftrags beinhalten. Nutze die folgende Codezelle für deine Notizen.

In [None]:
#Lösung 

#O(n)

**Lösung:** Laufzeitkomplexität von `delete_node()`. 

<div class="details">
Das Auffinden des Vorgängers hat eine lineare Laufzeit, während das Entfernen konstant ist. Damit dominiert das Auffinden und die gesamte Laufzeitkomplexität ist linear, also $O(n)$. 
</div>

Nachdem wir uns Gedanken über die Laufzeitkomplexität von `delete_node()` gemacht haben, können wir uns an die Implementierung machen. Als nächsten Schritt werden wir zunächst Pseudocode entwerfen. So können wir uns im Vorfeld bereits überlegen, welche Helferfunktionen wir nutzen können. 

Wir sollten an dieser Stelle auch entscheiden, ob wir die Methode iterativ oder rekursiv implementieren wollen. In der ersten Übung hatten wir festgestellt, dass sich eine rekursive Lösung immer dann anbietet, wenn sich ein Problem in mehrere kleinere, aber im Wesentlichen identische Unterprobleme zerlegen lässt. Ein Beispiel hierfür war die binäre Suche. Unser vorliegendes Problem gleicht der linearen Suche, für die sich ein iterativer Algorithmus eher anbietet. 
Die rekursive Lösung bietet sich hier vor allem zu Übungszwecken an. Daher nutzt der vorgeschlagene Pseudocode auch die rekursive Version. Wenn du eine iterative Lösung bevorzugst, kannst du sie natürlich auch implementieren. 



##### <font color="#3399DB">Aufgabe 4</font>
> Formuliere Pseudocode für `delete_node()`. Welche Helferfunktion(en) benötigst du? Schreibe deine Notizen in die folgende Codezelle. Achte darauf, dass du die Methode in der bestmöglichen Laufzeitkomplexität implementierst. Einen möglichen Pseudocode findest du in der folgenden aufklappbaren Box. 

In [None]:
#Lösung 

#eigene Lösung 

**Mögliche Lösung:** Pseudocode für `delete_node()`. 

<div class="details">

Da sich die Aufgabe sehr klar in Teilaufgaben (Finden und Entfernen) aufteilen lässt, bietet es sich an, auch die Struktur der Methode entsprechend zu gestalten. Als Helferfunktion können wir rekursiv das Auffinden implementieren, und in der Hauptmethode dann darauf zurückgreifen.  
Der Pseudocode könnte in etwa folgendermaßen aussehen: 


> **Input:** `order_id` (`int`)
> * if queue is empty -> return None     
> * Else if queue is not empty:
>   * find_previous in self (helper function)
>   * if previous node is None:
>     *   if node itself is head node -> return delete_first() (implemented)
>     *   else if node itself is not found -> return None
>   * else if previous node was found:
>       * adjust next pointers 
>       * if node is tail -> update tail-pointer and return node
> 
> Helper function: *find_previous()*
>
> **Input:** `order_id` (`int`), start_node(`LinkedNode`, helper for recursion):
> 
> **Process:**
> * **Base case 1**: If start_node has `order_id`: -> Return None (is not previous)
> * **Base case 2**: If Linked List fully searched, nothing found -> Return None  (nothing found)
> * **Base case 3**: If next element has `order_id`: -> return start_node (previous node found)
> 
> **Recursive step:** 
> * Else if linked list not fully searched and node not found:
>   * set `start_node` to next element
>   * call function recursively with new `start_node` (and return it)

</div>

Wir sind nun soweit und können `delete_node()` implementieren. Hier siehst du nochmal den Docstring: 

```python 
def delete_node(self, order_id): 
    """
    Delete node with specific order_id. Return deleted node, and None if nothing found. Print message if nothing is found. 

    Args: 
        order_id (int): unique order_id of LinkedNode object to be deleted from self. 

    Returns: 
        Deleted node (LinkedNode), None is self was empty.  

    """
    
```

##### <font color="#3399DB">Aufgabe 5</font>
> Implementiere nun `delete_node()`. Füge die Methode deiner Klasse `LLQueue` in deinem Skript *linkedlist.py* hinzu. Nutze anschließend wieder die vorbereiteten Unit Tests zum Testen deines Codes. 

In [None]:
#Lösung: 
class LLQueue:
    """
    A queue implemented as a linked list.

    Attributes:
        head (LinkedNode): Head node of linked list. Defaults to None. 
        tail (LinkedNode): Tail node of linked list. Defaults to None. 
        
    """
    

    def __init__(self): 
        self.head = None 
        self.tail = None 


    def insert_last(self, data): 
        #implemented


    def delete_first(self): 
        #implemented
    

    def find_previous(self, order_id, start_node): 
        #helper function to recursively search for previous node
        if start_node.order_id == order_id: #base case: end if gone too far
            print('Node itself has order_id')
            return None 
        if start_node.next is None: #base case: nothing found 
            print(f'No node with order_id {order_id} found')
            return None 
        if start_node.next.order_id == order_id: #base case: node found 
            return start_node 
        else: #recursive step
            return self.find_previous(order_id, start_node.next)
    

    def delete_node(self, order_id): 
        """
        Delete node with specific order_id. Return deleted node, and none if nothing found. Print message if nothing is found. 
        
        Args: 
            order_id (int): unique order id of LinkedNode object to be deleted from self. 
            
        Returns: 
            Deleted node (LinkedNode), None is self was empty.  
            
        """

        assert isinstance(order_id, int)
        if self.tail is None: #empty queue
            return None
        node_prev = self.find_previous(order_id, self.head)
        if node_prev is None: #node does not exist
            if self.head.order_id == order_id: 
                return self.delete_first()
            return None 
        node = node_prev.next  
        node_prev.next = node.next
        self.length -= 1 
        if self.tail == node: 
            self.tail = node_prev
        return node 
        
            
class LinkedNode: 
    #implemented
  

In [2]:
!pytest test_linkedlist.py::test_delete_node test_linkedlist.py::test_delete_node_2

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 2 items                                                              [0m

test_linkedlist.py [32m.[0m[32m.[0m[32m                                                    [100%][0m



Hervorragend, du hast `delete_node()` implementiert. Die Methode sucht Aufträge anhand einer Auftragsnummer und entfernt sie anschließend. So können nun auch Stornierungen vorgenommen werden. 
Du teilst der Geschäftsführung mit, dass die Laufzeitkomplexität leider nicht ideal ist, dass du die Linked List aber dennoch für geeignet hältst. Schließlich sind Stornierungen eher der Ausnahmefall.  

## Die Länge der Linked List

Unsere Datenstruktur ist nun mit den wichtigsten Funktionen versehen. Die Geschäftsführerung des Online-Versandhandels bittet dich um eine letzte Erweiterung: Zur Berechnung ihrer Performancekriterien benötigt sie regelmäßig einen Überblick darüber, wieviele Aufträge sich aktuell in der Warteschleife befinden. Hierzu werden wir die Dunder-Methode `__len__(self)` in `LLQueue` implementieren. 

```python 
def __len__(self): 
    """Return number of LinkedNode objects in self."""
```

In diesem Abschnitt werden wir *data structure augmentation* nutzen, um die Laufzeitkomplexität von `__len__()` zu verbessern. Erinnern wir uns: *data structure augmentation* hatten wir bereits in unserer Klasse `LLQueue` vorgenommen, indem wir sie mit dem Attribut `tail` versehen haben. Das Attribut ist standardmäßig in einer Linked List nicht vorgesehen, doch mit seiner Hilfe konnten wir die Laufzeitkomplexität von `insert_last()` von $O(n)$ auf $O(1)$ verbessern. Als "Gegenleistung" mussten wir uns ein wenig um das Attribut kümmern und den *tail*-Pointer in sämtlichen Methoden gegebenenfalls anpassen.

Für `__len__()` werden wir ähnlich vorgehen: Wir werden `LLQueue` mit einem Attribut `length` versehen. Hierdurch müssen wir nicht jedes Mal, wenn wir `__len__()` aufrufen, durch die gesamte Warteschleife hindurch iterieren. Im Vergleich zu `tail` fügen wir das Attribut jetzt im Nachgang ein, so dass wir nun alle bereits implementierten Methoden gegebenenfalls nochmal anpassen müssen. 

##### <font color="#3399DB">Aufgabe 6</font>
> Implementiere `__len__()` in $O(1)$. Erweitere dazu `LLQueue` in *linkedlist.py* um ein Attribut `length` und achte darauf, das Attribut in deinen bereits implementierten Methoden bei Bedarf zu aktualisieren. Die leere Codezelle kannst du wieder nutzen, um deinen Code zu entwerfen. Nutze anschließend wieder den vorbereiteten Unit Test zum Testen deiner Methode.   

In [None]:
#Lösung: 
class LLQueue: 
    def __init__(self): 
        self.head = None 
        self.tail = None 
        self.length = 0
        
    def __len__(self): 
        """Return number of LinkedNode objects in self."""
        return self.length  

    def insert_last(self, data): 
        """
        Insert a new node at the last position of the queue. 
        
        Args: 
            data (LinkedNode): the node to be appended. 
        
        Returns: 
            None 
            
        """
        
        assert isinstance(data, LinkedNode)
        self.length += 1 #adjustment 
        if self.tail is None: 
            self.tail, self.head = data, data
        else: 
            self.tail.next = data
            self.tail = data 
            

    def delete_first(self): 
        """
        Delete first node. Print message if queue contains no elements, and nothing is deleted. 
        
        Returns: 
            Deleted node (LinkedNode), None is self was empty.  
            
        """
        
        if self.tail is None: 
            print('Queue contains no elements')
            return None
        self.length -= 1 #adjustment 
        pop = self.head
        self.head = self.head.next 
        if self.head is None: 
            self.tail = None 
        return pop


    def delete_node(self, order_id): 
        """
        Delete node with specific order_id. Return deleted node, and none if nothing found. 
        Print message if nothing is found. 
        
        Args: 
            order_id (int): unique order id of LinkedNode object to be deleted from self. 
            
        Returns: 
            Deleted node (LinkedNode), None is self was empty.  
            
        """

        assert isinstance(order_id, int)
        if self.tail is None: #then empty queue
            return None
        node_prev = self.find_previous(order_id, self.head)
        if node_prev is None: #node does not exist
            if self.head.order_id == order_id: 
                return self.delete_first()
            return None 
        node = node_prev.next  
        node_prev.next = node.next
        self.length -= 1 #adjustment 
        if self.tail == node: 
            self.tail = node_prev
        return node 

In [3]:
!pytest test_linkedlist.py::test_len

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 1 item                                                               [0m

test_linkedlist.py [32m.[0m[32m                                                     [100%][0m



Die Anzahl der Anzahl der Aufträge in der Warteschleife kann nun in konstanter Laufzeit per `len(my_queue)` aufgerufen werden. 

**Glückwunsch**: Deine Linked List hat nun alle gewünschten Funktionalitäten. Neu eingehende Aufträge können in die Warteschleife eingestellt werden, in den Bearbeitungsstatus wechselnde vom Anfang der Warteschleife entfernt werden. Wird ein Auftrag storniert, so kann er problemlos entfernt werden. Außerdem kann sich die Geschäftsführung leicht einen Überblick über die Anzahl der Aufträge in der Warteschleife machen. Die Geschäftsführerung ist zufrieden!

**Merke**:
* Das Entfernen von Elementen selbst ist in der Linked List in $O(1)$ implementierbar. 
* Das Auffinden des zu entfernenden Auftrags ist weniger schnell zu bewerkstelligen. Die Laufzeitkomplexität hierfür ist in der Linked List $O(n)$.  
* Wenn wir Methoden implementieren, bietet es sich an, Helferfunktionen zu schreiben, wenn sich die Funktionalitäten klar voneinander abgrenzen lassen. 
* Wenn wir Datenstrukturen im Nachgang um Attribute erweitern, müssen wir gegebenenfalls auch bereits implementierte Methoden entsprechend anpassen. 

***
Hast du eine Frage zu dieser Übung? Schau ins Forum, ob sie bereits gestellt und beantwortet wurde.
***
Fehler gefunden? Kontaktiere den Support unter support@stackfuel.com.
***