# Linked Lists (Lösung)
Modul Algorithmen & Datenstrukturen | Kapitel 1 | Notebook 2

***
In der Textlektion haben wir gesehen, dass sich die Datenstruktur Linked List gut zur Implementierung einer Warteschleife eignet. In diesem Notebook werden wir sie implementieren. Nach dieser Übung kannst du: 

* eine Warteschleife implementieren, die ihre Kernaufgaben in konstanter Laufzeit erledigt. 

***

**Szenario:**
Bei einem Online-Versandhändler werden eingehende Aufträge sukzessive abgearbeitet. Geht ein Auftrag ein, wird er in eine Warteschleife gestellt. Wechselt der Auftrag in den Bearbeitungsstatus, so wird er aus der Warteschleife entfernt und in ein Bearbeitungssystem verschoben. Die bisher verwendete Lösung nutzte für die Aufgabe eine Python-Liste. Inzwischen werden jedoch immer öfter Effizienzprobleme offenbar, so dass eine alternative Implementierung benötigt wird. Die Geschäftsführung bittet dich, Code für die Warteschleife zur Verfügung zu stellen. 

In der vorigen Textlektion haben wir uns zwei alternative sequenzielle Datenstrukturen angesehen: Das Array und die Linked List. Wir haben beider Laufzeitkomplexitäten im Hinblick auf die Kernaufgaben der Warteschleife analysiert. Die beiden Kernaufgaben sind: 

1. Geht ein Auftrag ein, so wird am Ende ein Datenpunkt eingefügt. 
2. Wechselt ein Auftrag in den Bearbeitungsstatus, so wird er vom Anfang der Warteschleife entfernt. 

Wir haben gesehen, dass die Linked List beide Aufgaben in konstanter Laufzeit erledigen kann, wenn wir sie, zusätzlich zu dem ohnehin vorgesehenen *head*-Pointer, mit einem *tail*-Pointer versehen. Das Array hingegen kommt sehr viel weniger gut mit der zweiten Aufgabe zurecht.
Während das Array mit dem eingebauten Datentyp `list` in Python sehr prominent vertreten ist, hat die Linked List keinen ähnlich bekannten Vertreter. In diesem Notebook wollen wir sie für unser Warteschleifenbeispiel implementieren. 

Hierzu legen wir eine Klasse `LLQueue` mit *head-* und *tail*-Pointer als Attributen an. 
Wir werden sie im Verlauf dieser Übung mit den Methoden `delete_first()` und `insert_last()` ausstatten. 
Für die Aufträge legen wir zusätzlich eine Klasse `LinkedNode` an. Die gesamte Linked List wird durch die *next*-Pointer in `LinkedNode` zusammengehalten, die wiederum nichts anderes sind als deren Attribute. Wir definieren die Docstrings entsprechend folgendermaßen: 

```python
class LLQueue:
    """
    A queue implemented as a linked list.

    Attributes:
        head (LinkedNode): Head node of linked list. Defaults to None. 
        tail (LinkedNode): Tail node of linked list. Defaults to None. 
        
    """
    
class LinkedNode:
    """
    A node in a linked list.
    
    Args: 
        order_id (int): a unique id that is assigned to a specific order. 
        **kwargs: additional data to be stored for an order.

    Attributes:
        order_id (int): a unique id that is assigned to a specific order.
        order_info (dict): additional data to be stored for an order. Defaults to {}.
        next (LinkedNode): next node. Defaults to None. 
    """
    

```

Zu jedem Auftrag - jeder Instanz von `LinkedNode` - können zusätzlich zu der ganzzahligen Auftragsnummer weitere Informationen, wie Zahlungsmethode oder die Anzahl der bestellten Produkte, abgespeichert werden.
In `LinkedNode` werden sie im Attribut `order_info` als `dict` abgespeichert. 
Nimm zur Übung an, dass die bearbeitende Person diese zusätzlichen Informationen als Variablen eingibt und nicht in Form eines `dict`. Anders ausgedrückt: Nutze die `**kwargs`, so rufst du dir ihre Funktionsweise nochmal in Erinnerung. 

##### <font color="#3399DB">Aufgabe 1</font>
> Implementiere die Warteschleife als Linked List für das Anwendungsbeispiel.
> Nutze die vorgebenen Docstrings und erstelle ein Skript mit dem Namen *linkedlist.py*.
> Überprüfe deinen Code anschließend anhand der vorbereiteten Unit Tests.
> Wenn du möchtest, kannst du wie immer die leere Codezelle nutzen, um deinen Code zu entwerfen. 

In [1]:
#Lösung 
class LLQueue:
    """
    A queue implemented as a linked list.

    Attributes:
        head (LinkedNode): Head node of linked list. Defaults to None. 
        tail (LinkedNode): Tail node of linked list. Defaults to None. 
        
    """
    
    def __init__(self): 
        self.head = None 
        self.tail = None 

            
class LinkedNode:
    """
    A node in a linked list.
    
    Args: 
        order_id (int): a unique id that is assigned to a specific order. 
        **kwargs: additional data to be stored for an order.

    Attributes:
        order_id (int): a unique id that is assigned to a specific order.
        order_info (dict): additional data to be stored for an order. Defaults to {}.
        next (LinkedNode): next node. Defaults to None. 
    """
    
    def __init__(self, order_id, **kwargs): 
        assert isinstance(order_id, int), 'order_id must be an integer'
        self.order_id = order_id
        self.order_info = kwargs
        self.next = None

In [1]:
!pytest test_linkedlist.py::test_node_init test_linkedlist.py::test_node_init_errors

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 2 items                                                              [0m

test_linkedlist.py [32m.[0m[32m.[0m[32m                                                    [100%][0m



Das Grundgerüst für unsere Warteschleife einschließlich aller vorgesehenen Pointer steht nun.  
Die bearbeitende Person kann alle relevanten Informationen zu einem Auftrag abspeichern, und es ist sichergestellt, dass die Auftragsnummer ein ganzzahliger Wert ist. Wir können uns nun darum kümmern, unsere Datenstruktur mit Methoden auszustatten. 

## Ein Element an der letzten Stelle einfügen 

Zunächst werden wir uns `insert_last()` zuwenden. Mithilfe der Methode werden neu eingehende Aufträge von der bearbeitenden Person beziehungsweise vom System in unsere Warteschleife eingestellt. Wir haben in der Textlektion gesehen, dass die Laufzeitkomplexität der Methode dank des *tail*-Pointers konstant ist. Das heißt, die Implementierung sollte ohne Schleifen oder Rekursionen auskommen. 

```python
def insert_last(self, data)    
    """
    Insert a new node at the last position of the queue. 
        
    Args: 
        data (LinkedNode): the node to be appended. 
        
    Returns: 
        None 
        
    """
```

##### <font color="#3399DB">Aufgabe 2</font>
> Implementiere `insert_last()` in der Klasse `LLQueue` in $O(1)$. Schreibe deinen Code in das bereits angelegte Skript *linkedlist.py*. Nutze anschließend wieder die vorbereiteten Unit Tests, um deinen Code zu überprüfen. Die leere Zelle kannst du wieder nutzen, um deinen Code zu entwerfen.   

In [6]:
#Lösung 
class LLQueue:
    """
    A queue implemented as a linked list.

    Attributes:
        head (LinkedNode): Head node of linked list. Defaults to None. 
        tail (LinkedNode): Tail node of linked list. Defaults to None. 
        
    """
    
    def __init__(self): 
        self.head = None 
        self.tail = None 
        
    def insert_last(self, data): 
        """
        Insert a new node at the last position of the queue. 
        
        Args: 
            data (LinkedNode): the node to be appended. 
        
        Returns: 
            None 
            
        """
        
        assert isinstance(data, LinkedNode) 
        if self.tail is None: #queue empty
            self.tail, self.head = data, data #set head and tail to new order 
        else: #queue not empty
            self.tail.next = data #set next pointer of previous tail 
            self.tail = data #then adjust tail pointer
            

In [40]:
!pytest test_linkedlist.py::test_insert_last test_linkedlist.py::test_insert_last_errors
    

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 2 items                                                              [0m

test_linkedlist.py [32m.[0m[32m.[0m[32m                                                    [100%][0m



Mit der Methode `insert_last()` können bearbeitende Personen beziehungsweise das System nun neu eingehende Aufträge in die Warteschleife einstellen. Sowohl der *next*-Pointer des ehemals letzten Auftrags als auch der *tail*-Pointer der Struktur werden in der Methode angepasst. Im nächsten Schritt werden wir uns der zweiten Kernaufgabe der Warteschleife zuwenden. 

## Ein Element am Anfang entfernen

Wechselt ein Auftrag in den Bearbeitungsstatus, muss er aus unserer Warteschleife entfernt werden. Das Element sollte außerdem ausgegeben werden, denn das System benötigt die Informationen, um den Auftrag weiter bearbeiten zu können. 
Die entsprechende Methode werden wir in unserer Klasse `LLQueue` implementieren. 
    
```python 
def delete_first(self): 
    """
    Delete first node. Print message if queue contains no elements, and nothing is deleted. 

    Returns: 
        Deleted node (LinkedNode), None if self was empty.  

    """
``` 

In der Textlektion haben wir bereits gesehen, dass auch das Entfernen des ersten Auftrags aus der Warteschleife eine konstante Laufzeitkomplexität hat. Wir müssen lediglich den *head*-Pointer anpassen. 

##### <font color="#3399DB">Aufgabe 3</font>
> Implementiere `delete_first()` in $O(1)$. Füge die Methode deiner Klasse `LLQueue` im Skript *linkedlist.py* hinzu. Die leere Codezelle kannst du wieder nutzen, um deinen Code zu entwerfen. Überprüfe deinen Code wieder anhand der vorliegenden Unit Tests. 

In [2]:
#Lösung 
class LLQueue:
    """
    A queue implemented as a linked list.

    Attributes:
        head (LinkedNode): Head node of linked list. Defaults to None. 
        tail (LinkedNode): Tail node of linked list. Defaults to None. 
        
    """
    
    def __init__(self): 
        self.head = None 
        self.tail = None 
        
    def insert_last(self, data): 
        """
        Insert a new node at the last position of the queue. 
        
        Args: 
            data (LinkedNode): the node to be appended. 
        
        Returns: 
            None 
            
        """
        
        assert isinstance(data, LinkedNode) 
        if self.tail is None: #queue empty
            self.tail, self.head = data, data #set head and tail to new order 
        else: #queue not empty
            self.tail.next = data #set next pointer of previous tail 
            self.tail = data #then adjust tail pointer
            
    
            
    def delete_first(self): 
        """
        Delete first node. Print message if queue contains no elements, and nothing is deleted. 

        Returns: 
            Deleted node (LinkedNode), None if self was empty.  

        """

        if self.tail is None: 
            print('Queue contains no elements')
            return None
        pop = self.head
        self.head = self.head.next 
        if self.head is None: 
            self.tail = None 
        return pop

In [5]:
!pytest test_linkedlist.py::test_delete_first

platform linux -- Python 3.8.10, pytest-6.2.4, py-1.11.0, pluggy-0.13.1
rootdir: /home/jovyan/work/pyprog/stackfuel-python-programmer-product-de/module-05/chapter-01-solutions
plugins: anyio-3.5.0
collected 1 item                                                               [0m

test_linkedlist.py [32m.[0m[32m                                                     [100%][0m



Die Warteschleife kann nun ihre Kernaufgaben wahrnehmen. Neu eingehende Aufträge können eingestellt, in den Bearbeitungsstatus wechselnde vom Anfang entfernt werden. 

Vielleicht fragst du dich, was mit dem entfernten Auftrag passiert ist. Besetzt er nicht weiterhin unnötig Speicherplatz? 
Theoretisch sollten wir diesen Speicherplatz leeren. Praktischerweise müssen wir uns darum in Python nicht kümmern -- das macht ein eingebauter Garbage Collector für uns. Wenn du die Vertiefungsbox ausklappst, kannst du mehr über ihn erfahren. 

**Vertiefung**: Pythons Garbage Collector. 

<div class="details">

Python verwaltet den Speicher automatisch über seinen eingebauten Garbage Collector. Der Garbage Collector leert den Speicherplatz nicht mehr referenzierter Objekte. In einer Pointer-basierten Datenstruktur bedeutet das, dass Elemente, auf die kein Pointer zeigt, entfernt werden. In manchen anderen Programmiersprachen, wie beispielsweise `C`, muss der Speicher hingegen manuell verwaltet werden.  
Der Garbage Collector in Python kann mittels des Moduls `gc` kontrolliert werden. Mit dem Modul `weakref` können wir manuell überprüfen, ob `delete_first()` den ersten Auftrag tatsächlich vom Speicher entfernt hat. Hier siehst du ein Minimalbeispiel: 

```python 
import weakref 

queue = LLQueue()
node1 = LinkedNode(1234)
queue.insert_last(node1)
n1_ref = weakref.ref(node1)
del node1 #needed to delete reference to variable
print(n1_ref()) #prints reference from queue
queue.delete_first() 
print(n1_ref()) #prints None
```

In diesem Beispiel kreieren wir mit `weakref.ref()` eine schwache Referenz zu unserem Auftrag (`node1`). Der Aufruf dieser Referenz gibt uns das Objekt zurück, sofern es existiert. Löschen wir nur `node1`, existiert der Auftrag immernoch - in `queue`. Entfernen wir es aber per `delete_first()` aus der Warteschleife, sollte es nicht mehr existieren. Der letzte `print`-Befehl gibt dann `None` aus. Wir können also sicher sein, dass das Objekt nicht mehr existiert. Der Umkehrschluss ist nicht notwendigerweise korrekt: Auch vom Garbage Collector entfernte Objekte können noch durch eine schwache Referenz identifizierbar sein. 

</div>

Übrigens: Möchtest du die Linked List in Python nutzen, musst du sie nicht jedes Mal selbst programmieren. Python hat eine eingebaute Klasse hierfür: `collections.deque`. 
Es nutzt eine Linked List-Datenstruktur, die in $O(1)$ Elemente am Anfang oder Ende entfernen oder hinzufügen kann. 


Da `delete_first()` ohne Rekursionen oder Schleifen auskommt, ist die Anzahl der Operationen unabhängig von der Anzahl der Aufträge in der Warteschleife, und at somit eine Laufzeitkomplexität von $O(1)$. Besser geht es nicht. 
Rufen wir uns nochmal abschließend in Erinnerung, wie die `list` in Python das erste Element entfernt: sämtliche nachfolgenden Elemente werden verschoben. 
Je mehr Aufträge sich in der Warteschleife befinden, desto höher ist die Rechenersparnis der neuen Lösung für den Online-Versandhändler. 

**Glückwunsch**: Deine Warteschleife kann nun vom Online-Versandhändler verwendet werden. Im Vergleich zur ursprünglichen Lösung, die eine Python-Liste nutzte, können auch Aufträge in konstanter Laufzeit vom Anfang entfernt werden. Die Geschäftsführung ist zufrieden mit deiner Arbeit!

**Merke**: 
* Eine modifizierte Version der Linked List eignet sich hervorragend als Warteschleife.  
* Mit `collections.deque` hat die Linked List einen wenig bekannten Vertreter in Python. 
* Python hat einen eingebauten Garbage Collector, der unreferenzierte Objekte automatisch entfernt. 

***
Hast du eine Frage zu dieser Übung? Schau ins Forum, ob sie bereits gestellt und beantwortet wurde.
***
Fehler gefunden? Kontaktiere den Support unter support@stackfuel.com.
***