# Fundamentale Datentypen

Das Implemetieren von Stack, Queues und Bags geht sehr einfach mithilfe von verketteten Listen. Verkettete Listen sind hier effizient, weil die grundlegenden Operationen ```add```, ```push```, ```pop```, ```enqueue```, ```dequeue``` jeweils nur am Anfang oder Ende der Liste Elemente hinzufügen oder löschen. Für diese Datenstrukturen haben die verketteten Listen also einen Vorteil gegenüber dynamischen Arrays. 


## Stack

Wir beginnen mit der Implementation des Stacks. Die wichtigsten Operationen sind ```push``` und ```pop```. Eine einfache und effiziente Implementationsstrategie für diese beiden Methoden ist jeweils beim ```push``` ein Element am Anfang der Liste einzufügen, und mit ```pop``` ein Element vom Anfang der Liste zu entfernen. Beides geht in konstanter Zeit und ist einfach zu implementieren. 

In [3]:
class Stack:
        
    class Node:
        
        def __init__(self, value, next = None):
            self.value = value
            self.next = next
            
    def __init__(self):
        self.first = None
        self.numElements = 0
    
    def push(self, item):
        if self.first == None:
            self.first = Stack.Node(item)
        else:
            self.first = Stack.Node(item, self.first)
        self.numElements += 1
        
    def pop(self):                
        if self.first == None:
            raise Exception("popping from empty stack")
        else:
            self.numElements -= 1
            value = self.first.value
            self.first = self.first.next
            return value
        
    def size(self):
        return self.numElements
    
    def isEmpty(self):
        return self.size() == 0
   

    # Diese Methode wird verwendet, um den Inhalt der Liste in den 
    # Jupyter-notebooks anzeigen zu können. Gehört nicht zum eigentlichen 
    # Interface. Die Implementation entspricht einer einfachen Traversierung 
    # der Liste.
    def __repr__(self):
        outstr = "[" 
        currentNode = self.first
        while currentNode != None:
            outstr += str(currentNode.value) + " "
            currentNode = currentNode.next
        return outstr + "]"

### Client

Stacks werden immer dann gebraucht, wenn man das letzte einkommende Element als erstes verarbeiten muss. Sie sind aber auch nützlich, um Elemente umzusortieren, wie in diesem Beispiel gezeigt.

In [4]:
testdata = ["are", "you", "as", "happy", "as", "I", "am"]

Mittels der Push Methode werden die Elemente zum Stack hinzugefügt.

In [5]:
stack = Stack()
for datum in testdata:
    stack.push(datum)  

Diese können wir dann mittels der ```pop``` Methode wieder vom Stapel löschen.

In [6]:
while not stack.isEmpty():
    print(stack.pop())

am
I
as
happy
as
you
are


Um zu verstehen, wie die interne Repräsentation der Liste in jedem Schritt aussieht, können wir diese nach jedem push Ausgeben. Dies funktioniert, weil wir die spezielle Methode ```__repr__``` implementiert haben. 

In [7]:
stack = Stack()
for datum in testdata:
    stack.push(datum)  
    print(stack)

[are ]
[you are ]
[as you are ]
[happy as you are ]
[as happy as you are ]
[I as happy as you are ]
[am I as happy as you are ]


## Queue

Die Implementation von einer Queue ist ganz ähnlich wie die des Stacks. Wir müssen aber aufpassen, dass wir bei der ```enqueue``` Methode die Elemente immer am Ende anfügen, damit wir vom Anfang entfernen können (warum?). Wir brauchen also auch einen Zeiger auf das letzte Element, damit wir effizient am Ende der Liste einfügen können.

In [9]:
class Queue:
    
    class Node:        
        def __init__(self, value, next = None):
            self.value = value
            self.next = next
    
    def __init__(self):
        self.first = None
        self.last = None
        self.numberOfElements = 0
        
    def enqueue(self, value):
        if self.last == None:
            self.first = Queue.Node(value)
            self.last = self.first
        else:
            self.last.next = Queue.Node(value)
            self.last = self.last.next
        self.numberOfElements += 1
        #pass  # Ihre Implementation kommt hierhin

    
    def dequeue(self):  
        value = None
        if self.first == None:
            value = None
        else:
            firstNode = self.first
            self.first = self.first.next
            value = firstNode.value
            
            # Letztes Element wurde entfernt. Wir müssen den 
            # Last-Pointer noch entsprechend invalidieren
            if self.first == None:
                self.last = None
        self.numberOfElements -= 1
        return value
    
    def size(self):
        return self.numberOfElements
    
    def isEmpty(self):
        return self.size() == 0
    
    def __repr__(self):
        outstr = "[" 
        currentNode = self.first
        while currentNode != None:
            outstr += str(currentNode.value) + " "
            currentNode = currentNode.next
        return outstr + "]"

### Client

Warteschlangen sind immer dann sinnvoll, wenn wir Elemente speichern wollen, die relative Reihenfolge der Elemente aber beibehalten wollen. 

In [15]:
xs = ["the", "order", "of", "the", "elements", "is", "important"]

Mittels der enqueue Methode werden Daten zur Warteschlange hinzugefügt. 

In [17]:
queue = Queue()
for x in xs:
    print("item: " +str(x))
    queue.enqueue(x)    

item the
item order
item of
item the
item elements
item is
item important


In [12]:
while not queue.isEmpty():
    print(queue.dequeue())

the
order
of
the
elements
is
important



## Bag

Bei der Klasse Bag ist die Reihenfolge der Elemente nicht definiert. Wir sind also frei, ob wir lieber am Ende oder am Anfang einfügen. Wir haben uns in der folgenden Implementation für den Anfang entschieden, da dies etwas einfacher zu implementieren ist.  Beachten Sie, dass wir hier zusätzlich einen Iterator implementiert haben, um die Elemente im Bag zu traversieren. 

In [18]:
class Bag:
        
    class Node:
        
        def __init__(self, value, next = None):            
            self.value = value
            self.next = next
    
    class Iterator:
        
        def __init__(self, bag):
            self.currentElement = bag.first
        
        def next(self):
            if self.currentElement != None:
                value = self.currentElement.value
                self.currentElement = self.currentElement.next
                return value
            else:
                return None
                
        def hasNext(self):
            return self.currentElement != None
        

    
    def __init__(self):
        self.first = None
        self.numElements = 0
    
    def add(self, item):
        self.numElements += 1
        if self.first == None:
            self.first = Bag.Node(item)
        else:
            self.first = Bag.Node(item, self.first)
    
        
    def size(self):
        return self.numElements
    
    def isEmpty(self):
        return self.size() == 0    
    

    def iterator(self):
        return Bag.Iterator(self)       

### Client

Eine typische Anwendung eines Bags ist zum Beispiel die Berechnung einer Statistik aus einer Sammlung von Daten. Für die meisten Statistiken ist die Reihenfolge der Daten irrelevant. 

In unserem Beispiel implementieren wir uns einen Client, der den Mittelwert einer Sammlung von Zahlen berechnet.

##### Testdaten generieren

Wir simulieren uns Testdaten, indem wir 1000 zufällige normalverteilte Zahlen (mit mean 1 und Varianz 4) generieren. 

In [19]:
import random
bag = Bag()
for i in range(0, 1000):
    bag.add(random.gauss(1.0, 4.0))

#### Mittelwert approximieren

Nun können wir uns das Stichprobenmittel mit der Formel $\frac{1}{n} \sum_{i=1}^n v_i$, wobei $v_i$ der $i-$te Wert ist, berechnen. Beachten Sie, dass wir hier einfach einmal über alle Werte iterieren müssen. Die Reihenfolge der Elemente ist nicht von Bedeutung. 

In [None]:
sum = 0.0
it = bag.iterator()
while (it.hasNext()):
    sum = sum + it.next()
mean = sum / bag.size()

In [None]:
print(mean)

#### Übung:

* Experimentieren Sie mit diesen Implementationen und versuchen Sie diese zu verstehen. 
* Fügen Sie falls nötig an den richtigen Stellen mit dem Befehl ```print``` Ausgaben hinzu, damit Sie nachverfolgen können, was in jedem Schritt passiert. 