# Fundamentale Datentypen

Das Implemetieren von Stack, Queues und Bags geht sehr einfach mithilfe von verketteten Listen. Verkettete Listen sind hier effizient, weil die grundlegenden Operationen ```add```, ```push```, ```pop```, ```enqueue```, ```dequeue``` jeweils nur am Anfang oder Ende der Liste Elemente hinzufügen oder löschen. Während Stacks und Queues auch einfach mittels einem dynamischen Array implementiert werden kann, ist diese Datenstruktur für Queues nicht geeignet. 
Wir zeigen hier deshalb die Implementation mittels verketteter Listen. 


## Stack

Wir beginnen mit der Implementation des Stacks. Die wichtigsten Operationen sind ```push``` und ```pop```. Eine einfache und effiziente Implementationsstrategie für diese beiden Methoden ist jeweils beim ```push``` ein Element am Anfang der Liste einzufügen, und mit ```pop``` ein Element vom Anfang der Liste zu entfernen. Beides geht in konstanter Zeit und ist einfach zu implementieren. 

In [92]:
class Stack:
        
    class Node:
        
        def __init__(self, value, next = None):
            self.value = value
            self.next = next
            
    def __init__(self):
        self.first = None
        self.numElements = 0
    
    def push(self, item):
        if self.first == None:
            self.first = Stack.Node(item)
        else:
            self.first = Stack.Node(item, self.first)
        self.numElements += 1
        
    def pop(self):                
        if self.first == None:
            raise Exception("popping from empty stack")
        else:
            self.numElements -= 1
            value = self.first.value
            self.first = self.first.next
            return value
        
    def size(self):
        return self.numElements
    
    def isEmpty(self):
        return self.size() == 0
   

    # Diese Methode wird verwendet, um den Inhalt der Liste in den 
    # Jupyter-notebooks anzeigen zu können. Gehört nicht zum eigentlichen 
    # Interface. Die Implementation entspricht einer einfachen Traversierung 
    # der Liste.
    def __repr__(self):
        outstr = "[" 
        currentNode = self.first
        while currentNode != None:
            outstr += str(currentNode.value) + " "
            currentNode = currentNode.next
        return outstr + "]"

### Nutzung von Stacks

Stacks werden immer dann gebraucht, wenn man das letzte einkommende Element als erstes verarbeiten muss. Sie sind aber auch nützlich, um Elemente umzusortieren, wie in diesem Beispiel gezeigt.

In [93]:
testdata = ["are", "you", "as", "happy", "as", "I", "am"]

Mittels der Push Methode werden die Elemente zum Stack hinzugefügt.

In [94]:
stack = Stack()
for datum in testdata:
    stack.push(datum)  

Diese können wir dann mittels der ```pop``` Methode wieder vom Stapel löschen.

In [95]:
while not stack.isEmpty():
    print(stack.pop())

am
I
as
happy
as
you
are


Um zu verstehen, wie die interne Repräsentation der Liste in jedem Schritt aussieht, können wir diese nach jedem push Ausgeben. Dies funktioniert, weil wir die spezielle Methode ```__repr__``` implementiert haben. 

In [27]:
stack = Stack()
for datum in testdata:
    stack.push(datum)  
    print(stack)

[are ]
[you are ]
[as you are ]
[happy as you are ]
[as happy as you are ]
[I as happy as you are ]
[am I as happy as you are ]


### Miniübung

* Schreiben Sie den Stack so um, dass er statt einer verketteten Liste ein Array zur Datenhaltung nutzt

In [104]:
class StackWithArray:
        
    
    def __init__(self):
        self.data = [None]
        self.numElements = 0
    
    def push(self, item):
        if self.numElements >= len(self.data):
            self.resize(len(self.data) * 2)
        self.data[self.numElements] = item
        self.numElements += 1
        
    def pop(self):                
        if self.numElements == 0:
            raise Exception("popping from empty stack")
        else:
            self.numElements -= 1
            value = self.data[self.numElements]
            if self.numElements > 0  and self.numElements == len(self.data) / 4:
                self.resize(int(len(self.data) / 2)) 
            return value
    def size(self):
        return self.numElements
    
    def isEmpty(self):
        return self.size() == 0

    def resize(self, numElements):
        newArray = [None] * numElements

        for i in  range(0, self.numElements):            
            newArray[i] = self.data[i]
        self.data = newArray
    

In [107]:
stack = StackWithArray()
for datum in testdata:
    stack.push(datum)  

In [108]:
while not stack.isEmpty():
    print(stack.pop())

am
I
as
happy
as
you
are


## Queue

Die Implementation von einer Queue ist ganz ähnlich wie die des Stacks. Wir müssen aber aufpassen, dass wir bei der ```enqueue``` Methode die Elemente immer am Ende anfügen, damit wir vom Anfang entfernen können (warum?). Wir brauchen also auch einen Zeiger auf das letzte Element, damit wir effizient am Ende der Liste einfügen können.

In [109]:
class Queue:
    
    class Node:        
        def __init__(self, value, next = None):
            self.value = value
            self.next = next
    
    def __init__(self):
        self.first = None
        self.last = None
        self.numberOfElements = 0
        
    def enqueue(self, value):
        if self.last == None:
            self.first = Queue.Node(value)
            self.last = self.first
        else:
            self.last.next = Queue.Node(value)
            self.last = self.last.next
        self.numberOfElements += 1

    
    def dequeue(self):  
        value = None
        if self.first == None:
            value = None
        else:
            value = self.first.value
            self.first = self.first.next        
            
            # Letztes Element wurde entfernt. Wir müssen den 
            # Last-Pointer noch entsprechend invalidieren
            if self.first == None:
                self.last = None
        self.numberOfElements -= 1
        return value
    
    def size(self):
        return self.numberOfElements
    
    def isEmpty(self):
        return self.size() == 0
    
    def __repr__(self):
        outstr = "[" 
        currentNode = self.first
        while currentNode != None:
            outstr += str(currentNode.value) + " "
            currentNode = currentNode.next
        return outstr + "]"

### Nutzung von Queues

Warteschlangen sind immer dann sinnvoll, wenn wir Elemente speichern wollen, die relative Reihenfolge der Elemente aber beibehalten wollen. 

In [110]:
xs = ["the", "order", "of", "the", "elements", "is", "important"]

Mittels der enqueue Methode werden Daten zur Warteschlange hinzugefügt. 

In [111]:
queue = Queue()
for x in xs:
    print("item: " +str(x))
    queue.enqueue(x)    

item: the
item: order
item: of
item: the
item: elements
item: is
item: important


In [112]:
while not queue.isEmpty():
    print(queue.dequeue())

the
order
of
the
elements
is
important


### Miniübung

* Schreiben Sie eine Variante der Queue, welche ein Python Liste verwendet. Ermitteln Sie experimentell die asymptotische Laufzeit, wenn Sie zufällige ```push``` und ```pop``` Operationen ausführen. 
* Schreiben Sie eine Variante der Queue, bei der Sie von beiden Seiten Elemente einfügen oder entfernen können. Sie benötigen dafür eine doppelt verkettete Liste.


In [113]:
class QueueWithArray:
        
    def __init__(self):
        self.data = []
        
    def enqueue(self, value):
        self.data.insert(0, value)
    
    def dequeue(self):  
        return self.data.pop()
    
    def size(self):
        return len(self.data)
    
    def isEmpty(self):
        return self.size() == 0
    
    def __repr__(self):
        return self.data

In [114]:
xs = ["the", "order", "of", "the", "elements", "is", "important"]

In [115]:
queue = QueueWithArray()
for x in xs:
    print("item: " +str(x))
    queue.enqueue(x)    

item: the
item: order
item: of
item: the
item: elements
item: is
item: important


In [116]:
while (queue.size() > 0):
    print(queue.dequeue())

the
order
of
the
elements
is
important


In [117]:
def enqueueN(n):
    q = QueueWithArray()
    for i in range(0, n):
        q.enqueue(i)
    return q;


In [119]:
import timeit
for i in range(1, 6):
    n = 10**i
 
    t = timeit.timeit(lambda: enqueueN(n), number=10)
    print("Durchschnittliche Zeit für eine enqueue Operation bei " + str(n) + " Elementen = " + str(t / n))

Durchschnittliche Zeit für eine enqueue Operation bei 10 Elementen = 5.739997141063213e-06
Durchschnittliche Zeit für eine enqueue Operation bei 100 Elementen = 3.1949998810887337e-06
Durchschnittliche Zeit für eine enqueue Operation bei 1000 Elementen = 5.467899958603084e-06
Durchschnittliche Zeit für eine enqueue Operation bei 10000 Elementen = 3.129583999980241e-05
Durchschnittliche Zeit für eine enqueue Operation bei 100000 Elementen = 0.00033424078000010923


In [120]:
class Dequeue:
    
    class Node:        
        def __init__(self, value, prev = None, next = None):
            self.value = value
            self.next = next
            self.prev = prev
    
    def __init__(self):
        self.first = None
        self.last = None
        self.numberOfElements = 0
        
    def enqueueBack(self, value):
        if self.last == None:
            self.first = Dequeue.Node(value)
            self.last = self.first
        else:
            self.last.next = Dequeue.Node(value, self.last, None)
            self.last = self.last.next
        self.numberOfElements += 1

    def enqueueFront(self, value):
        if self.last == None:
            self.first = Dequeue.Node(value)
            self.last = self.first
        else:
            self.first.prev = Dequeue.Node(value, None, self.first)
            self.first = self.first.prev
        self.numberOfElements += 1

    
    def dequeueFront(self):  
        value = None
        if self.first == None:
            value = None
        else:
            value = self.first.value
            if self.first.next != None:    
                self.first.next.prev = None
            
            self.first = self.first.next        
            
            # Letztes Element wurde entfernt. Wir müssen den 
            # Last-Pointer noch entsprechend invalidieren
            if self.first == None:
                self.last = None
        self.numberOfElements -= 1
        return value

    def dequeueBack(self):  
        value = None
        if self.first == None:
            value = None
        else:
            value = self.last.value
            if self.last.prev != None:    
                self.last.prev.next = None
            
            self.last = self.last.prev        
            
            if self.last == None:
                self.first = None
        self.numberOfElements -= 1
        return value

    
    def size(self):
        return self.numberOfElements
    
    def isEmpty(self):
        return self.size() == 0
    
    def __repr__(self):
        outstr = "[" 
        currentNode = self.first
        while currentNode != None:
            outstr += str(currentNode.value) + " "
            currentNode = currentNode.next
        return outstr + "]"

In [126]:
queue = Dequeue()
for x in xs:
    print("item: " +str(x))
    queue.enqueueBack(x)    


item: the
item: order
item: of
item: the
item: elements
item: is
item: important


In [127]:
while (queue.size() > 0):
    print(queue.dequeueBack())

important
is
elements
the
of
order
the



## Bag

Bei der Klasse Bag ist die Reihenfolge der Elemente nicht definiert. Wir sind also frei, ob wir lieber am Ende oder am Anfang einfügen. Wir haben uns in der folgenden Implementation für den Anfang entschieden, da dies etwas einfacher zu implementieren ist.  Beachten Sie, dass wir hier zusätzlich einen Iterator implementiert haben, um die Elemente im Bag zu traversieren. 

In [16]:
class Bag:
        
    class Node:
        
        def __init__(self, value, next = None):            
            self.value = value
            self.next = next
    
    class Iterator:
        
        def __init__(self, bag):
            self.currentElement = bag.first
        
        def next(self):
            if self.currentElement != None:
                value = self.currentElement.value
                self.currentElement = self.currentElement.next
                return value
            else:
                return None
                
        def hasNext(self):
            return self.currentElement != None
        

    
    def __init__(self):
        self.first = None
        self.numElements = 0
    
    def add(self, item):
        self.numElements += 1
        if self.first == None:
            self.first = Bag.Node(item)
        else:
            self.first = Bag.Node(item, self.first)
    
        
    def size(self):
        return self.numElements
    
    def isEmpty(self):
        return self.size() == 0    
    

    def iterator(self):
        return Bag.Iterator(self)       

### Nutzung von Bags

Eine typische Anwendung eines Bags ist zum Beispiel die Berechnung einer Statistik aus einer Sammlung von Daten. Für die meisten Statistiken ist die Reihenfolge der Daten irrelevant. 

In unserem Beispiel implementieren wir uns einen Client, der den Mittelwert einer Sammlung von Zahlen berechnet.

##### Testdaten generieren

Wir simulieren uns Testdaten, indem wir 1000 zufällige normalverteilte Zahlen (mit mean 1 und Varianz 4) generieren. 

In [20]:
import random
bag = Bag()
for i in range(0, 10000):
    bag.add(random.gauss(1.0, 4.0))

#### Mittelwert approximieren

Nun können wir uns das Stichprobenmittel mit der Formel $\frac{1}{n} \sum_{i=1}^n v_i$, wobei $v_i$ der $i-$te Wert ist, berechnen. Beachten Sie, dass wir hier einfach einmal über alle Werte iterieren müssen. Die Reihenfolge der Elemente ist nicht von Bedeutung. 

In [21]:
sum = 0.0
it = bag.iterator()
while (it.hasNext()):
    sum = sum + it.next()
mean = sum / bag.size()

In [22]:
print(mean)

1.0345076228730181
