# Datenstrukturen

Die einfachen Datentypen (Zahlen, Strings, ...) können in verschiedenen "Behältern" strukturiert werden.

Die wichtigsten sind:

| Type | Beispiel                   | Beschreibung                            |
|-----------|---------------------------|---------------------------------------|
| ``list``  | ``[1, 2, 3]``             | Geordnete Sammlung von Elementen                   |
| ``tuple`` | ``(1, 2, 3)``             | Unveränderliche geordnete Sammlung von Elementen          |
| ``dict``  | ``{'a':1, 'b':2, 'c':3}`` | Ungeordnetes Zuordnungstabelle von Schlüssel: Wert Paaren         |
| ``set``   | ``{1, 2, 3}``             | Ungeordnete Sammlung von einzigartigen Werten |




## Listen

Listen sind der grundlegende *geordnete* (nicht unbedingt sortierte!) und *veränderliche* Sammlungstyp.

Definiert mit eckigen Klammern, Werte getrennt mit Kommas.

In [None]:
L = [2, 3, 5, 7]

Die häufigsten Methoden und Funktionen um mit Listen zu arbeiten:

In [None]:
# Anzahl Elemente in der Liste
len(L)

In [None]:
# Element am Ende hinzufügen
L.append(11)
L

In [None]:
# Der + Operator bedeutet Kombination von Listen
L + [13, 17, 19]

In [None]:
# Die .sort Methode sortiert "in-place"
L = [2, 5, 1, 6, 3, 4]
L.sort()
L

Damit erschöpfen sich die eingebauten Methoden für Listen noch lange nicht - siehe [Dokumentation](https://docs.python.org/3/tutorial/datastructures.html).


Listen müssen nicht unbedingt immer nur einen Typ enthalten! 

In Python können wir Elemente jeden beliebigen Typs, und auch verschiedene Typen gemischt, in Sammlungen speichern. 


In [None]:
L = [1, 'two', 3.14, [0, 3, 5]]

Diese Flexibilität ist eine Konsequenz und eine Stärke des dynamischen Typsystems in Python. Weil wir uns nicht vorher darauf festlegen müssen, welche Element in einer Sammlung enthalten sein sollen,  kann Code schneller und einfacher geschrieben werden.


### Indexing und Slicing

Um auf einzelne Werte in geordneten Sammlungen zuzugreifen, haben wir zwei Möglicheiten:

1. *Indexing* für einzelne Elemente
2. *Slicing* für mehrere Elemente

Beide nutzen eckige Klammern.

Wichtig - Indizes in Python *starten bei 0* (wie C, aber anders als FORTRAN oder Matlab).

In [None]:
L = [2, 3, 5, 7, 11]
L[0]

In [None]:
L[1]

Um Elemente vom Ende her aufzurufen, nutzen wir einen negativen Index, beginnend mit -1:

In [None]:
L[-1]

In [None]:
L[-2]

Mit *slicing* bekommt man einen Abschnitt der Liste. Dafür werden zwei Indizes angegeben, der Startpunkt (inklusive) und der Endpunkt (exklusive) des Abschnitts.

In [None]:
# Die ersten drei Elemente der Liste
L[0:3]

Selektiert wird also bis zur Position des Index `3`.



Wird der erste Index ausgelassen, wird vom Start der Liste gewählt:

In [None]:
L[:3]

Wird der letzte Index ausgelassen, gilt die Auswahl bis zum Ende der Liste.

In [None]:
# Die letzten drei Elemente
L[-3:]

Mit einem zweiten Doppelpunkt kann man noch eine *Schrittlänge* angeben.

Um z.B. jedes zweite Element der Liste auszugeben:

In [None]:
L[::2]  # äquivalent zu L[0:5:2]

Dabei ist auch eine negative Schrittlänge möglich!

In [None]:
L[::-1]

Für Listen gilt: Elemente, die mit Index oder Slice ausgewählt wurden, können auch neu belegt werden.

In [None]:
L[0] = 100
print(L)

In [None]:
L[1:3] = [55, 56]
print(L)

Die Indexing und Slicing Syntax wird analog auch in Datenverarbeitungspaketen wie NumPy, Pandas etc verwendet.

## Tupel

Tupel sind in Python Listen sehr ähnlich. Sie werden mit Kommas definiert, optional in runden Klammern.

In [None]:
t = 1, 2, 3
# oder
t = (1, 2, 3)

Wie Listen haben Tupel eine Länge und eine Ordnung, deswegen können Elemente über Index gewählt werden.

In [None]:
len(t)

In [None]:
t[0]

Der Unterschied zu Listen ist die *Unveränderlichkeit* - wenn ein Tupel erzeugt wurde, können die Länge und die einzelnen Elemente nicht mehr verändert werden:

In [None]:
t[1] = 4

In [None]:
t.append(4)

Tupel werden automatisch verwendet wenn Funktionen mehrere Werte zurückgeben.

Beispiel: Die ``as_integer_ratio()`` Methode von Floats gibt einen Zähler und Teiler als Tupel zurück:

In [None]:
x = 0.125
x.as_integer_ratio()

Ein Tupel kann in mehrere Variablen entpackt werden:

In [None]:
numerator, denominator = x.as_integer_ratio()
print(numerator / denominator)

## Dictionaries
Dictionaries sind sehr flexible Zuordnungstabellen, bestehend aus Paaren von Schlüsseln und Werten.

Die Syntax ist `{Schlüssel: Wert, Schlüssel: Wert}`:

In [None]:
numbers = {'one':1, 'two':2, 'three':3}

Die Schlüssel müssen dabei einzigartig sein.

Elemente können ähnlich wie Listen mit eckigen Klammern ausgewählt werden. Allerdings wird hier der Wert der Schlüssels als Index genutzt.

In [None]:
# Wert über Schlüssel auslesen
numbers['two']

Neue Werte werden ähnlich eingefügt:

In [None]:
numbers['ninety'] = 90
print(numbers)

Die Elemente im Dictionary sind nicht geordnet. Das erlaubt eine effiziente Implementation als sogenannte *Hash Table*.

Die [Dokumentation](https://docs.python.org/3/library/stdtypes.html) hat die vollständige Liste der Methoden für Dictionaries.

## Mengen

Mengen (`set`) sind ungeordnete Sammlungen von einzigartigen Werten.

Die Definition ist wieder ähnlich wie für Listen, nur mit geschweiften Klammern.

In [None]:
primes = {2, 3, 5, 7}
odds = {1, 3, 5, 7, 9}

Für mathematische Operation mit Mengen wurden die binären Operatoren wiederverwendet.

In [None]:
# Vereinigung: Elemente, die in einer beider Mengen auftauchen
primes | odds      

In [None]:
# Schnittmenge: Elemente, die in beiden Mengen auftauchen
primes & odds             

In [None]:
# Differenz: Elemente in primes, aber nicht in odds
primes - odds           

In [None]:
# Symmetrische Differenz: Elemente, die nur in einer Menge enthalten sind
primes ^ odds                     

Die `set` Funktion erzeugt Mengen aus anderen Sequenzen:

In [None]:
l = [1, 2, 3, 3, 2]
set(l)

In [None]:
# auch str ist eine Sequenz:
set("Hello World")

Für die komplette Auflistung aller Methoden und Operationen: siehe [Dokumentation](https://docs.python.org/3/library/stdtypes.html).