## 4. Datenstrukturen in Python

Unterschied zwischen *Datenstrukturen* und *einfachen Datentypen*:
- Datenstrukturen sind zusammengesetzt aus Objekten *einfachen Datentyps* und damit wesentlich komplexer aufgebaut
- Sind die Objekte in einer Datenstruktur fortlaufend angeordnet, spricht man von *sequentiellen Datentypen*, z.B. String, Listen, Tupel, etc.
-  Datenstrukturen besitzen neben ihren *Objekten* geeignete *Operatoren*, um so effizient wie möglich auf diese zugreifen zu können
- Es gibt sowohl veränderliche (*mutable*) als auch unveränderliche (*immutable*) Datenstrukturen, die einfachen Datentypen sind alle unveränderbar (*immutable*)

Beispiele von Datenstruktur-Operatoren anhand von Strings:

In [None]:
# Beispiel
wort = "Koeffizenten"
print(wort[0])              # Zugriff auf Elemente über []-Klammer
print("ente" in wort)       # Anwendung des Enthalten-Operators
print("Ambi" + wort[7:11])  # Konkatenation nur bei gleichartigen Datenstrukturen und Slicing
print(3*"bla")              # Vervielfältigung
print(len(wort))            # Jede Datenstruktur hat eine Länge, die ermittelt werden kann

##### Anmerkung zur String-Formatierung

Der neuste/aktuellste Weg, einen String zu formatieren, ist via `f-String`. `f` steht für *formatted*. Vorteile gegenüber alten Formatierungsmethoden (z.B. `format()` oder `%`-Operator):
- prägnanter und lesbarer
- schneller


In [None]:
# Beispiele zum f-String
goldenerSchnitt = 1597/987      # Verhältnis einer Fibonaccizahl zu ihrem Vorgänger
print(f"Mit dem Verhältnis zweier Fibonaccizahlen kann man den goldenen Schnitt annähern. Dieser beträgt {goldenerSchnitt}")
print(f"Man kann aber auch schreiben, dass {goldenerSchnitt=}")
print(f"Schöner wäre: {goldenerSchnitt = }")
print(f"Wenn man nur die ersten vier Nachkommastellen braucht: {goldenerSchnitt = :.4f}")
print(f"In Exponentialschreibweise wäre es: {goldenerSchnitt = :.4e}")

Es gibt noch viele weitere Formatierungsmöglichkeiten mithilfe der [Format Specification Mini-Language](https://docs.python.org/3.4/library/string.html#format-specification-mini-language)

Außerdem gibt es noch eigene [String-Methoden](https://docs.python.org/3/library/stdtypes.html#string-methods), die für diese Vorlesung nicht weiter von Bedeutung sind.

### 4.1 Listen

Die Datenstruktur `list` ist eine geordnete Zusammenfassung **verschiedener** Objekte. Sie kann während der Laufzeit geändert werden und ist daher *mutable*. Der Python-Interpreter erkennt eine Listendefinition an den eckigen Klammern `[]`. Die Zählung beginnt immer beim Index $0$. 

In [None]:
# TODO Listendeklaration und Standardoperatoren
x = [3, 99, "Ein Text"]     # kann verschiedene Datentypen enthalten
y = [0b110, 8.5, x, "Wort"] # kann auch Listen in Listen geben


#### 4.1.1 Operationen auf Listen


|  Methode |  Beschreibung |   
|:-------|:-------|
|  `list.append(x)` | Die Liste list wird um das objekt x erweitert  |
| `list.extend(L)`   | Die Liste list wird um die Elemente der Datenstruktur L erweitert   | 
| `list.insert(i, x)`  | Objekt x wird and der Stelle i in die Liste list eingefügt   |
| `list.remove(x)`  | Löscht das *erste* Element mit dem Wert x aus der Liste   |
|  `list.pop()` | Das letzte Element wird aus der Liste gelöscht **und** zurückgegeben (Stapelverarbeitung)   |
|  `list.pop(i)` | Das i-te Element wird aus der Liste gelöscht **und** zurückgegeben   |
| `list.index(x)`   | Zurückgegeben wird der Index i des ersten Listenelements, bei dem `list[i] == x`   |
| `list.count(x)`  | Anzahl der Objekte mit dem Wert x   |
|  `list.sort()` | Die Elemente der Liste list werden aufsteigend sortiert  |
| `list.reverse()`  | Dreht die Reihenfolge der Objekte in der Liste um   |
| `del list`  | Löscht die **gesamte** Liste   |
|`del liste[i]`   | Löscht das Listenelement mit Index i, **ohne** es als Funktionswert zurückzugeben. Man kann auch Bereiche `[i:j]` löschen.   |

In [None]:
# TODO Beispiele zu Listenoperationen



In [None]:
# TODO Beispiel Liste als Stapel
     

#### 4.1.2 Listenabstraktion (*list comprehension*)

Wenn es nach Erfinder Guido van Rossum ginge, gäbe es statt `lambda` und Co. nur noch die *List Comprehension* in Python 3. Diese ist nämlich genauso eine elegante Methode, um Kollektionen in Python zu definieren und zu erzeugen. Demnach ist es auch eine einfache Methode, um neue Listen oder auch Unterlisten zu erzeugen, oder um innerhalb einer Liste, Anweisungen auszuführen.

*List Comprehensions* erzeugen aus einer Eingabeliste eine Ausgabeliste. Die einfachste und allgemeine Form folgt dem Syntax:

```python
ausgabeliste = [ausdruck for element in eingabeliste]
```

In [None]:
# TODO Erzeugen der Quadratzahlen von 1 bis 9 und speichern in einer Liste
# "Klassisch"


In [None]:
# TODO Erzeugen der Quadratzahlen von 1 bis 9 und speichern in einer Liste
# Via list comprehension


Der Syntax kann ebenso um eine `if`-Anweisung ergänzt werden:
```python
ausgabeliste = [ausdruck for element in eingabeliste if bedingung]
```

In [None]:
# TODO alle Zahlen von 10 bis 100, die durch 4 teilbar sind


#### 4.1.3 `lambda`, `map`, `filter` und `reduce` als Alternative zur Listenabstraktion

##### Anwenden mit `map`

Mithilfe der *list comprehension* kann man also einen `ausdruck` (oder Funktion) auf eine Liste (*eingabeliste*) anwenden. Genau dasselbe ist mit der `map`-Funktion möglich:

```python
ausgabe = map(func, seq)    # func = Funktion, seq = sequentieller Datentyp
```

In [None]:
# zähle zu allen Zahlen einer Liste 2 dazu
neueListe = list(map(lambda x: x +2, range(10)))
print(neueListe)

In [None]:
# TODO Umrechnung von Grad Celsius in Fahrenheit: °F = (9/5)*°C +32
messungenCelsius = [35.4, 36.3, 37.8, 38.0, 39.6, 42.1 ]
messungenFahrenheit = pass # TODO

##### Filtern mit `filter`

`map` nimmt alle Ergebnisse aus der Funktion in die neue Liste auf. `filter` hingegen nur diejenigen Funktionsergebnisse, die `True` liefern. Sie liefert ein gefiltertes *Iterable* zurück. 

Syntax:

```python
ausgabe = filter(func, iter)    # func = Funktion, iter = seq. Datentyp oder iterierbares Objekt
```



Einschub: Was ist ein *iterierbares Objekt (itarable)*?
> Bei einem iterierbaren Objekt (englisch: iterable) handelt es sich um ein Objekt, das seine
Elemente einzeln zurückgeben kann, d.h. eins nach dem anderen. Beispiele für iterierbare
Objekte sind alle sequentiellen Datentypen wie list, str und tuple), aber auch die
Dictionary-Klasse dict.

&rarr; Jeder sequentielle Datentyp ist iterierbar, aber nicht jedes iterierbare Objekt hat einen sequentiellen Datentyp. Bei sequentiellen Datentypen gibt es einen **Index**, um auf einzelne Elemente zuzugreifen

In [None]:
# TODO alle Zahlen von 10 bis 100, die durch 4 teilbar sind


##### Reduzieren mit `reduce`

"aka *Guido ärgern*", denn diese Funktion wurde aus den Standardmodulen von Python 3 verbannt. Genutzt werden kann es daher nur, wenn sie vorher aus dem Modul `functools` importiert wird. Syntax:

```python
from functools import reduce
ausgabewert = reduce(func, seq)     # func = Funktion, seq = sequentieller Datentyp
```

Dennoch kann die Funktion nützlich sein. Sie wird verwendet, um eine Funktion auf die Elemente einer Sequenz *kumulativ* anzuwenden und auf einen einzigen Wert zu reduzieren.

In [None]:
# TODO Summe einer Liste


In [None]:
# TODO Maximum einer Liste


#### 4.1.4 Kopieren von Listen

In [None]:
# Was nichts mit Kopieren zu tun hat
x = [ 1, 2, 3, 4, 5]
y = x
print("x: ", x)             
print("y: ", y)             
print(id(x), id(y), "\n")   
# Veränderung der Liste
print("Veränderung")
x[1] = 33
print("x: ", x)             
print("y: ", y)             
print(id(x), id(y), "\n")   

Was in obiger Zelle geschehen ist, nennt man *Aliasing*, weil ein Alias (anderer Name) für einen bereits existierenden Namen gebildet wird (`y = x`). Beide Namen zeigen intern auf das gleiche Objekt, daher kann nicht von einer Kopie gesprochen werden.

In [None]:
# TODO Flache Kopie


Das obige Beispiel scheint zu funktionieren. Statt des Slicing-Operators `[:]` kann man auch schreiben `y = x.copy()`. 

Funktioniert das auch für verschachtelte Listen?

In [None]:
# TODO Flache Kopie einer verschachtelten Liste


Die Antwort ist **nein**. Flache Kopien (*shallow copy*) funktionieren auch nur mit flachen Listen, d.h. Listen, die keine Unterlisten enthalten. Beim flachen Kopieren werden werden auch die Zeiger auf die Unterlisten mitkopiert, wodurch die Kopie auf dieselbe Unterliste zeigt, wie das Original.

Um auch die Unterobjekte mitzukopieren und sog. *tiefe Kopien* anzufertigen, benötigt man die Funktion `deepcopy()`. Eine tiefe Kopie ist ein völlig selbstständiges Sysstem von Objekten und hat keinerlei Zusammenhang mehr zum Original.

In [None]:
# TODO tiefe Kopie


### 4.2 Tupel

Ein Tupel ist eine Sequenz von Elementen, die iterierbar sind, aber nicht verändert werden können. Tupel sind *immutable*. Von der Idee her sind Listen eine Aufzählung vieler Einzelobjekte, wohingegen Tupel die Modellierung der Struktur *eines* komplexen Einzelobjektes betonen. 

**Faustregel**: Tupel machen alles, was Listen auch machen. ABER sie sind unveränderlich.

In [None]:
# TODO Beispiele


#### 4.2.1 Anwendung von Tupel

In Python sind auch Mehrfachzuweisungen (mehrere Zuweisungen in einer Zeile) möglich, durch die man beispielsweise ideal Variablenwerte vertauschen kann:

In [None]:
# reine Mehrfachzuweisung
minimum, maximum, text = 3, 99, "Ein Text"
print(minimum, maximum, text)
maximum, minimum = minimum, maximum
print(minimum, maximum, text)

Folgendes bezeichnet man als Tupel-Packing:

In [None]:
# TODO Tupel-Packing


Von Tupel-Unpacking ("Tupel-Entpacken") spricht man, wenn man die einzelnen Werte eines Tupels Variablen zuordnet: 

In [None]:
# TODO Tupel-Unpacking


In [None]:
# TODO Tupel-Unpacking im Funktionsaufruf


#### 4.2.2 Nutzung der `enumerate()`-Funktion

`enumerate()` ist eine *built-in function*, die zu jedem iterierbaren Objekt (*iterable*) einen Index/Zähler hinzufügt und das Ergebnis in Form eines Tupel zurückgibt. Der Syntax lautet `enumerate(iterable, start = 0)`, wobei:
- **iterable**: irgendein iterierbares Objekt
- **start**: Optional. Gibt den Startindex an. Default = 0.

In [None]:
# TODO Beispiel
liste = ["eat", "sleep", "repeat"]


Die `next()`-Funktion:

In [None]:
fruits = ['apple', 'banana', 'cherry']
enum_fruits = enumerate(fruits)
 
next_element = next(enum_fruits)
print(f"Next Element: {next_element}")
next_element = next(enum_fruits)
print(f"Next Element: {next_element}")
next_element = next(enum_fruits)
print(f"Next Element: {next_element}")
# next_element = next(enum_fruits)      # geht nicht
# print(f"Next Element: {next_element}")

"Verändern" eines Tupel:

In [None]:
# Erweiterung eines Tupels
t = ( 1, 2, 3 )
print("Original", t)
# Versuch1, Ziel: ( 1, 2, 3, 4 )
t1 =   # TODO
print("Versuch 1:", t1)
# Versuch 2, Ziel: ( 1, 2, 3, 4 )
t2 =   # TODO
print("Versuch 2:", t2)
# Versuch 3, Ziel: ( 1, 2, 3, 4 )

t3 =  # TODO
print("Versuch 3:", t3)
# Versuch 4, Ziel: ( 1, 2, 3, 4 )
t4 =  # TODO 
print("Versuch 4:", t4)

**Achtung**: Denkweise anpassen!

In [None]:
#  Iterationen mit der for-Schleife

t1 = ( (1,2,3), (4,5,6) ) # 2x3-Tuple
# Array-Denkweise mit Indizes (schlecht!)
for i in range(2):
    for j in range(3) :
        print(t1[i][j])

In [None]:
# Tupel-Denkweise mit Elementen (gut!)
for i in t1:
    for j in i :
        print(j)

In [None]:
t2 = ( (1,), (2,3), (4,5,6)) # Dreiecks-Tupel
# TODO Ausgabe der Tupel-Elemente des Dreiecks-Tupels


### 4.3 Mengen

Mengen (*sets*) sind ungeordnete Kollektionen ohne Duplikate, die iterierbar und veränderbar sind. Damit bezeichnet man sie auch als *iterable* und *mutable*. Die Elemente einer Menge haben keine Reihenfolge, damit auch keine Indizes und zählen somit auch nicht zu den sequentiellen Datentypen.

Um Mengen unveränderbar (*immutable*) zu machen gibt es den Datentyp `frozenset`. 

Zum Erzeugen einer Menge verwendet man wie in der Mathematik geschweifte Klammern (alternativ mit dem Schlüsselwort `set(...)`)

In [None]:
# TODO Beispiel Menge


Übliche Operatoren aus der Mathematik: Schnittmenge `&`, Vereinigung `|` und Differenz `-`

In [None]:
# Mengen-Operatoren aus der Mathematik
m1 = set("Einstein")
m2 = set("Relativitaet")
print(m1 & m2)  # Schnittmenge
print(m1 | m2)  # Vereinigung
print(m1 - m2)  # Differenz

Methoden für weitere Operationen auf Mengen:

| Methoden|Beschreibung |
|:----|:----|
| `menge.add(e)`  | Fügt das Element e in die Menge menge als neues Element ein  |
| `menge.clear()`   | Entfernt alle elemente aus der Menge menge   |
| `menge.discard(e)`  | Das Element e wird aus der Menge menge entfernt.   |
| `menge.copy()`  | (Flache) Kopie der Menge menge   |
| `menge.difference(andereMenge)`  | = `menge - andereMenge`   |
| `menge.intersection(andereMenge)`  | = `menge & andereMenge`   |
| `menge.union(andereMenge)`   | = `menge \| andereMenge`  |

##### Mengenabstraktion (*set comprehension*)

Vergleich von Listen- und Mengenabstraktion am Algorithmus "[Sieb des Eratosthenes](https://de.wikipedia.org/wiki/Sieb_des_Eratosthenes#/media/Datei:Animation_Sieb_des_Eratosthenes_%C3%9Cberarbeitet.gif)" zur Ermittlung der Primzahlen von $2$ bis $n$.

In [None]:
# Via list comprehension
from math import sqrt
n = 75
sqrt_n = int(sqrt(n))
no_primes = [j for i in range(2, sqrt_n) for j in range(i*2, n, i)]
print(no_primes)
primes = [i for i in range(2, n) if i not in no_primes]
print(primes)

In [None]:
# Via set comprehension
from math import sqrt
n = 75
sqrt_n = int(sqrt(n))
no_primes = {j for i in range(2, sqrt_n) for j in range(i*2, n, i)}
print(no_primes)
primes = {i for i in range(2, n) if i not in no_primes}
print(primes)

#### 4.4 Dictionary

Neben Listen sind *Dictionaries* eines der bedeutendsten Datenstrukturen in Python. Es handelt sich dabei um eine *ungeordnete Sammlung von Schlüssel-Wert-Paaren*. In den Programmiersprachen spricht man dann auch von einem *assoziativen Feld*. 

Die Schlüssel (*keys*) dürfen nur unveränderliche (*immutable*) Datentypen sein. Die Dictionaries selbst sind *mutable*.

Die wichtigsten Methoden für Operationen auf Dictionaries:

| Methoden|Beschreibung |
|:----|:----|
| `d.keys()`  | Gibt die Schlüssel der Dictionaries d zurück  |
| `d.values()`   | Gibt die Werte des Dictionaries d zurück   |
| `d.items()`  | Gibt eine Liste mit Tupeln zurück. Jedes Tupel enthält ein Schlüssel-Wert-Paar aus dem Dictionary d  |
| `d.has_key(k)`  | Überprüft, ob der Schlüssel k im Dictionary d enthalten ist   |
| `del d[k]`  | = Löscht das Schlüssel-Wert-Paar mit dem Schlüssel k aus dem Dictionary d  |
| `k in d`  | = Überprüft, ob k ein Schlüssel des Dictionarys d ist   |


In [None]:
# Beispiele zu Dictionaries
# In {}-Klammern wie Mengen, einzelne Paare durch "," getrennt, ":" unterscheidet dict von set
waehrungen = {"Deutschland" : "Euro", "Indien" : "Indische Rupie", 
              "Grossbritannien" : "Pfund Sterling", "Japan" : "Yen", 
              "Frankreich" : "Euro"}

# TODO Zugriff auf ein Element über Schlüssel 

# TODO "Ist Schlüssel in Dictionary?"

# TODO gib Schlüssel aus



# TODO gib Werte aus

# TODO gib Paare aus


- Dictionary aus Listen erzeugen: die `zip`-Funktion

Die `zip()`-Funktion kann auf eine beliebige Anzahl an iterierbaren Objekten angewendet werden und gibt ein zip-Objekt zurück, bei dem es sich um einen Tupel-Iterator handelt. Zuerst liefert sie ein Tupel mit den ersten Elementen der Eingabeobjekte, dann die zweiten, dritten und stoppt, sobald eines der iterierbaren Objekte aufgebraucht ist.

In [None]:
# Beispiel mit Zahlen und Buchstaben
einige_buchstaben = ["a", "b", "c", "d", "e", "f"]
einige_zahlen = [5, 3, 7, 9, 11, 2]
print(zip(einige_buchstaben, einige_zahlen))
print(type(zip(einige_buchstaben, einige_zahlen)))
for t in zip(einige_buchstaben, einige_zahlen):
    print(t)



In [None]:
# Beispiel für unterschiedlich lange Eingabeobjekte
ort = ["Helgoland", "Kiel", "Berlin-Tegel"]
luftdruck = (1021.2, 1019.9, 1023.7, 1023.1, 1027.7)
for ort, ld in zip(ort, luftdruck):
    print(f"Der Luftdruck in {ort} beträgt: {ld:7.1f}")

In [None]:
# TODO Dictionary aus Listen, Beispiel Währungen
l = ["Deutschland", "Indien", "Großbritannien", "Japan", "Frankreich"]
w = [ "Euro", "Indische Rupie","Pfund Sterling", "Yen", "Euro" ]
