# Dictionary

## Voraussetzungen
Diese Einheit setzt voraus, dass Sie folgende Inhalte kennen: 
- Variablen
- Ein- und Ausgabe
- primitive Datentypen
- bedingte Anweisungen
- for-Schleife
- Listen
- Tupel
- Einlesen von Daten


## Motivation
Man kann ein Dictionary als Alternative zur Liste oder als Alternative zu einem Tupel motivieren.  In diesem Notebook werden beide Perspektiven beleuchtet. Die dabei zur Anwendung kommenden Methoden und Funktionen sind im Wesentlichen die gleichen. Allerdings ist die Anwendung durch den Wechsel der Perspektive möglicherweise unterschiedlich. Zuerst wird das Dictionary als Alternative zu einer Liste motiviert und dargestellt, im zweiten Teil dann umgekehrt als Alternative zu einem Tupel.

## Dictionary als Alternative zur Liste
Im folgenden Programm wird eine Datei von Studierenden aus einer Datei in eine Liste von Tupeln eingelesen.

In [None]:
list_of_students = []
datei = open("Data/studenten.csv", "r")
for zeile in datei:
    zeile = zeile.strip()
    zeile = zeile.split(",")
    zeile = tuple(zeile)
    list_of_students.append(zeile)
datei.close()

for student in list_of_students:
    print(student)

Wie in der Ausgabe zu sehen ist, besteht jeder Studierende aus Matrikelnummer, Name, Vorname, E-Mail und Studiengang. Wo liegt das Problem?

Jeder Studierende ist ein Element der Liste `list_of_students` und nur über den Index ansprechbar. Das heißt, wenn man einen Studierenden verändern, löschen, ... möchte, muss man erst Tupel für Tupel durch die Liste gehen, bis man den richtigen Studierenden gefunden hat. Jeder Studierende ist dabei über seine Matrikelnummer zu identifizieren. Die Matrikelnummer ist ein guter **Schlüssel**, um auf einen Studierenden zuzugreifen, da jede Matrikelnummer eindeutig einem Studierenden zuzuordnen ist. Wünschenswert wäre es, wenn man **nicht** über den Index sondern eben direkt über die Matrikelnummer auf den Studierenden zugreifen könnte. Genau das ermöglicht ein Dictionary!

## Dictionaries
Ein Dictionary besteht aus sogenannten Schlüssel-Wert-Paaren (Key-Value-Pairs). Dictionaries werden mit Hilfe von geschweiften Klammern `{ }`  dargestellt. In den Klammern stehen die einzelnen Key-Value-Pairs durch Kommata getrennt. Jedes Key-Value-Paar wird dabei wie folgt dargestellt: `key : value`. Ein Dictionary sieht daher wie folgt aus: `{key1 : value1, key2 : value2, ... keyN : valueN}`. SIehe folgends Beispiel:

In [None]:
stud = {123 : "Hans", 234 : "Helga", 345 : "Hugo", 456 : "Hannah" }
print(stud)

### Zugriff auf ein Element des Dictionaries mit dem Schlüssel
Möchte man auf einzelne Werte zugreifen, werden genau wie bei Listen und Tupeln **eckige** Klammern verwendet. Statt des Index wird aber der **key** eingegeben.

In [None]:
print(stud[123])
print(stud[234])

### Zugriff über den Index funktioniert nicht - es gibt kein Index
Ein Zugriff über den "normalen" Index funktioniert dagegen nicht mehr. Wenn auf einen Schlüssel zugegriffen wird, der nicht existiert, gibt es eine Fehlermeldung:

In [None]:
stud[0]

### Schlüssel-Wert-Paare einem Dicitionary hinzufügen
Ein neues Schlüssel Wertpaar kann ganz einfach zu einem Dictionary hinzugefügt werden. `dictionary[Schlüssel] = Wert`. Im folgenden Beispiel werden unserer Studierenden-Datei weitere Studierende hinzugefügt.

In [None]:
stud[567] = "Peter"
stud[678] = "Paula"
print(stud)

### Der Wert zu einem vorhandenen Schlüssel kann verändert werden
Falls ein Schlüssel bei einer Zuweisung zu einem Dictionary schon vorhanden ist, wird der bestehende Wert durch den neuen Wert überschrieben.

In [None]:
stud[567] = "Ralf"
stud[678] = "Ronja"
print(stud)

### Der Schlüssel in einem Dictionary ist unveränderlich
Im Gegensatz zu den Werten, die verändert werden können, sind die Schlüssel *unveränderlich*. Daher darf eine Liste auch kein Schlüssel sein, ein Tupel hingegen schon. (Vergleichen Sie hierzu nochmal das Kapitel *Tupel* und die Erklärung zur Unveränderlichkeit von Schlüsseln.) Einfache Variablen und Tupel können ein Schlüssel sein, Listen können dies nicht.

In [None]:
dict1 = {(123, "Hans", "Meier") : "BWL", (234, "Helga", "Müller") : "Info"}
dict1

In [None]:
dict1 = {[123, "Hans", "Meier"] : "BWL", [234, "Helga", "Müller"] : "Info"}
dict1

## Aufgabe 1 - Telefonbuch
In einem Telefonbuch gibt es immer eine Zuordnung von Telefonnummer (Wert) zu einem Namen (Schlüssel). In einem Telefonbuch wird die Eindeutigkeit eines Schlüssels nicht garantiert, es gibt in der Regel mehrere "Peter Müller" mit jeweils unterschiedlichen Telefonnummer. Wir gehen in unserer Aufgabe von einem eindeutigen Namen aus. Erstellen Sie ein Telefonbuch als Dictionary mit Hilfe eine Schleife, die in jedem Durchgang ein Schlüssel-Wert-Paar (Name-Telefonnr) erzeut und diese zum Schluss ausgibt.

### Mit `in` den Zugriff auf das Dictionary absichern
Wie oben gesehen, kann es bei einem Zugriff auf ein Dictionary zu einem Fehler kommen, wenn der Schlüssel nicht existiert. Mit Hilfe des Schlüsselworts `in` kann dies verhindert werden. `key in dict` gibt den Wert `True` zurück, wenn der Schlüssel im Dictionary vorhanden ist, `False` sonst. Auf diese Weise kann man mit einem `if` den Fehler abfangen.

In [None]:
matrnr = int(input("Bitte Matrikelnummer eingeben: "))
if matrnr in stud:
    print("Der gesuchte Studierende ist: ", stud[matrnr])
else:
    print("Ein Studierender mit der MatrNr ist nicht vorhanden")

### Ein Dictionary voller Tupel
Genauso wie Listen mit Tupeln kombiniert werden können, können auch Dictionaries mit Tupeln kombiniert werden. Eine häufig Kombination ist, dass mit Hilfe eines Schlüssels auf ein Tupel zugegriffen werden kann.

Im folgenden Beispiel wird aus der Studierenden-Datei ein Dictionary gebaut, in dem die Matrikelnummer der Schlüssel ist und der Rest der Informationen in einem Tupel zusammengefasst wird. Der Zugriff auf einzelne Elemente wird wie im letzten Beispiel ermöglicht.

In [None]:
dict_of_students = {}
datei = open("Data/studenten.csv", "r")
for s in datei:
    s = s.strip()
    s = s.split(",")
    key = s[0]
    values = tuple(s[1:])
    dict_of_students[key] = values
datei.close()

matrnr = input("Bitte Matrikelnummer eingeben: ")
if matrnr in dict_of_students:
    print(dict_of_students[matrnr])
else:
    print(matrnr, " nicht vorhanden")

### Mit einer `for`- Schleife über einen Dictionary iterieren
Genau wie über eine Liste und über ein Tupel kann man mit der `for`-Schleife auch über ein Dictionary iterieren. Die Syntax sieht dafür wie folgt aus:

In [None]:
for matrnr in dict_of_students:
    print(matrnr, ": ", dict_of_students[matrnr])

Alternativ kann auch folgende Syntax verwendet werden:
```Python
for key, value in dict.items():
   print(key)
   print(values)```
   
Diese Variante der `for`-Schleife hat den Vorteil, dass auf die einzelnen Werte auch *ohne* Angabe des jeweiligen Keys zugegriffen werden kann. Dafür ist dann eben die etwas geänderte Syntax sowie die Verwendung der Method `.items()` notwendig.

In [None]:
for matrnr, students in dict_of_students.items():
    print(students)

### Mit Hilfe von `del()` einen Wert aus einem Dictionary löschen
Mit Hilfe der Funktion `del()` kann ein Wert aus einem Dictionary gelöscht werden. Dazu wird einfach einfach der Funktion das Dictionary mit dem Verweis auf den entsprechenden Schlüssel als Argument übergeben.

In [None]:
print(stud)
matrnr = int(input("Bitte Matrikelnummer eingeben: "))

if matrnr in stud:
    del(stud[matrnr])

print(stud)

### Funktionen und Methoden mit Dictionaries
- die Funktion `len()` gibt die Anzahl von Schlüssel-Wert-Paaren eines Dictionaries zurück.
- die Methode `.keys()` liefert alle Schlüssel eines Dictionaries. Der Datentyp der Ausgabe ist `dict_keys`, mit Hilfe der Funktion `list()` kann dieser in eine Liste umgewandelt werden (→ ausprobieren)
- die Methode `.values()` liefert alle Werte eines Dictionaries
- die Methode `.items()` gibt alle Paare als Tupel zurück

In [None]:
len(stud)

In [None]:
print(stud.keys())

In [None]:
print(stud.values())

In [None]:
print(stud.items())

### Mit Hilfe der Funktion `zip()` aus Listen ein Dictionary erzeugen
Genau wie es die Casting-Funktionen `list()` und `tuple()` gibt, gibt es auch ein entsprechende Funktion `dict()`. Allerdings gibt es eine Fehlermeldung, wenn man eine einfache Liste oder ein Tupel entsprechend umwandeln möchte.

In [None]:
dict([1,2,3,4,5,6])

Die Umwandlung einer Liste von Tupeln ist dagegen möglich. Das erste Element wird dann jeweils als Schlüssel, das zweite als Wert übernommen. (Kontrollieren Sie selber, was passiert, wenn mehr als zwei Elemente im Tupel vorhanden sind.)

In [None]:
l_of_t = [("A", 1), ("B", 3), ("C", 5)]
dict(l_of_t)

Es gibt die Möglichkeit, zwei Listen mit Hilfe der Funktion `zip()` zusammenzufügen und das Ergebnis durch `dict()` in ein Dictionary umzuwandeln. (Versuchen Sie selber, was passiert, wenn die beiden Listen nicht die gleiche Länge haben.)

In [None]:
l1 = ["A", "B", "C"]
l2 = [1, 2, 3]
dict(zip(l1, l2))

## Aufgabe 2 - Häufigkeit von Worten zählen
In einer der vorherigen Aufgaben wurde die Anzahl von Buchstaben in dem Text "alice.txt" gezählt. Im Folgenden soll die Häufigkeit von Worten gezählt werden. Die Datei "alice_clean.txt" enthält eine *gesäuberte* Version des Textes. D.h. alle Buchstaben sind Kleinbuchstaben, alle Sonderzeichen (abgesehen von dem Leerzeichen) sind gelöscht.
Erstellen Sie eine Programm, dass die Häufigkeit jedes Wortes im Text zählt. Ein Wort steht dabei jeweils zwischen zwei Leerzeichen. Erzeugen Sie zuerst ein leeres Dictionary. Laden Sie dann die Datei "alice_clean.txt" und schreiben Sie den Text in eine Variable. Gehen Sie dann Wort für Wort durch den Text. Falls das Wort im Dictionary noch nicht vorhanden ist, fügen Sie ein Schlüssel-Wert-Paar *Wort : 1* hinzu. Das Wort kommt bis jetzt einmal vor. Falls das Wort als Schlüssel schon vorhanden ist, erhöhen Sie den Wert des Schlüssels um eins. Zum Schluss geben Sie die 20 häufigsten Worte aus. (Wer möchte, versucht gerne mit dem Originaltext (Sonderzeichen, Groß-Klein-Schreibung, ... zu beginnen.)

## Dictionary als Alternative zum Tupel
Ein Nachteil von Tupeln ist, dass man wissen muss, an welcher Position sich ein Wert befindet. Wenn ein Wert nicht vorhanden ist (z.B. ist die E-Mail eines Studierenden nicht bekannt), muss statt dessen ein leerer Wert eingegeben werden. Dieses Vorgehen wird insbesondere dann unpraktisch, wenn die Tupel z.B. sehr groß sind, wenn Sie viele leere Werte enthalten oder wenn nicht klar ist, welche Wert überhaupt in Frage kommen.

Nehmen Sie nochmal das Beispiel der Studierenden: Es gibt nur vier Werte im Tupel, alle Werte sind bekannt, mit einem Tupel zu arbeiten ist kein Problem.

In [None]:
dict_of_students = {}
datei = open("Data/studenten.csv", "r")
for s in datei:
    s = s.strip()
    s = s.split(",")
    key = s[0]
    values = tuple(s[1:])
    dict_of_students[key] = values
datei.close()

for student in dict_of_students:
    print(student, dict_of_students[student])

Stellen Sie sich vor, in diese Tupel sollten zusätzlich die Modulnoten der Studierenden eingetragen werden. Man könnte dann weitere Felder im Tupel hinzufügen: Note für BWL, Note für VWL, Note für WPR, ... Welche Problem ergäben sich?

- Das Tupel würde sehr groß, gerade wenn man an die verschiedenen Vertiefungsmodule denkt.
- Jeder Studierende hat unterschiedliche Module geschrieben, andere nicht. die Verteilung der leeren Werte wäre sehr  unterschiedlich.
- Eine neues Modul wird hinzugefügt, dann müsste direkt das Tupel angepasst werden. Solche Änderungen an Datenstrukturen versucht man zu vermeiden.
- Insgesamt geht die Übersichtlichkeit verloren.

Wenn man statt des Tupels ein Dictionary verwendet, lösen sich die Probleme (zum Teil) auf. Obige Werte zur Person würden durch entsprechende Schlüssel-Wert-Paare ersetzt, z.B. `"Name" : "Meier", "Vorname" : "Peter", ...`. Die Prüfungen könnten durch weitere Schlüssel-Wert-Paare ergänzt werden: `"BWL" : 2.0, "VWL" : 2.3, "WPR" : 3.7, ...`.

- leere Werte müssten nicht weiter hinzugefügt werden
- Dictionaries sind (im Gegensatz zu Tupeln) veränderlich, d.h. man könnte weitere Prüfungen hinzufügen
- jede Note (Wert) ist immer mit dem Modulnamen (Schlüssel) verbunden.

In [None]:
stud1 = {"MatrNr" : 12345, "Name" : "Meier", "Vname" : "Peter", \
                    "BWL" : 3.0, "WPR" : 2.3}
stud2 = {"MatrNr" : 23456, "Name" : "Schmitz", "Vname" : "Hanne", \
                    "WiMa" : 1.0, "VWL" : 2.0, "Python" : 1.7}
print(stud1)
print(stud2)

Natürlich könnte man die einzelnen Studenten (also die einzelnen Dictionaries) auch wieder in eine Liste stecken:

In [None]:
list_of_students = [stud1, stud2]
for s in list_of_students:
    print(s)

### Ein Dictionary kann verändert werden
Wenn weitere Prüfungen bestanden wurden oder eine Note geändert werden sollte, können die Dictionaries einfach angepasst werden:

In [None]:
# Korrektur der Note
stud1["BWL"] = 2.7
# Weitere Prüfung bestanden
stud2["Makro"] = 2.0
print(stud1)
print(stud2)

### Dicitionary von Dictionaries
Bis jetzt hatten wir Dictionaries von Tupeln und Listen von Dictionaries. Natürlich kann man auch beides verbinden und Dictionaries von Dictionaries bauen. Beispielsweise kann man weiterhin die Matrikelnummer eines Studierenden als Schlüssel für seine Daten nutzen und die Daten stecken dann eben in einem Dictionary.

In [None]:
dos = {}
stud1 = {"Name" : "Meier", "Vname" : "Peter", \
                    "BWL" : 3.0, "WPR" : 2.3}
dos[12345] = stud1
stud2 = {"Name" : "Schmitz", "Vname" : "Hanne", \
                    "WiMa" : 1.0, "VWL" : 2.0, "Python" : 1.7}
dos[23456] = stud2

print(dos)

## Typische Anwendungen von Dictionaries
Dictionaries kann man überall dann verwenden, wenn geeignete Schlüsselpaare vorliegen. Beispiele hierfür wären:
- Matrikelnummer und Student
- Prüfungsnummer und Modulname
- Kfz-Nummer und Auto
- Zeitstempel und Messwert
- Begriff und Lexikoneintrag
- ...

Die Liste lässt sich leicht fortsetzen. Für den Schlüssel gibt es die folgenden typischen Einschränkungen:
- ein Schlüssel muss eindeutig sein. Wenn Sie zwei Autos mit dem gleichen Kfz-Zeichen haben, können Sie die Wagen eben nicht eindeutig über das Zeichen identifizieren. Wenn mehrere Personen über die gleiche Telefonnummer zu erreichen sind, ist die TelNr möglicherweise ein schlechter Schlüssel. Namen sind häufig nicht eindeutig und daher als Schlüssel kritisch. Manchmal fügt man dann Zahlen an z.B. *Peter1, Peter2, Peter3, ...*, um die Eindeutigkeit herzustellen.
- ein Schlüssel sollte nicht verändert werden. Als Studierender bleibt ihre Matrikelnummer immer die gleiche. Ein Auto erhält z.B. bei einem Umzug oder bei einem Verkauf eine neue Nummer. Dadurch entstehen Schwierigkeiten, Autos eindeutig zu identifizieren.
- ein Schlüssel sollte immer vorhanden sein. Man kann in einem Programm Studierende erst speichern, wenn Sie eine Matrikelnummer haben. Wenn es viele Kandidaten gibt, für die kein Schlüssel vorhanden ist, sollte man einen anderen Schlüssel wählen oder überlegen, ob ein Dictionary die geeignete Datenstruktur ist.

### Übersetzungslexikon
Eine typische Anwendung für ein Dictionary ist ein (einfaches) Lexikon. Jedem deutschen Begriff (Schlüssel) wird der englische Begriffe als Wert zugeordnet. Anschließend kann über das Dictionary und den deutschen Suchbegriff schell auf die englische Übersetzung zugegriffen werden.

In [None]:
de_en = {"rot" : "red", "blau" : "blue", "grün" : "green", "weiß" : "white"}
farbe = input("Welche Farbe soll übersetzt werden?")
if farbe in de_en:
    print(farbe, "heißt auf Englisch", de_en[farbe])
else:
    print("Hier fehlt eine Übersetzung")

## Aufgabe 3 - Piratensprache
Gegeben ist die untenstehen Übersetzungstabelle von englischen Begriffen in die Piratensprache. Schreibe Sie ein Programm, dass vom Benutzer als Eingabe einen Satz in englischer Sprache erwartet. Die Ausgabe soll die Übersetzung des Satz in die Piratensprache sein.

| Englisch | Piratensprache |
|----------|----------------|
|sir|matey|
|hotel|fleabag inn|
|student|swabbie|
|boy|matey|
|madam|proud beauty|
|professor|foul blaggart|
|restaurant|galley|
|your|yer|
|excuse|arr|
|students|swabbies|
|are|be|
|lawyer|foul blaggart|
|the|th’|
|restroom|head|
|my|me|
|hello|avast|
|is|be|
|man|matey|