## Dictionaries
Mit dem <code>dict</code> Datentyp für "Dictionaries" ("Wörterbücher", Verzeichnis) können wir allgemeine Zuordnungen abspeichern. Ein klassisches Beispiel ist ein Telefonbuch:
  <table style="font-size: 1em">
    <tr><td>Dominik Göddeke</td><td>62022</td></tr>
    <tr><td>Hans Peter</td><td>123456</td></tr>
    <tr><td>Gertraud Maier</td><td>654321</td></tr>
  </table>
  
Hierbei nennen wir die Einträge in der ersten Spalte **Schlüssel (keys)**, und die Einträge der zweiten Spalte die **Werte (values)**, abgespeichert werden also **key-value Paare.**

Das Anlegen eines leeren Dictionaries ist durch geschweifte Klammern oder den <code>dict()</code> Befehl möglich:


In [1]:
# Ein leeres Dictionary anlegen:
empty_dictionary = {}
print("type(empty_dictionary):", type(empty_dictionary))
print(empty_dictionary)

another_empty_dictionary = dict()
print("type(another_empty_dictionary):", type(another_empty_dictionary))


type(empty_dictionary): <class 'dict'>
{}
type(another_empty_dictionary): <class 'dict'>


Ein vorinitialisierter Dictionary wird erzeugt, indem Paare aus Schlüssel und Wert aufgelistet werden. Das Trennsymbol zwischen Schlüssel und Wert ist der Doppelpunkt, und Paare werden durch Kommata getrennt:

In [2]:
translations = {'house': 'Haus', 'cat': 'Katze', 'dog': 'Hund'}
# Hier sind die Schlüssel (keys) 'house', 'cat' und 'dog'
# Die Werte (values) sind 'Haus', 'Katze und 'Hund'
print(translations)

{'house': 'Haus', 'cat': 'Katze', 'dog': 'Hund'}


Auf die einzelnen Elemente kann wie folgt mit Hilfe der Schlüssel (keys) zugegriffen werden:

In [3]:
translations = {'house': 'Haus', 'cat': 'Katze', 'dog': 'Hund'}
print(translations['house'])
print(translations['cat'])

Haus
Katze


Die Datentypen für die Schlüssel und die Werte können sich beliebig unterscheiden:

In [4]:
my_dictionary = {'house': 'Haus',  # Zeilenumbrüche sind nach jedem Paar erlaubt
                 5: 'fünf',
                 'vier': 4}
# Die Indizierung erfolgt wie immer über die Schlüssel:
print(my_dictionary[5])
print(my_dictionary['vier'])

fünf
4


In [5]:
# Das einleitende Beispiel wird wie folgt implementiert:
phonebook = {
    'Dominik Göddeke': 62022,
    'Hans Peter': 123456,
    'Gertraud Maier': 654321
}
print(phonebook['Hans Peter'])

123456


### Wichtige Funktionen für <code>dict</code>

Die folgenden Beispiele stellen die wichtigsten Operationen für Dictionaries vor:

In [6]:
# Anlegen eines Dictionaries (in diesem Fall für die Einwohnerzahlen versch. Städte in Deutschland):
einwohner = {'Berlin': 3685265, 'Köln': 1024621, 'Leipzig': 611850, 'Bremen': 586271, 'Bochum': 358676, 'Bonn': 323336, 'Freiburg': 237460,
             'Mainz': 224684, 'Kassel': 197230, 'Heidelberg': 155756}

# Der Operator "in" prüft, ob der Eintrag innerhalb der Keys des 
# dictionaries vorkommt:
print('Bochum' in einwohner)
print('Hamburg' in einwohner)

# Zählen der Einträge im Dictionary:
print("len(dictionary) =", len(einwohner))

True
False
len(dictionary) = 10


In [7]:
# Liste aller Keys und aller Values:
keys = list(einwohner.keys())
print(keys)

values = list(einwohner.values())
print(values)

['Berlin', 'Köln', 'Leipzig', 'Bremen', 'Bochum', 'Bonn', 'Freiburg', 'Mainz', 'Kassel', 'Heidelberg']
[3685265, 1024621, 611850, 586271, 358676, 323336, 237460, 224684, 197230, 155756]


In [8]:
# Zugriff auf ein Element, welches nicht existiert:
einwohner['Hamburg']

KeyError: 'Hamburg'

In [9]:
# Ebenso muss auf Groß- und Kleinschreibung der keys geachtet werden:
einwohner['berlin']

KeyError: 'berlin'

Um einen Eintrag im dictionary einwohner hinzuzufügen, können Sie die Variable einwohner['...'] definieren. Der Eintrag wird dann ans Ende des dictionarys angehängt.

In [10]:
einwohner['Hamburg'] = 1862565
print(einwohner)

{'Berlin': 3685265, 'Köln': 1024621, 'Leipzig': 611850, 'Bremen': 586271, 'Bochum': 358676, 'Bonn': 323336, 'Freiburg': 237460, 'Mainz': 224684, 'Kassel': 197230, 'Heidelberg': 155756, 'Hamburg': 1862565}


Um die Städte im dictionary alphabetisch zu sortieren kann der Befehl sorted verwendet werden. Mit der zusätzlichen Option reverse=True kann das dictionary rückwärts alphabetisch sortiert werden.

In [11]:
#sorted gibt die keys in alphabetischer Reihenfolge zurück
print(sorted(einwohner))
print(sorted(einwohner, reverse=True))

# um daraus ein dict zu erstellen kann folgender befehl verwendet werden:
sort1 = dict(sorted(einwohner.items()))
print(sort1)

# eine andere möglichkeit ist:
sort2 = {stadt: einwohner[stadt] for stadt in sorted(einwohner)}
print(sort2)

['Berlin', 'Bochum', 'Bonn', 'Bremen', 'Freiburg', 'Hamburg', 'Heidelberg', 'Kassel', 'Köln', 'Leipzig', 'Mainz']
['Mainz', 'Leipzig', 'Köln', 'Kassel', 'Heidelberg', 'Hamburg', 'Freiburg', 'Bremen', 'Bonn', 'Bochum', 'Berlin']
{'Berlin': 3685265, 'Bochum': 358676, 'Bonn': 323336, 'Bremen': 586271, 'Freiburg': 237460, 'Hamburg': 1862565, 'Heidelberg': 155756, 'Kassel': 197230, 'Köln': 1024621, 'Leipzig': 611850, 'Mainz': 224684}
{'Berlin': 3685265, 'Bochum': 358676, 'Bonn': 323336, 'Bremen': 586271, 'Freiburg': 237460, 'Hamburg': 1862565, 'Heidelberg': 155756, 'Kassel': 197230, 'Köln': 1024621, 'Leipzig': 611850, 'Mainz': 224684}


Das dictionary nach Einwohnerzahlen zu sortieren ist etwas komplizierter. Eine Möglichkeit hierfür ist es, ein umgedrehtes dictionary zu erstellen, welches für jede Einwohnerzahl als key die zugehörige Stadt als value hat.

In [12]:
einwohner_reversed = {n: city for city, n in einwohner.items()}
print(einwohner_reversed)

{3685265: 'Berlin', 1024621: 'Köln', 611850: 'Leipzig', 586271: 'Bremen', 358676: 'Bochum', 323336: 'Bonn', 237460: 'Freiburg', 224684: 'Mainz', 197230: 'Kassel', 155756: 'Heidelberg', 1862565: 'Hamburg'}


Um das dictionary zu sortieren kann wieder die Funktion `sorted()` verwendet werden. Dieses (aufsteigend) nach Einwohnerzahlen sortierte dictionary kann dann wieder in ein dictionary umgewandelt werden, welches zu jeder Stadt die passende Einwohnerzahl enthält.

In [13]:
einwohner_reversed = dict(sorted(einwohner_reversed.items()))
sort3 = {city: n for n, city in einwohner_reversed.items()}
print(sort3)

{'Heidelberg': 155756, 'Kassel': 197230, 'Mainz': 224684, 'Freiburg': 237460, 'Bonn': 323336, 'Bochum': 358676, 'Bremen': 586271, 'Leipzig': 611850, 'Köln': 1024621, 'Hamburg': 1862565, 'Berlin': 3685265}


Eine weitere Möglichkeit ein dictionary nach values zu sortieren finden Sie in der folgenden Codezeile. Hier wird der Funktion `sorted()` mitgegeben, nach welchem Kriterium die `items()` von `einwohner` sortiert werden sollen.  

In [14]:
sort4 = dict(sorted(einwohner.items(), key=lambda item: item[1]))
print(sort4)

{'Heidelberg': 155756, 'Kassel': 197230, 'Mainz': 224684, 'Freiburg': 237460, 'Bonn': 323336, 'Bochum': 358676, 'Bremen': 586271, 'Leipzig': 611850, 'Köln': 1024621, 'Hamburg': 1862565, 'Berlin': 3685265}


### Beispiele und Anwendungsmöglichkeiten von Dictionaries

Für statistische Auswertungen werden häufig Histogramme benötigt, d.h. wir zählen wie oft ein bestimmtes Element in einem Datensatz vorkommt. Der folgende Code nimmt einen beliebigen Text als Input und zählt wie oft jedes Zeichen im Text vorkommt.

In [15]:
random_text = "Attention he extremity unwilling on otherwise. Conviction up partiality as delightful is discovered. Yet jennings resolved disposed exertion you off. Left did fond drew fat head poor. So if he into shot half many long. China fully him every fat was world grave. May musical arrival beloved luckily adapted him. Shyness mention married son she his started now. Rose if as past near were. To graceful he elegance oh moderate attended entrance pleasure. Vulgar saw fat sudden edward way played either. Thoughts smallest at or peculiar relation breeding produced an. At depart spirit on stairs. She the either are wisdom praise things she before. Be mother itself vanity favour do me of. Begin sex was power joy after had walls miles."

# Erstellen eines Histogramms, welches Zeichen wie oft vorkommt
counts = {}
for c in random_text: # Iteriert durch die einzelnen Textzeichen des Texts
    
    # Falls c noch nicht als Key in counts abgelegt ist,
    # initialisiere counts[c] als 0.
    if c not in counts:
        counts[c] = 0

    # zähle...
    counts[c] += 1

print(counts)


{'A': 2, 't': 43, 'e': 78, 'n': 34, 'i': 43, 'o': 40, ' ': 120, 'h': 25, 'x': 3, 'r': 41, 'm': 13, 'y': 13, 'u': 15, 'w': 14, 'l': 29, 'g': 12, 's': 38, '.': 16, 'C': 2, 'v': 9, 'c': 9, 'p': 14, 'a': 49, 'd': 32, 'f': 18, 'Y': 1, 'j': 2, 'L': 1, 'S': 3, 'M': 1, 'b': 3, 'k': 1, 'R': 1, 'T': 2, 'V': 1, 'B': 2}


## Mini-Aufgaben zur Überprüfung des Verständnis: Dictionaries

### 1. Dictionary erstellen und sortieren

Erstellen Sie aus der folgenden Liste ein Dictionary, ausgehend von einem leeren Dictionary. Hierbei ist der erste Wert im Tupel stets der Schlüssel und der zweite Wert der zugehörige Wert für das Dictionary. Die Lösung ist auf viele verschiedene Arten möglich.

Hinweis: Die beiden Elemente eines Zweiertupels erhalten Sie mit [0] und [1].

In [17]:
my_list = [('Hans', 23), ('Petra', 42), ('Georg', 91), ('Klaus', 12), ('Lea', 44)]

# Lösung
my_dict = {name: age for name, age in my_list}
print(my_dict)

{'Hans': 23, 'Petra': 42, 'Georg': 91, 'Klaus': 12, 'Lea': 44}


Überprüfen Sie mit einem passenden Befehl, ob das Dictionary alle Einträge enthält. Fügen Sie dann sich selbst dem Dictionary hinzu, und löschen Sie dafür den Eintrag von Petra.

In [20]:
# Lösung
for name, age in my_list:
    assert name in my_dict.keys(), f'{name} fehlt im dictionary'
    assert my_dict[name] == age, f'Alter von {name} ist {my_dict[name]} statt {age}'

my_dict['Max'] = 26
del my_dict['Petra']

print(my_dict)


{'Hans': 23, 'Georg': 91, 'Klaus': 12, 'Lea': 44, 'Max': 26}


Sortieren Sie nun das dictionary nach den Werten. Die Werte sollen dabei in absteigendern Reihenfolge sein, also `{Georg: 91, Lea: 44, …}`

In [21]:
# Lösung

my_dict_sorted = dict(sorted(my_dict.items(), key=lambda item: item[1], reverse=True))
print(my_dict_sorted) 

{'Georg': 91, 'Lea': 44, 'Max': 26, 'Hans': 23, 'Klaus': 12}


### 2. Dictionary erstellen, Werte zählen, Durchschnitt berechnen

Die Klausur zur Veranstaltung "Angewandte Textilwissenschaften 4" ist folgendermaßen ausgefallen:
* 1.0: Felix Faden, Sarah Spindel
* 1.7: Frederik Flicken
* 2.0: Stefanie Schiffchen
* 2.3: Nadine Nähkästchen, Willi Wolle
* 3.7: Zidane Zwirn
* 4.0: Willhelm Webstuhl
* 5.0: Simon Straßenkehrer, Max Müllmann, Fritz Fleischer, Klara Kellnerin

Legen Sie diesen Notenspiegel in einem geeigneten Dictionary ab, wobei den Noten die Rolle der Keys zukommt. Erstellen Sie dann ein Histogramm des Notenspiegels, in einem zweiten Dictionary. Ermitteln Sie schließlich die Durchschnittsnote, nur mit Hilfe von Befehlen die von den beiden Dictionaries zur Verfügung gestellt werden.

In [25]:
# Lösung

dict1 = {1.0: ['Felix Faden', 'Sarah Spindel'], 1.7: ['Frederik Flicken'], 2.0: ['Stefanie Schiffchen'],
         2.3: ['Nadine Nähkästchen', 'Willi Wolle'], 3.7: ['Zidane Zwirn'], 4.0: ['Willhelm Webstuhl'], 
         5.0: ['Simon Straßenkehrer', 'Max Müllmann', 'Fritz Fleischer', 'Klara Kellnerin']}

dict2 = {note: len(studis) for note, studis in dict1.items()}
print(dict2)

durchschnitt = 0
for note, anzahl in dict2.items():
    durchschnitt += note*anzahl
durchschnitt = durchschnitt/sum(dict2.values())
print(durchschnitt)

{1.0: 2, 1.7: 1, 2.0: 1, 2.3: 2, 3.7: 1, 4.0: 1, 5.0: 4}
3.1666666666666665


### 3. Fortgeschrittenes Beispiel: ROT13 Verschlüsselung

Die ROT13 Verschlüsselung ist eine einfache kryptographische Methode. Jeder Buchstabe im zu verschlüsselnden Text wird unabhängig ersetzt durch den im Alphabet 13 Stellen später folgenden Buchstaben, wobei modulo 26, der Anzahl der Buchstaben im Alphabet, gerechnet wird. Da $26=13+13$ gilt, kann die Entschlüsselung mit genau demselben Verfahren erfolgen.

Bevor wir eine Dictionary Comprehension konstruieren, müssen wir einen kurzen Exkurs in die Repräsentation von Buchstaben im Computer unternehmen: In der standardisierten [ASCII-Tabelle](http://www.asciitable.com/) ist festgelegt, welcher Buchstabe welchem numerischen Wert entspricht. In unserem Beispiel betrachten wir nur Texte aus den Buchstaben 'a', 'b', ..., 'z', sie entsprechen den Zahlen 97,98,...,122. Mit dem Python-Befehl <code>chr()</code> (für "character") wird die Zahl in den zugehörigen Buchstaben umgewandelt. 

In [26]:
# Die gesamte Magie steckt im Prinzip in dieser Anweisung,
# die den Dictionary für die Verschlüsselung erzeugt. Es wird empfohlen,
# sehr genau nachzuvollziehen, was hier passiert, und wie viel aufwendiger
# es wäre, dies in Schleifenform zu programmieren:
rot13_dictionary = { chr(a+97): chr((a+13)%26 + 97) for a in range(0,26) }
print("rot13_dictionary =", rot13_dictionary)

# Als Beispiel verschlüsseln wir den folgenden Text:
string = "hallo"
# Wir benötigen einen "leeren" String, damit wir dessen join()-Methode aufrufen können,
# die wiederum aus einer Liste einen String durch Konkatenation generiert.
# Nach dieser technischen Hürde ist die Entschlüsselung eine einfache List Comprehension
# über die einzelnen Buchstaben des zu verschlüsselnden Textes
secret_string = "".join([rot13_dictionary[c] for c in string])
print(secret_string)

# Nochmaliges Anwenden entschlüsselt den Text wieder (wegen 13+13=26)
decrypted_string = "".join([rot13_dictionary[c] for c in secret_string])
print(decrypted_string)

rot13_dictionary = {'a': 'n', 'b': 'o', 'c': 'p', 'd': 'q', 'e': 'r', 'f': 's', 'g': 't', 'h': 'u', 'i': 'v', 'j': 'w', 'k': 'x', 'l': 'y', 'm': 'z', 'n': 'a', 'o': 'b', 'p': 'c', 'q': 'd', 'r': 'e', 's': 'f', 't': 'g', 'u': 'h', 'v': 'i', 'w': 'j', 'x': 'k', 'y': 'l', 'z': 'm'}
unyyb
hallo


### Aufgabe:

Erstellen Sie ein weiteres Dictionary, welches einen Text verschüsselt indem es einen Buchstaben durch den Buchstaben ersetzt, der 9 Stellen später im Alphabet steht. Erstellen Sie dann ein Dictionary, welches den verschlüsselten Text wieder entschlüsselt.

Zur Überprüfung: `hallo` wird in diesem Fall codiert als `qjuux`.

In [6]:
# Lösung
rot9_dictionary = { chr(a+97): chr((a+9)%26 + 97) for a in range(0,26) }

code = ''.join([rot9_dictionary[c] for c in 'hallo'])
print(code)

decode_rot9_dict = {chr(a+97): chr((a-9)%26+97) for a in range(0,26)}
decoded_code = ''.join([decode_rot9_dict[c] for c in code])
print(decoded_code)

qjuux
hallo
