# Dictionaries (Wörterbücher)<br> <img width=300 src="Images/Dictionary.svg" />

Dictionaries sind kombinierte Datentypen. Sie sind aber nicht sequentiell, sind mutabel und bilden Schlüssel auf Werte ab ("Mapping"). In anderen Sprachen sind sie als "assoziative Arrays" bekannt. Sie sind an einem {}- Klammerpaar zu erkennen. Ein Beispiel:

In [None]:
my_dict = {"a":1 ,5:2 ,False:"Ist falsch"}
# my_dict= {a:1 , b:2} #macht Fehler: NameError: name 'a' is not defined

print(my_dict["a"])
print(my_dict[5])
print(my_dict[False])


Zunächst sehen wir, wie man ein Dictionary formuliert. Die Einträge werden mit ```Schlüssel:Wert```-Paaren (```key:value```) in die {}-Klammern eingetragen und mit "," separiert. Möchte man einen Wert aus dem Wörterbuch auslesen, gibt man nach dem Namen des Dictionary in [ ] wie einen Index den Schlüssel ein. Genau dies ist es, was ein Wörterbuch ausmacht, statt wie bei Listen einen numerischen Index zu benutzen, muß man hier den Schlüssel verwenden. Es besteht also eine Assoziation zwischen Schlüssel und Wert. Es ist leicht ersichtlich, daß ein Schlüssel in einem Wörterbuch nur einmal vorkommen kann (welcher von mehreren Werten mit dem gleichen Schlüssel sollte sonst zurückgegeben werden?). Bezüglich der Werte ist man völlig frei. Das ganze ist also eine Einbahnstraße. Daß Wörterbücher nicht sequentiell sind, erkennt man daran, daß man nicht mit my_dict[2] den dritten Wert zurückgegeben bekommt. Statt dessen: "KeyError: 2". <b>Der key ```2``` wird also wie jeder andere key behandelt.

Bezüglich der Schlüssel gilt, daß diese nur immutable Werte haben können, nicht aber mutable Werte wie Listen. Warum ist das so? Würde man einen solchen Schlüssel während der Laufzeit verändern, würde die ganze Ordnung des Dictionary zusammenbrechen. Anders die Werte. Hier ist alles erlaubt, inklusive Listen oder sogar andere Wörterbücher. Beispiele:

In [None]:
d = {"a":[1,2,3], 4:{"A":5, "B":6}, (4,5,6): "Schlüssel ist Tupel, also erlaubt"}
print(f"Wert ist Wörterbuch! {d[4]}")
print(d[(4,5,6)])
# d = {1:"erster Wert" , [2]:"auch ein Wert"} #macht Fehler: TypeError: unhashable type: 'list'

Gibt es auch andere Möglichkeiten aus anderen kombinierten Datentypen Dictionaries zu erstellen? Denn diese jedesmal von Hand einzugeben,wäre ja sehr mühsam, oft hat man ja schon kombinierte Datentypen, die man gerne in ein Wörterbuch übernehmen will. Es gibt dazu mehrere Möglichkeiten. Wie für andere Typen wie z.B. Listen mit list() gibt es die Typumwandlungsfunktion auch für Wörterbücher mit dict(). Diese Funktion versucht aus den Parametern ein Dictionary zu machen, sofern das geht.

Als erstes nehmen wir eine Liste von Tupeln und versuchen das. Der erste Teil des Tupel ist immer der Schlüssel, der zweite der Wert. Nehmen wir an, wir hätten diese Liste von Tupeln, dann ist das Erstellen eines Dictionaries simpel. Wir werde Dictionaries ab jetzt als ```Dict``` abkürzen (aus Faulheit).

In [1]:
tup_liste=[
    ("a",2),
    (False,5),
    (2,[1,2,3]),
]


Eine kleine Nebenbemerkung: Dies ist die beste Art, kombinierte Datentypen einzugeben. Wir sehen sofort zeilenweise die einzelnen Elemente. Wollen wir eines von Hand löschen, können wir das einfach so, wir müsen uns nicht darum kümmern, ob das Element das letzte in der Aufzählung ist, denn <b>das Komma hinter dem letzten Element ist erlaubt.</b> Wenn wir ein Element einfügen wollen, geht das ebenfalls an jeder Stelle mit dem abschliessenden Komma.

In [2]:
my_dict = dict(tup_liste)
print(my_dict)


{'a': 2, False: 5, 2: [1, 2, 3]}


Mit pprint können wir uns das Dict in schönerer Form ausgeben lassen (nach import). Unten der Vergleich.

In [3]:
from pprint import pprint


personen = [
  {'Name': 'John', 'Age': '23', 'Country': 'USA'},
  {'Name': 'Jose', 'Age': '44', 'Country': 'Spain'},
  {'Name': 'Anne', 'Age': '29', 'Country': 'UK'},
  {'Name': 'Lee', 'Age': '35', 'Country': 'Japan'}
]
print(personen,"\n")
print(100*"_")
pprint(personen)

[{'Name': 'John', 'Age': '23', 'Country': 'USA'}, {'Name': 'Jose', 'Age': '44', 'Country': 'Spain'}, {'Name': 'Anne', 'Age': '29', 'Country': 'UK'}, {'Name': 'Lee', 'Age': '35', 'Country': 'Japan'}] 

____________________________________________________________________________________________________
[{'Age': '23', 'Country': 'USA', 'Name': 'John'},
 {'Age': '44', 'Country': 'Spain', 'Name': 'Jose'},
 {'Age': '29', 'Country': 'UK', 'Name': 'Anne'},
 {'Age': '35', 'Country': 'Japan', 'Name': 'Lee'}]


Nun werden wir aber selten eine solche Liste von Tupel haben. Häufiger ist es, daß wir eine Liste von Schlüsseln haben und eine passende Liste von Werten wie unten:

In [None]:
länder = [
    "Deutschland",
    "Spanien",
    "Italien",
    "Griechenland",
]
sprachen_in_english = [
    "German",
    "Spanish",
    "Italian",
    "Greek"
]

Um diese zu verknüpfen, hat Python die zip()(von Reißverschluss!) Funktion im Repertoire. Diese verknüpft mehrere kombinierte Datentypen zu Tupel mit jeweils dem in der Reihenfolge entsprechenden Element aus jedem der kombinierten Typen. Das Ergebnis ist ein zip-Objekt, was wir uns anschauen können, wenn wir es in eine Liste verwandeln. Wir können aber direkt über das zip-Objekt ohne weiteres eine Schleife laufen lassen. Erstaunlicherweise wird unten in der Schleife bei Zeile 11 nichts ausgdedruckt. Dies liegt daran, daß das zip-Objekt durch den print() in Zeile 5 verbraucht ist, es wird zum Ausdruck intern durchlaufen. Das zip-Objekt ist ein Beispiel eines ```Iterators```, der beim Durchlaufen jeweils das nächste Element zurückgibt. Nach einem Durchlauf sind solche Iteratoren erschöpft. Man muß sie erneuern, wie in Zeile 10, dann kann man sie wieder benutzen. Das Ganze geht auch mit mehreren (auch unterschiedlichen) kombinierten Datentypen.<br> Was, wenn die Länge der gezippten Datentypen nicht übereinstimmt?
Das zip-Objekt wird nur bis zur kleinsten Länge aller verwendeten Daten verarbeitet, alles andere verfällt.

In [None]:
a_list=[1,2,3,4]
b_list=["a","b","c","d"]
st="wert"
short_list=[1]
c=zip(a_list,b_list)
print(f"das zip_Objekt {c}")
print(f"Die Liste des zip-Objekts {list(c)}")
d = zip(a_list,st)
print(f"Zip-Objekt aus Liste und String {list(d)}")
# c=zip(a_list,b_list) #man muß das zip_Objekt erneuern
for element in c:
    print("->",element)
e = zip(a_list,b_list,st)#es geht auch mit vielen parallelen kombinierten Datentypen
print(f"Drei Kombitypen {list(e)}")
f = zip(b_list,short_list)
print(f"short_list hat nur 1 Element, deshalb nur ein Element in {list(f)}")

Damit haben wir nun genau die passenden Zutaten, um parallele Listen in ein Dict umzuwandeln.

In [None]:
pprint(dict(list(zip(länder,sprachen_in_english))))

## Aufgabe:<br>
Warum funktioniert das Programm unten nicht wie gewünscht? Was muß man ändern?

In [None]:
land_und_sprache = zip(länder,sprachen_in_english)
print(list(land_und_sprache))
land_und_sprache_liste = list(land_und_sprache)
print(land_und_sprache_liste) 
land_und_sprache_dict = dict(land_und_sprache_liste)
print(land_und_sprache_dict)

Wie kann man darüber hinaus mit Dicts arbeiten, sie verlängern, Elemente löschen...? Dafür gibt es Funktionen, die wir jetzt durchsprechen werden.

Erstellen eines leeren Dicts:

In [None]:
my_dict=dict()
#oder
my_dict1={}
print(type(my_dict1))

Einfügen von neuen Schlüssel:Werte Paaren:

In [None]:
my_dict["neuer Schlüssel"]="neuer Wert"
my_dict["weiterer Schlüssel"]="weiterer Wert"
print(my_dict)

Feststellen der Länge, prüfen ob <b>Schlüssel</b> im Dict vorkommt ```len(),in```:

In [None]:
print(len(my_dict))
print("neuer Schlüssel" in my_dict)
print("anderer Schlüssel" in my_dict)
print("anderer Schlüssel" not in my_dict)

Schlüssel:Werte Paar löschen,ganzes Dict leeren ```del,clear()```:

In [None]:
my_dict["neuer Schlüssel"]="neuer Wert"
my_dict["weiterer Schlüssel"]="weiterer Wert"
del my_dict["neuer Schlüssel"]
print(my_dict)
# del my_dict["bla"] #macht Fehler:KeyError: 'bla'
my_dict.clear()
print(my_dict)

## Aufgabe<br>
Unten finden Sie ein Dict für Morsecode. Wandeln Sie einen vom User eingegebenen Text in Morsecode um. Hinweis: Die Zeichen (oder den ganzen Text?) mit upper() in Großbuchstaben verwandeln. Zeichen, die nicht im Dict vorkommen, sollen unverändert ausgegeben werden.

In [None]:
morse = {
"A" : ".-", 
"B" : "-...", 
"C" : "-.-.", 
"D" : "-..", 
"E" : ".", 
"F" : "..-.", 
"G" : "--.", 
"H" : "....", 
"I" : "..", 
"J" : ".---", 
"K" : "-.-", 
"L" : ".-..", 
"M" : "--", 
"N" : "-.", 
"O" : "---", 
"P" : ".--.", 
"Q" : "--.-", 
"R" : ".-.", 
"S" : "...", 
"T" : "-", 
"U" : "..-", 
"V" : "...-", 
"W" : ".--", 
"X" : "-..-", 
"Y" : "-.--", 
"Z" : "--..", 
"0" : "-----", 
"1" : ".----", 
"2" : "..---", 
"3" : "...--", 
"4" : "....-", 
"5" : ".....", 
"6" : "-....", 
"7" : "--...", 
"8" : "---..", 
"9" : "----.", 
"." : ".-.-.-", 
"," : "--..--"
}

In [None]:












#LÖSUNG
text=input("Bitte Text eingeben:  ").upper()
res=""
for char in text:
    if char in morse.keys():
        res+=" "+morse[char]
    else:
        res+=char
print(res)

Bei Listen kennen wir die ```pop()``` Funktion. Diese gibt es auch für Dicts. Es wird bei Eingabe eines Schlüssels als Parameter von pop() der entsprechende Wert ausgegeben. Dann wird<b> das Schlüssel:Werte Paar gelöscht.</b> Bei einem falschen Schlüssel gibt es einen KeyError. ```popitem()``` gibt ein zufälliges Schlüssel:Werte Paar als Tupel aus und löscht es. Bei leerem Dict bekommt man natürlich einen Fehler.

In [None]:
a=morse.pop(",")
print(a)
pprint(morse)
print(100*"-")
b=morse.popitem()
print(b)
pprint(morse)

Oft will man den Wert eines Schlüssels aus dem Dict herauslesen, weiß aber nicht, ob der Schlüssel überhaupt existiert. Wenn man es einfach probiert, und der Schlüssel nicht existiert, gibt es einen KeyError. Man kann natürlich zuerst prüfen mit ```in```, ob es diesen Schlüssel gibt, und nur dann den Lesevorgang durchführen. Eleganter ist aber die ```get(Schlüssel,Standardrückgabewert)``` Funktion. Sie gibt den entsprechenden Wert zurück, falls der Schlüssel vorhanden ist. Existiert der Schlüssel nicht, gibt sie stattdessen None oder (falls vorhanden, zweiter Parameter fakultativ) den Standardwert zurück.

In [None]:
beispiel_dict={"a":1,"b":2,"c":3}
wert = beispiel_dict.get("c","nicht da")
print(f"Schlüssel c: {wert}")
wert1 = beispiel_dict.get("f","nicht da")
print(f"Schlüssel f: {wert1}")
print(f"Schlüssel f kein Standardwert: {beispiel_dict.get('f')}")

## Aufgabe (schwieriger) <br>
Legen Sie ein Dict an, in dem die Häufigkeit der in einem String vorkommenden Zeichen eingetragen wird. keys sind also die Zeichen, values die Anzahl des Vorkommens im String. Benutzen Sie get().
Der String lautet: "Hunde sind schlechte Verlierer!! Sie beißen einfach."

In [None]:

















#LÖSUNG
from pprint import pprint
s = "Hunde sind schlechte Verlierer!! Sie beißen einfach."
histogramm=dict()
for buchstabe in s:    
    histogramm[buchstabe] = histogramm.get(buchstabe,0)+1
pprint(histogramm)

Auch Dicts kann man mit copy() kopieren. Wie bei Listen ist es allerdings eine flache Kopie, wenn also <b>Werte intern geändert werden (z.B. der Wert ist eine Liste)</b> haben wir die gleichen Probleme wie bei Listen. Also muß man, wenn mutable Typen für die Werte vorkommen, und man wirklich zwei völlig unabhängige Dicts haben will, auch für Dicts nach import von copy ```copy.deepcopy``` verwenden.

In [None]:
hist2=histogramm.copy()
print(hist2)

An ein Dict kann man ein anderes Dict anhängen mit ```update(neuesDict)```. Dabei "gewinnt" bei gleichen Schlüsseln in den beiden Dicts der Schlüssel des angehängten Dicts und überschreibt den Wert des Original-Dicts. ```bike``` wird hier überschrieben.

In [None]:
w={"car":"Auto","bike":"Fahrrad","boat":"Boot"}
w1 = {"plane":"Flugzeug","bike":"Motorrad"}
w.update(w1)
print(w)

Dicts kann man mit Schleifen durchfahren, man kann über sie iterieren. Was wird aber ausgegeben, wenn ich als Container einfach den Bezeichner des Dicts angebe? <b>Es sind die Schlüssel.

In [None]:
for elem in w: #nur Dict-Bezeichner
    print(elem)

Es gibt 3 Möglichkeiten, gezielt entweder auf die Schlüssel oder auf die Werte oder auf Schlüssel:Werte Paare eines Dict zuzugreifen. <br>
- Dict.keys() greift auf die Schlüssel zu, (kann man aber auch weglassen s.o.)
- Dict.values() greift auf die Werte zu
- Dict.items() greift auf Schlüsselwertepaare zu und gibt jeweils ein Tupel (Schlüssel,Wert) zurück.

In [None]:
for elem in w.keys():
    print(elem)
print(100*"-")
for elemente in w.values():
    print(elemente)
print(100*"-")
for key,wert in w.items(): #Tupelentpackung 
    print(f"Schlüssel ist: {key:6} Wert ist: {wert}")

## Aufgabe (etwas schwieriger)<br>
Machen Sie aus dem Morsetext:<br>
-.. .. . ...  .. ... -  -. .. -.-. .... -  ... . .... .-.  . .. -. ..-. .- -.-. ..... !<br>
 wieder lesbaren Text. Hinweis: Zerlegen Sie den String. Benutzen sie Dict.items()<br>
 Unten das morse Dict. Kommt das Zeichen dort nicht vor, geben Sie es unverändert in den Text.

In [None]:
morse = {
"A" : ".-", 
"B" : "-...", 
"C" : "-.-.", 
"D" : "-..", 
"E" : ".", 
"F" : "..-.", 
"G" : "--.", 
"H" : "....", 
"I" : "..", 
"J" : ".---", 
"K" : "-.-", 
"L" : ".-..", 
"M" : "--", 
"N" : "-.", 
"O" : "---", 
"P" : ".--.", 
"Q" : "--.-", 
"R" : ".-.", 
"S" : "...", 
"T" : "-", 
"U" : "..-", 
"V" : "...-", 
"W" : ".--", 
"X" : "-..-", 
"Y" : "-.--", 
"Z" : "--..", 
"0" : "-----", 
"1" : ".----", 
"2" : "..---", 
"3" : "...--", 
"4" : "....-", 
"5" : ".....", 
"6" : "-....", 
"7" : "--...", 
"8" : "---..", 
"9" : "----.", 
"." : ".-.-.-", 
"," : "--..--"
}

In [None]:













#LÖSUNG
s = "-.. .. . ...  .. ... -  -. .. -.-. .... -  ... . .... .-.  . .. -. ..-. .- -.-. .... !"

s = s.split(" ")
ergeb=""
for zeichen in s:
    if zeichen not in morse.values():        
        if zeichen=="":
            zeichen=" "
        ergeb+=zeichen        
        continue
    for k,v in morse.items():
        if v == zeichen:
            ergeb+=k
print(ergeb)
    


Man kann mit keys() und values() Dicts auch sehr schön wieder in Paare von Listen verwandeln.

In [None]:
morsezeichen=morse.keys()
print(morsezeichen)
print(100*"-")
print(list(morsezeichen))
print(100*"-")
print(list(morse.values()))

Wir haben jetzt den sehr wichtigen und häufig genutzten Datentyp ```dict``` kennengelernt und gesehen, wie man damit arbeitet! Jetzt zu dem letzten Typ, den wir besprechen werden, den Sets.