# Dictionaries

Dictionaries, die in anderen Programmiersprachen auch *Maps*, *Hashtables* oder *Assoziative Arrays* heißen, sind (intern) einer der wichtigsten Datentypen in Python. In einem Dictionary
wird jeder Wert über einen Key (Schlüssel) referenziert. Jeder Eintrag besteht also aus einem Schlüssel und dem dazu gehörigen Wert.

<img src="img/dict.svg" alt="Dictionary" style="height: 120px">

Ein Dictionary ist ein mächtiges und flexibles Instrument, um Daten zwischenzuspeichern
und sehr rasch wieder zu finden.

Dictionaries können jederzeit erweitert und verkürzt werden. Wie bei Listen können die
in einem Dictionary gespeicherten Werte überschrieben werden. Dictionaries gehören also zu den veränderbaren Datentypen.

Mit Python 3.6 wurde der Typ Dictionary neu implementiert, wodurch (zumindest
intern) die Reihenfolge der Elemente in einem Dictionary stabil bleibt. Für ältere Versionen ist dies nicht garantiert.

## Grundlagen

### Erzeugen und Befüllen eines Dictionaries

Ein leeres Dictionary wird so angelegt:

In [None]:
phone_numbers = {}

Dann können Werte eingefügt werden:

In [None]:
phone_numbers['Anna'] = '0316 123456'
phone_numbers['Hans'] = '0664 345678'
phone_numbers['Otto'] = '0660 987654'

phone_numbers

Man kann die Schlüssel-Wertpaare auch direkt beim Erzeugen des Dictionary anlegen:

In [None]:
phone_numbers = {
    'Anna': '0316 123456',
    'Hans': '0664 345678',
    'Otto': '0660 987654'
}
phone_numbers

<div class="alert alert-block alert-info">
<b>Übung Dict-1</b>
<p>
Erzeugen Sie ein Dictionary, das für 5 deutsche Wörter ihre englische Übersetzung enthält.
</p>
</div>

### Abfragen von Werten aus einem Dictionary

Die Telefonnummer von Hans können wir über das Dictionary so ermitteln:

In [None]:
phone_numbers['Hans']

Was passiert aber, wenn wir einen nicht existierenden Key verwenden?

In [None]:
phone_numbers['Tusnelda']

#### Dictionaries und der in-Operator

Wie bereits für andere Datentypen gezeigt, funktioniert der `in`-Operator auch für Dictionaries. Dabei wird auf die Existenz des entsprechenden Keys geprüft:

In [None]:
'Hans' in phone_numbers

In [None]:
'Tusnelda' in phone_numbers

Um einen `KeyError` beim Zugriff auf ein nicht existierenden Key zu vermeiden, können wir zuerst mit dem `in` -Operator testen, ob der entsprechende Key vorhanden ist:

In [None]:
name = "Tusnelda"
if name in phone_numbers:
    print(phone_numbers[name])
else:
    print(f"Kein Eintrag für '{name}' vorhanden.")

#### Die Methode get()

Eine kompaktere Lösung für das Abfangen fehlender Schlüssel bietet die Methode get(): Sie liefert den zum Schlüssel passenden Wert oder, falls der Schlüssel nicht existiert, `None`. Hier ein Beispiel:

In [None]:
print('Hans: {}'.format(phone_numbers.get('Hans')))
print('Tusnelda: {}'.format(phone_numbers.get('Tusnelda')))

Es besteht sogar die Möglichkeit, als Defaultwert etwas anderes als `None` zu verwenden:

In [None]:
phone_numbers.get('Tusnelda', 'Nicht vorhanden')

<div class="alert alert-block alert-info">
<b>Übung Dict-2</b>    
<p>
Probieren Sie das Dictionary aus Übung Dict-1 aus.
<ol>
<li>Lassen Sie sich ein Wort übersetzen</li>
<li>Probieren Sie es mit einem nicht funktionierenden Wort</li> 
</ol>
</p>
</div>

### Wissenswertes zu Keys

In einem Dictionary kann ein Schlüssel nur einmal verwendet werden. Wird er ein zweites Mal verwendet, wird der ursprüngliche Wert überschrieben.

In [None]:
print(phone_numbers['Hans'])
phone_numbers['Hans'] = 'Neue Nummer'
phone_numbers

Meist werden als Key Strings verwendet. Dictionaries erlauben aber jeden unveränderbaren Datentyp als Key. Sie können also z.B. auch Integers, Floats oder Tupel  als Key verwenden. Nicht erlaubt als Keys sind jedoch veränderbare Datentypen wie Listen, Sets oder Dictionaries.

In [None]:
my_dict = {}

my_dict[42] = 'Solution'
my_dict[3.14] = 'Pi'
print(my_dict)

Hier ein nicht erlaubter Datentyp als Key:

In [None]:
my_dict[['a', 'b', 'c']] = 'abc'

<div class="alert alert-block alert-info">
<b>Übung Dict-3</b>    
<p>
Ersetzen Sie einen Wert aus dem Dictionary aus Übung Dict-1 durch eine alternative Übersetzung!
</p>
</div>

## Die Zahl der Elemente ermitteln

Die Methode `len()`, die wir bereits bei einigen anderen Datentypen kennen gelernt haben, funktioniert auch für Dictionaries. Sie ermittelt die Zahl der Key-Value-Paare im Dict.

In [None]:
phone_numbers = {
    'Anna': '0316 123456',
    'Hans': '0664 345678',
    'Otto': '0660 987654'
}
len(phone_numbers)

## In einer for-Schleife durch ein Dictionary iterieren

Die schon bekannte `for ... in` Schleife funktioniert auch mit Dictionaries.

In [None]:
for key in phone_numbers:
    print(key)

Wie wir sehen, liefert `for ... in` einen Key nach dem anderen. Den dazugehörigen Wert können wir auf bekannte Weise auslesen:

In [None]:
for key in phone_numbers:
    print(f"{key} -> {phone_numbers[key]}")

### Die Methode items()
Alternativ können wir die Methode `items()` verwenden, die jeweils Schlüssel und Wert als Tupel zurückgibt:

In [None]:
for key, value in phone_numbers.items():
    print('{} -> {}'.format(key, value))

### Die Methode values()

Falls wir an den Keys nicht interessiert sind, können wir in der Schleife nur die Werte konsumieren:

In [None]:
for value in phone_numbers.values():
    print(value)

<div class="alert alert-block alert-info">
<b>Übung Dict-4</b>    
<p>
Iterieren Sie durch das Dictionary aus Übung Dict-1. Geben Sie für jeden Eintrag Ihres Dictionaries eine Zeile aus, die (beispielhaft) so aussehen soll:
<pre>    
'house' heißt auf Deutsch 'Haus'
</pre>
</p>
</div>

## Ein Dictionary als Zähler
Wir können ein Dictionary verwenden, um die Namen in der schon bekannten Namensdatei zu zählen. Lesen wir die Namen zuerst wieder aus der Datei ein:

In [None]:
with open('data/vornamen/names_short.txt', encoding='utf-8') as fh:
    clean_names = [line.rstrip() for line in fh.readlines()]

Die Liste `clean_names` enthält nun alle aus der Datei gelesenen Namen. Im nächsten Schritt
erzeugen wir ein leeres Dictionary. Dann iterieren wir durch die Liste der Vornamen. Wir verwenden das  Dictionary, um für jeden Key (d.h. für jeden Vornamen) zu zählen, wie oft er erscheint (d.h. key ist der Vorname, value eine Zahl, die festhält, wie oft der Name bisher vorgekommen ist):

In [None]:
name_counter = {}
for name in clean_names:
    if name in name_counter:  # we saw the name before
        name_counter[name] += 1
    else:  # new name: create counter with 1
        name_counter[name] = 1
print(name_counter)        

Wenn wir nur an Namen interessiert sind, die mindestens zwei Mal erscheinen können wir das so lösen:

In [None]:
for name in name_counter:
    if name_counter[name] > 1:
        print(f'{name} erscheint {name_counter[name]} Mal')

## Verschachtelte Dictionaries

So wie ein Element einer Liste wieder eine Liste sein kann, kann in einem Dictionary der einem Schlüssel zugewiesene Wert wieder ein Dictionary sein:

In [None]:
colors = {
  'red': { 
      'de': 'rot ' , 
      'fr': 'rouge ' , 
      'it': 'rosso '
  } ,
  'blue': { 
      'de': 'blau' , 
      'fr': 'bleu' , 
      'it': 'blu'
  } ,
  'yellow': { 
      'de': 'gelb' , 
      'fr': 'jaune' , 
      'it': 'giallo'
  }
}

Wie bereits von den Listen bekannt können wir auf eine einzelne Übersetzung (umständlich) so zugreifen:

In [None]:
blue_translations = colors['blue']
blue_translations['fr']

Normalerweise wird aber die deutlich kompaktere Schreibweise verwendet:

In [None]:
colors['blue']['fr']

## Vertiefende Literatur
Ich empfehle ausdrücklich, mindestens eine der folgenden Ressourcen zur Vertiefung zu lesen!

  * Python Tutorial: Kapitel 5.5
	(https://docs.python.org/3/tutorial/datastructures.html#dictionaries)
  * Klein, Kurs: 
	* Dictionaries (https://python-kurs.eu/python3_dictionaries.php).
  * Sweigart: https://automatetheboringstuff.com/2e/chapter5/
  
  
  * Klein, Buch: Kapitel 6.
  * Kofler: Kaitel 7.5.
  * Weigend: Kapitel 4.12
  * Briggs: Kapitel 4.4.
  * Pilgrim: Kapitel 2.7 
    (https://www.diveinto.org/python3/native-datatypes.html#dictionaries) 
  * Downey: Kapitel 11
    (http://greenteapress.com/thinkpython/html/thinkpython012.html)

## Lizenz

This notebook ist part of the course [Grundlagen der Programmierung](https://github.com/gvasold/gdp) held by [Gunter Vasold](https://online.uni-graz.at/kfu_online/wbForschungsportal.cbShowPortal?pPersonNr=51488) at Graz University 2017&thinsp;ff. 

<p>
    It is licensed under <a href="https://creativecommons.org/licenses/by-nc-sa/4.0">CC BY-NC-SA 4.0</a>
</p>

<table>
    <tr>
    <td>
        <img style="height:22px" 
             src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1"/></li>
    </td>
    <td>
    <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/nc.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
             src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1" /></li>
    </td>
</tr>
</table>