<a name="top"></a>Übersicht: Dictionaries & I/O
===

* [Dictionaries](#dictionaries)
  * [Indizierung](#dindex)
  * [Iteration](#diteration)
  * [Bearbeiten](#dmodify)

* [Input/Output](#inputoutput)
  * [Lesen von Dateien](#reading)
  * [Schreiben von Dateien](#writing)
  * [Nutzereingaben](#userinteraction)

* [Exercise 07: Dictionaries & I/O](#exercise07)

**Lernziele:** Am Ende dieser Einheit
* wisst ihr, wie man Variablen in Dictionaries speichert und abruft
* könnt ihr Dateien lesen und schreiben
* könnt ihr Eingaben vom Nutzer anfordern und verarbeiten

# <a name="dictionaries"></a>Dictionaries

Dictionaries sind neben Listen ein weiterer Datentyp für eine Sammlung von mehreren Elementen.

Gemeinsamkeiten mit Listen:
* Sammlung von Variablen, die wiederum in einer Variable gespeichert sind
* es können beliebige Variablen gespeichert werden

Unterschiede:
* Elemente werden nicht über ihre Position (Index) angesprochen, sondern über ihren _Schlüssel_ (_key_)
* Bei der Deklaration werden geschweifte Klammern `{}` statt eckigen Klammern `[]` verwendet

Andere Bezeichnungen für so einen Datentyp sind z. B. _map_, _Assoziatives Array_, _Hashtable/Hashmap_

Dictionaries bilden _Schlüssel_ auf _Werte_ ab, z. B.:

* Wort $\rightarrow$ Bedeutung oder Übersetzung (Wörterbuch)
* Name $\rightarrow$ Telefonnummer (Telefonbuch)
* Einstellung $\rightarrow$ Wert (Programmkonfiguration)

##### Beispiel

In [None]:
# ein Dictionary, das Strings als Schlüssel verwendet
data_types = {'integer': 'Ganzzahl',
              'float': 'Dezimalzahl',
              'string': 'Zeichenkette',
              'list': 'Sammlung von Elementen mit Index'}

[top](#top)

## <a name="dindex"></a>Indizierung

Während Listen mit Zahlen indiziert werden, verwenden Dictionaries _Schlüssel_. Meistens werden dafür Integer oder Strings genutzt.

In [None]:
# Zugriff auf ein Element
int_type = data_types['integer']
print(int_type)

Um die Anzahl der Elemente eines Dictionary zu bestimmen, können wir wieder die Funktion `len()` verwenden:

In [None]:
# Anzahl an gespeicherten Datentypen
number_of_types = len(data_types)

print('Das Dictionary data_types enthält {} Elemente.'
      .format(number_of_types))

Der Zugriff auf ein nicht vorhandenes Element ergibt einen Fehler (**KeyError**):

In [None]:
data_types['bicycle']

Wir können mit dem `in`-Operator überprüfen, ob ein Dictionary einen Wert zu dem gefragten Schlüssel gespeichert hat:

In [None]:
test_types = ['integer', 'bicycle']

for test in test_types:
    if test in data_types:
        print('{} is in data_types'.format(test))
    else:
        print('{} is not in data_types'.format(test))

[top](#top)

## <a name="diteration"></a>Iteration über Dictionaries

Dictionaries können wie Listen iteriert werden, es gibt aber mehrere Möglichkeiten, das zu tun:
* Iteration über die Schlüssel (der Normalfall)
* Iteration über Paare von Schlüssel und Wert

##### Iteration über Schlüssel

Wir haben bereits `for`-Schleifen genutzt, um auf Elemente einer Liste zuzugreifen. Das gleiche machen wir jetzt mit den Schlüsseln des Dictionary. In diesem Fall läuft die Schleife also vier mal:

In [None]:
# Iteration über die Schlüssel
for key in data_types:
    print('{} ist ein Datentyp in Python.'.format(key))

##### Iteration über Schlüssel-Wert-Paare

Um über die Paare aus Schlüssel und Wert zu iterieren, können wir die `dict.items()`-Funktion nutzen:

In [None]:
# Iteration über Schlüssel-Wert-Paare
for key, value in data_types.items():
    print('{} ist eine {}.'.format(key, value))

Natürlich können wir auch über die Schlüssel iterieren und dannn das Dictionary mit dem Schlüssel indizieren. Das ist aber langsamer und etwas unübersichtlicher als die vorherige Variante.

In [None]:
# Iteriert über die Schlüssel und greift manuell auf die Werte zu,
# das ist langsamer als die Iteration über die Paare!
for key in data_types:
    print('{} ist eine {}.'.format(key, data_types[key]))

## <a name="dmodify"></a>Dictionaries bearbeiten

Variablen in Dictionaries können hinzugefügt, geändert und gelöscht werden.

##### Elemente hinzufügen oder ändern

Um einen Wert zum Dictionary hinzuzufügen oder einen Wert zu ändern, indizieren wir das Dictionary mit dem dazugehörigen Schlüssel und weisen einen Wert zu:

In [None]:
data_types['dictionary'] = 'samlung von Schlüssel-Wret-Paaren'

for key, value in data_types.items():
    print('{} ist eine {}.'.format(key, value))

Falsch geschrieben, das sollten wir korrigieren:

In [None]:
print('Ein Dictionary ist eine {}.'.format(data_types['dictionary']))
data_types['dictionary'] = 'Sammlung von Schlüssel-Wert-Paaren'
print('Ein Dictionary ist eine {}.'.format(data_types['dictionary']))

##### Elemente entfernen

Um ein Element aus einem Dictionary zu löschen, verwenden wir wieder den `del`-Operator:

In [None]:
del data_types['float']

for key, value in data_types.items():
    print('{} ist eine {}.'.format(key, value))

[top](#top)

# <span id="inputoutput"/>Input & Output

## <span id="reading"/>Dateien lesen

Wir haben bereits `open()` zum Öffnen von Dateien benutzt.  Die `open()`-Funktion gibt ein **file-Objekt** zurück, das zum Lesen oder Schreiben benutzt werden kann.

Wenn keine weiteren Parameter angegeben sind, werden Dateien als Textdatei behandelt und nur zum Lesen geöffnet. Um Text zeilenweise zu lesen, gibt es die Funktion `readline()`.  File-Objekte sind außerdem **iterierbar**, wir können also eine `for`-Schleife zum Auslesen verwenden. Beide Möglichkeiten im Beispiel:

In [None]:
# Textdatei zum Lesen öffnen
f = open('text_file.txt')

# Zeile lesen und ausgeben
line = f.readline()
print(line)

# Iteriere über die Datei
for line in f:
    print(line)

# Datei schließen
f.close()

**Beachte:** Python merkt sich die Position, bis zu der gelesen wurde, daher wird die erste Zeile nicht zweimal ausgegeben.

Außerdem wird nach jeder Zeile eine Leerzeile ausgegeben, die in der Datei nicht vorhanden war. Das liegt daran, dass Python auch die Zeilenumbrüche aus der Datei liest und `print()` jeweils einen Zeilenumbruch anhängt. Mit der Funktion `str.rstrip()` kann das Beispiel verbessert werden:

In [None]:
f = open('text_file.txt')

# Iteriere über die Datei
for line in f:
    # str.rstrip() entfernt whitespace (Leerzeichen, Tabs und Zeilenumbrüche)
    # vom Ende des Strings
    print(line.rstrip())

    # oder alternativ den optionalen Parameter 'end' von print() auf den leeren String setzen:
    # print(line, end="")

f.close()

Die Datei mit `close()` zu schließen ist sehr empfehlenswert, da die Datei sonst bis zum Beenden des Programms geöffnet bleibt und Ressourcen belegt.

Noch besser ist die Verwendung des `with`-Statements:

In [None]:
# Datei mit Kontextmanager öffnen
# das keyword 'as' sorgt dafür, dass die geöffnete Datei der Variable f zugewiesen wird
with open('text_file.txt') as f:
    # read() liest den gesamten Inhalt in einen einzigen String
    print(f.read())
    print('Ist die Datei im Block geschlossen?:', f.closed)
    # Am Ende des Blocks wird die Datei automatisch geschlossen.
    # Das passiert sogar dann, wenn in dem eingerückten Block ein Fehler auftritt.

print('Ist die Datei nach dem Block geschlossen?:', f.closed)

[top](#top)

## <span id="writing"/>Dateien schreiben

Um in eine Datei zu schreiben, muss ein zusätzliche Parameter für `open()` angegeben werden. Dabei gibt es verschiedene Möglichkeiten:

* `'w'` (write) überschreibt den Dateiinhalt, falls die Datei schon existiert
* `'a'` (append) fügt ans Ende der Datei an
* `'r+'` öffnet die Datei zum Lesen und Schreiben

Zum Schreiben können wir wieder `print()` verwenden, allerdings mit einem zusätzlichen Parameter, der die Datei angibt, in die geschrieben werden soll.

In [None]:
# Datei zum Schreiben von Text öffnen
with open('schreib_test.txt', 'w') as f:
    # eine Zeile schreiben
    print('Das ist eine Textdatei!', file=f)

    # noch ein paar Zeilen mehr in einer Schleife:
    for number in range(1, 6):
        print('eine Zahl:', number, file=f)

In [None]:
!cat schreib_test.txt

Wir können auch direkt `write()` verwenden, dann müssen wir uns aber selbst um die Formattierung kümmern:

In [None]:
# Datei zum Schreiben von Text öffnen
with open('schreib_test2.txt', 'w') as f:
    # eine Zeile schreiben, Zeilenumbruch wird nicht automatisch ergänzt
    f.write('Das ist eine Textdatei!\n')

    # write() akzeptiert nur einen String, daher müssen wir die Zahl
    # in den String einbauen
    for number in range(1, 6):
        f.write('eine Zahl: {}\n'.format(number))

In [None]:
!cat schreib_test.txt

[top](#top)

## <span id="userinteraction" />Nutzerinteraktion

Manchmal soll ein Programm mit dem Benutzer interagieren können. Um Informationen auszugeben, können wir einfach `print()` benutzen. Für die umgekehrte Richtung gibt es die Funktion `input()`.

Die `input()`-Funktion gibt einen String (z. B. eine Frage) aus und erwartet dann eine Eingabe. Das Ergebnis wird dem Programm als String zurückgeliefert.

In [None]:
name = input('Wie heißt du?\n')
print('Hallo {}!'.format(name))

Ein weiteres Beispiel, das die `split()`-Funktion nutzt, um den eingegebenen String in einzelne Wörter zu teilen.

In [None]:
s = input('Bitte gib einen Satz ein: ')

# zerlege den String an den Leerzeichen
words = s.split(' ')

word_num = 1
for word in words:
    print('Wort #{} ist "{}".'.format(word_num, word))
    word_num = word_num + 1

Und noch ein Beispiel mit Entscheidung basierend auf dem Input.

In [None]:
# input() liefert einen String, den wir mit int()
# zu einer Zahl umwandeln
x = int(input('Bitte eine Zahl eingeben: '))
if x < 0:
    print('Die Zahl war negativ.')
elif x == 0:
    print('Null...')
elif x < 10:
    print('Die Zahl war einstellig.')
else:
    print('Die Zahl war größer als Zehn.')

[top](#top)

# <span id="exercise07"/>Übung 07: Dictionaries & I/O

1. **Dictionaries**
  1. Erstelle ein Dictionary mit Namen und E-Mail-Adressen. Die Namen sollen als Keys verwendet werden.
  2. Erstelle ein neues Dictionary, das ebenfalls Namen und E-Mail-Adressen enthält, diesmal aber mit E-Mail-Adressen als Keys. Iteriere dazu mit `for` über das vorherige Dictionary.
  3. Füge einige neue Einträge zu dem neuen Dictionary hinzu.
  4. Gib das neue Dictionary mit einer `for`-Schleife aus.


2. **Buchstabenhäufigkeit**
  1. Nimm einen beliebigen Satz oder kurzen Text uns speichere ihn in einer String-Variable. Erstelle ein Dictionary, das für jeden Buchstaben der in dem String vorkommt, speichert, wie oft er enthalten ist und gib es aus.
  2. **(Optional)** Gib die Buchstaben und die Anzahl sortiert nach der Häufigkeit aus.


3. **Input/Output**

  1. Schreibe ein Programm, das Namen und E-Mail-Adressen aus einer Datei liest. Das Programm soll folgendes tun:

      1. Namen und E-Mail-Adressen einlesen
      2. Die gelesenen Daten ausgeben
      3. Den Benutzer nach einem Namen fragen und die dazu passende E-Mail-Adresse ausgeben.

    Die Datei `email_addresses.txt` enthält Zeilen in der folgenden Form:

    `[Name] [E-Mail-Adresse]`

    Jede Zeile enthält einen Namen und eine E-Mail-Adresse, die durch ein Leerzeichen getrennt sind. Da nur Vornamen gespeichert wurden, enthält `Name` keine Leerzeichen.

    Hinweis: Nutze die `split()`-Funktion, um jede Zeile in Name und E-Mail-Adresse zu teilen. Das Ergebnis von `split()` ist eine Liste.

  2. **(Optional)** Erweitere das Programm so, dass es für nicht vorhandene Namen zusätzlich nach einer E-Mail-Adresse fragt und beides zusammen in die Datei schreibt. Der vorherige Inhalt soll dabei natürlich nicht überschrieben werden.

[top](#top)