# Input und Output

In den ersten Notebooks haben wir gelernt, dass wir in Python effizient mit Objekten verschiedenster Datentypen arbeiten, indem wir sie Variablen zuweisen. Am Anfang hatten wir es blo√ü mit kleinen Objekten zu tun ‚Äì etwa mit einzelnen W√∂rtern oder, wenn's hoch kam, mit S√§tzen. Diese haben wir bei der Variablenzuweisung jeweils komplett ausgeschrieben:

```sentence = "Am Anfang haben wir eine Zeichenkette noch ausgeschrieben."```

Im letzten Notebook haben wir dann zum ersten Mal mit gr√∂√üeren Objekten gearbeitet, n√§mlich mit den Koalitionsvertr√§gen. Aufgrund der Gr√∂√üe (und der Tatsache, dass wir die Texte bereits extern in einer Datei vorliegen hatten) haben wir uns die Texte vom externen Speicherort in den Arbeitsspeicher geladen und einer Variablen zugewiesen.

Da wir fortan h√§ufig mit gr√∂√üeren externen Dateien arbeiten, schauen wir uns in diesem Notebook genauer an, wie der sog. *Input* von Dateien funktioniert. Ebenso schauen wir uns das andere Ende an, n√§mlich den *Output* von Dateien, also das Speichern von Dateien auf einem externen Laufwerk. In diesem Notebook geht es also nicht prim√§r darum, wie wir mit Daten *in* Python arbeiten, sondern wie diese Daten √ºberhaupt erst f√ºr Python verarbeitbar werden und wie wir sie nach einer Verarbeitung durch Python wiederum f√ºr die Welt au√üerhalb Pythons zug√§nglich machen. 

Weiter lernen wir in diesem Notebook, wie Benutzer:innen √ºber Input f√ºr ein laufendes Programm dessen Ablauf beeinflussen oder kontrollieren k√∂nnen (wir haben diese Funktion bereits im dritten Notebook beim Oktopus-Ratespiel benutzt). Dadurch k√∂nnen wir interaktive Programme schreiben. Abschlie√üend gehen wir detailliert auf die allgegenw√§rtige ```print```-Funktion ein. Diese stellt ja auch eine Form von Output bereit, zwar (standardm√§√üig) nicht als Datei, aber als Zeichenkette in der Ausgabe.

Auch in diesem Notebook gibt es einen Anwendungsfall, den wir am Ende unter Einbezug der meisten hier erlernten Techniken l√∂sen k√∂nnen. Mehr dazu weiter unten.

Dieses Notebook ist recht umfangreich und es ist empfehlenswert, sich die Inhalte verteilt √ºber zwei oder mehr Lernsesssions anzuschauen.

## Dateipfade

Um Dateien von einem bestimmten Ort auf dem Laufwerk einzulesen bzw. an einem bestimmten Ort auszugeben, m√ºssen wir uns mit Dateipfaden vertraut machen. Jede Datei auf Deinem Computer hat bekanntlich einen Namen, ein Dateisuffix (etwa ".txt", wird z.T. ausgeblendet) und die Datei befindet sich in einem bestimmten Verzeichnis (auch *Ordner* genannt). Dieses Verzeichnis befindet sich wiederum in einem Verzeichnis, und so weiter, bis zum obersten Verzeichnis, dem Stamm des Laufwerks. Jede Datei hat also eine einzigartige Adresse und diese Adresse wird *Dateipfad* genannt. 

Wie Du gleich sehen wirst, gibt es zwei Arten, einen Dateipfad anzugeben, n√§mlich absolut und relativ. Zus√§tzlich unterscheiden sich Dateipfade zwischen macOS und Windows. Dateipfade zu verstehen, ist √ºberaus wichtig, um frustrierenden ```FileNotFoundError```-Fehlern vorzubeugen. 

### Absolute Dateipfade
Ein Dateipfad kann immer absolut, d.h. vollst√§ndig vom Stamm des Laufwerks bis zur gew√ºnschten Datei, angegeben werden. Um an den absoluten Pfad einer beliebigen Datei heranzukommen, gibt es folgende Tricks:
- Unter macOS: Navigiere im Finder zur gew√ºnschten Datei und klicke die Datei mit zwei Fingern an (Rechtsklick), es √∂ffnet sich ein Men√ºfenster. Dr√ºcke die Taste *Option ‚å•*, wodurch sich einige Men√ºoptionen √§ndern. W√§hle *"Datei" als Pfadname kopieren*. Ein vollst√§ndiger Pfad unter macOS sieht z.B. so aus: "/Users/Name/Documents/Project/Folder/Notebook.ipynb", beachte, dass Schr√§gstriche "/" verwendet werden sowie, dass der absolute Pfad mit einem Schr√§gstrich beginnt.
- Unter Windows: Navigiere im Explorer zur gew√ºnschten Datei und klicke die Datei mit einem Rechtsklick an, w√§hrend du Shift gedr√ºckt h√§ltst. Es √∂ffnet sich ein Men√ºfenster. W√§hle *Als Pfad kopieren*. Ein vollst√§ndiger Pfad unter Windows sieht z.B. so aus: "C:\Users\Name\Documents\Project\Folder\Notebook.ipynb", beachte, dass Backslashes "\\" verwendet werden sowie, dass der absolute Pfad ohne Backslash beginnt. ‚ö†Ô∏è Achtung: der Backslash "\\" hat bei Python eine Spezialbedeutung innerhalb von strings, wie etwa bei "\n", das bekanntlich f√ºr einen Zeilenumbruch steht. Um Python bei einem Windows-Dateipfad mitzuteilen, dass die darin verwendeten Backslashes nicht als Spezialzeichen interpretiert werden sollen, m√ºssen wir ein "r" vor das √∂ffnende Anf√ºhrungszeichen stellen. Obiger Pfad innerhalb von Python-Code muss also so ausschauen: r"C:\Users\Name\Documents\Project\Folder\Notebook.ipynb".

In beiden F√§llen wird der Pfad in die Zwischenablage kopiert und Du kannst ihn anschlie√üend in Deinen Code einf√ºgen (am besten mit der Tastenkombination ```command ‚åò```+ ```V``` (macOS) / ```Strg```+ ```V``` (Windows)).

Beachte, dass die obersten Verzeichnisse eines absoluten Pfades, also diejenigen, die vom System vorgegeben sind, z.T. auf Englisch angegeben werden (selbst wenn sie in Deinem Dateimanager auf Deutsch angezeigt werden). Im vollst√§ndigen Pfad steht also ggf. *Users* und nicht *Benutzer*. Das geschieht aber automatisch, wenn Du den Pfad wie oben beschrieben kopierst.

***

‚úèÔ∏è **√úbung 1:** Navigiere in Deinem Dateimanager zu f√ºnf beliebigen Dateien in f√ºnf verschiedenen Verzeichnissen. Kopiere die absoluten Dateipfade wie oben beschrieben und weise je einen Dateipfad einer der folgenden Variablen zu (innerhalb der Anf√ºhrungszeichen).

In [None]:
#In diese Zelle kannst Du den Code zur √úbung schreiben (so viel zu coden gibt es hier nicht üòÖ)

path_file1 = ""
path_file2 = ""
path_file3 = ""
path_file4 = ""
path_file5 = ""

***

### Relative Dateipfade

Ein Dateipfad kann stets auch relativ, d.h. vom aktuellen Arbeitsverzeichnis aus gesehen, angegeben werden. Am einfachsten ist das nat√ºrlich bei einer Datei, die sich im aktuellen Arbeitsverzeichnis befindet. Um auf diese zuzugreifen, geben wir blo√ü ihren Namen als Pfad an. 

Weiter k√∂nnen wir vom aktuellen Arbeitsverzeichnis aus in ein (darin befindliches) Unterverzeichnis navigieren. Dazu beginnt der relative Pfad mit dem Namen des Unterverzeichnis, gefolgt von einem Schr√§gstrich sowie dem Namen der Datei. Diese Schreibweise mit dem Schr√§gstrich funktioniert innerhalb Pythons auf allen Betriebssystemen. Unsere Schnittstelle zu externen Dateien, die weiter unten vorgestellte `open`-Funktion, k√ºmmert sich bei relativen Pfaden wenn n√∂tig um die Konversion von Schr√§gstrich zu Backslash. 

Letztlich k√∂nnen wir vom aktuellen Arbeitsverzeichnis aus auch aufw√§rts (zum Stamm des Laufwerks hin) navigieren. Indem wir zwei Punkte und einen Schr√§gstrich, also "../", an den Anfang des relativen Pfads stellen, r√ºcken wir eine Ebene nach oben (und durch "../../" zwei Ebenen, etc.). Im Anschluss an den Schr√§gstrich folgt der Name der Datei, die sich im Oberverzeichnis befindet. Nat√ºrlich k√∂nnen wir vom Oberverzeichnis aus auch in ein *anderes* Unterverzeichnis als das aktuelle Arbeitsverzeichnis (eine Art "Schwesterverzeichnis") navigieren.

Relative Dateipfade sind zwar fehleranf√§lliger als die einfach zu kopierenden, absoluten Dateipfade. Sie sind aber aus dreierlei Gr√ºnden zu bevorzugen: Erstens sind sie i.d.R. k√ºrzer. Zweitens funktionieren sie auf allen Betriebssystemen. Drittens sind sie stabiler, da sie auch nach dem Verschieben oder Teilen eines Notebooks funktionieren, sofern die darin aufgerufenen Dateien entsprechend mitverschoben bzw. mitgeteilt wurden. Aus diesem Grund werden in diesen Notebooks auch stets relative Dateipfade verwendet und Du wurdest anfangs darum gebeten, die Ordnerstruktur der heruntergeladenen Dateien nicht zu ver√§ndern. Die hier verwendeten, relativen Dateipfade funktionieren solange, wie Du die Ordnerstruktur (konkret: das Verzeichnis "3_Dateien" und die darin befindlichen Ordner und Dateien) nicht ver√§nderst. 

Versuche also immer relative Dateipfade zu verwenden.

## Das `os`-Modul

Im Zusammenhang mit Dateien auf Deinem Laufwerk ist das Modul `os` mit den Funktionen `getcwd`, `chdir` und `listdir` √§u√üerst hilfreich. Sie werden in der folgenden Zelle angewandt und mithilfe von Kommentaren beschrieben:

In [None]:
import os

#gibt das aktuelle Arbeitsverzeichnis aus ("get current working directory")
print("Aktuelles Arbeitsverzeichnis:", os.getcwd())

"""mit dieser Funktion k√∂nnte man das aktuelle Arbeitsverzeichnis √§ndern; das tun wir aber nicht, 
da die relativen Dateipfade weiter unten im Notebook sonst nicht mehr korrekt w√§ren (s.o)."""
#os.chdir("new_path")

"""gibt die im aktuellen Arbeitsverzeichnis (oder beim in Klammern angegebenen Pfad) befindlichen Unterverzeichnisse 
und Dateien als Liste aus; darunter auch einige, die vom Dateimanager i.d.R. ausgeblendet werden"""
print("\nDarin befindliche Unterverzeichnisse und Dateien: ")
for file in os.listdir():
    print(file)

Denk daran, dass Du ein externes Modul wie ```os``` am Anfang jedes Notebooks importieren musst, um damit arbeiten zu k√∂nnen. 

Wie im vierten Notebook erkl√§rt, m√ºssen wir vor den Funktionsnamen jeweils den Modulnamen sowie einen Punkt setzen (z.B. ```os.getcwd```), damit Python wei√ü, wo sich die gew√ºnschte Funktion befindet. Alternativ k√∂nnten wir auch den ```import```-Befehl zu ```from os import getcwd, chdir, listdir``` √§ndern und die entsprechenden Funktionen ohne Modulnamen davor aufrufen.

Wenn Du es vers√§umst, ```os``` am Anfang zu importieren, erh√§ltst Du ```NameError: name 'os' is not defined``` zur√ºck. Das ist die gleiche Fehlermeldung, wie wenn Du versuchst mit einer (noch) nicht definierten Variable zu arbeiten. In beiden F√§llen kann Python schlicht nichts mit den *Namen* anfangen.

***

‚úèÔ∏è **√úbung 2:** Das aktuelle Arbeitsverzeichnis auf einem Windows-Rechner sei "C:\Users\Name\Documents\Project\Folder". Du m√∂chtest auf eine Datei zugreifen, die folgenden absoluten Dateipfad besitzt: "C:\Users\Name\Documents\Resources\file.csv". Mithilfe welchen relativen Pfads k√∂nnen wir in Python auf "file.csv" zugreifen?

In [None]:
#In diese Zelle kannst Du den Code zur √úbung schreiben (immer noch nichts zu coden üòÖ)




***

## üîß Anwendungsfall: Einen Gedankenprotokollanten programmieren

Beim Anwendungsfall in diesem Notebook wollen wir ein interaktives Programm schreiben, mit dessen Hilfe eine Benutzerin schlaue Gedanken protokollieren kann. Die Benutzerin soll durch das Programm gef√ºhrt werden und entscheiden k√∂nnen, wo, d.h. in welchem (externen) Dokument, sie ihre Gedanken festhalten will. Sie soll sowohl neue Dokumente anlegen k√∂nnen, als auch in bestehende reinschreiben. Anschlie√üend soll sie beliebig viele Gedanken in dieses Dokument einf√ºgen k√∂nnen. Das folgende Video zeigt das fertige Programm "in Aktion":

In [None]:
#F√ºhre diese Zelle aus, um das Video einzubetten
from IPython.display import Video
Video("../3_Dateien/Grafiken_und_Videos/Gedankenprotokollant.mov", width=700)

Ohne dieses Programm w√ºrde die Benutzerin vermutlich ein Microsoft Word-Dokument √∂ffnen, ihre Gedanken reinschreiben, das Dokument speichern und dann wieder schlie√üen. Das Anlegen/√ñffnen/Speichern/Schlie√üen des Dokuments wollen wir ihr abnehmen und ihr stattdessen erm√∂glichen, ihre Gedanken √ºber eine freundliche, aber sehr minimale Benutzeroberfl√§che (engl.: *user interface*, abgek√ºrzt: *UI*) zu protokollieren.

Im Folgenden lernen wir die daf√ºr notwendigen Grundlagen kennen.

***

## Die ```open```-Funktion

Die Schnittstelle zu externen Dateien bietet in Python die ```open```-Funktion. Sie √∂ffnet externe Dateien mittels folgender grundlegender Syntax:

```open(file, mode)```

Bei ```file``` setzen wir den absoluten oder relativen Dateipfad zur zu √∂ffnenden Datei ein, und zwar als Zeichenkette, inklusive des Dateisuffixes und nat√ºrlich umrahmt von Anf√ºhrungszeichen. √úber den Parameter ```mode``` m√ºssen bzw. k√∂nnen wir spezifizieren, was wir mit der zu √∂ffnenden Datei machen wollen. ```open``` stellt drei verschiedene Modi zur Verf√ºgung:

- den Lesemodus f√ºr Input (```"r"```): dies ist der Standardmodus, der Parameter ```"r"``` wird deswegen i.d.R. weggelassen (vgl. viertes Notebook beim √ñffnen der Koalitionsvertr√§ge)
- den Schreibmodus f√ºr Output (```"w"```): √ºberpr√ºft, ob die angegebene Datei im Verzeichnis existiert; wenn ja, wird deren Inhalt *√ºber*schrieben; wenn nein, wird die Datei geschaffen und *be*schrieben
- den "Anh√§ngmodus" f√ºr Output (```"a"``` von *append*): √ºberpr√ºft, ob die angegebene Datei im Verzeichnis existiert; wenn ja, werden Daten (z.B. neue Zeilen bei einer Datei in Tabellenform) im Anschluss an die bereits existierenden Daten in der angegebenen Datei angeh√§ngt; wenn nein, wird die Datei geschaffen und *be*schrieben

Zum Schreiben bzw. Anh√§ngen sieht der Funktionsaufruf also so aus:

- ```open(file, "w")``` 
- ```open(file, "a")```

Die ```open```-Funktion akzeptiert neben ```file``` und ```mode``` weitere Parameter, z.B. ```encoding```, wo wir spezifizieren k√∂nnen, *wie* eine Datei enkodiert ist. Das Encoding einer Datei legt fest, nach welchem Schl√ºssel s√§mtliche Zeichen (Buchstaben in lateinischer Schrift sowie den allermeisten anderen Sprachen, Zahlen, Emojis...) in Nullen und Einsen √ºbersetzt werden. Nat√ºrlich geht nichts ohne den korrekten Schl√ºssel. [UTF-8](https://de.wikipedia.org/wiki/UTF-8) von [Unicode](https://de.wikipedia.org/wiki/Unicode) ist Standard, sodass wir uns i.d.R. nicht den Kopf dar√ºber zerbrechen m√ºssen. Um Problemen vorzubeugen, lohnt es sich trotzdem, standardm√§√üig ```encoding=utf-8``` zu spezifizieren, und zwar beim Input sowie beim Output.

### Input

Wie wir bei den Koalitionsvertr√§gen im letzten Notebook bereits gesehen haben, wird die ```open```-Funktion zum Lesen von externen Dateien wie folgt syntaktisch eingebunden:

```with open(file) as read_file:```<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;```variable = read_file.read()```

Wir benutzen hier den sog. ```with```-Kontextmanager: Im ```with```-Statement √∂ffnen wir mittels ```open``` das √ºbergebene ```file``` und weisen die ge√∂ffnete Datei direkt einer Variablen zu (hier ```read_file```, aber wie immer kann man einen beliebigen Variablennamen w√§hlen). 

Einger√ºckt darunter wenden wir die ```read```-Methode auf ```read_file``` an, d.h. die bislang nur ge√∂ffnete Datei wird nun eingelesen. Je nach dem, wie die externe Datei formatiert ist, m√ºssen wir ```read``` durch eine andere geeignete Lesemethode ersetzen (s.u.). Das Resultat weisen wir in jedem Fall einer sinnvoll genannten ```variable``` zu. Die externe Datei befindet sich damit als Objekt im Arbeitsspeicher. 

Diese Syntax f√ºr den Dateiinput entspricht nat√ºrlichsprachlich ungef√§hr: "Mit (```with```) der zu √∂ffnenden (```open```) Datei (```file```) als (```as```), nennen wir es, ```read_file```, tu alles, was nach dem Doppelpunkt (```:```) darunter einger√ºckt (```‚á•```) steht (hier: lese (```read```) das ```read_file``` und weise es ```variable``` zu (```=```)).

Indem wir anschlie√üend die Einr√ºckung wieder verlassen, schlie√üt der ```with```-Kontextmanager die externe Datei *automatisch*. Die brauchen wir ja auch nicht mehr, da wir deren Inhalt nun in einem Python-Objekt im Arbeitsspeicher haben. Die Verwendung von ```with``` beim Umgang mit externen Dateien ist *Best Practice*. Abweichend davon begegnet man auch folgender Herangehensweise:

```file = open("path")```

`content = file.read()`

```file.close() ```

In der ersten Zeile wird die externe Datei ge√∂ffnet und in der zweiten gelesen. Anschlie√üend muss die Datei wieder *manuell* geschlossen werden. Oft wird jedoch genau dieser letzte Schritt vergessen. Gew√∂hne Dir also an, stets den ```with```-Kontextmanager im Umgang mit externen Dateien zu benutzen.

### Output

F√ºr den Output von Dateien verwenden wir ebenfalls den ```with```-Kontextmanager sowie die ```open```-Funktion, aber wie oben erw√§hnt mit dem zus√§tzlichen Parameter ```"w"``` oder ```"a"```:

```with open(file, "w") as write_file:```<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;```for line in data:```<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;```write_file.write(line + "\n")```

In diesem Beispiel iterieren wir √ºber ein mit ```data``` referenziertes Listenobjekt (das wir im Code davor auf irgendeine Weise geschaffen haben) und schreiben mittels der ```write```-Methode jedes Element (```line```) in eine neue Zeile von ```write_file``` (die neue Zeile kommt durch den abschlie√üenden Zeilenumbruch im ```write```-Befehl zustande). Wie beim Input wird ```write_file``` nach Verlassen der (√§u√üeren) Einr√ºckung automatisch geschlossen. Je nach gew√ºnschtem Outputformat (z.B. als Textdatei oder als Tabelle) kommen andere Schreibmethoden als ```write``` zum Einsatz (s.u.).  

Im Folgenden schauen wir uns genauer an, wie wir mit den beiden wichtigsten Datenformaten, Textdateien und tabellarische Dateien, beim Input und Output umgehen.  

## Textdateien

Textdateien sind grundlegend nach Zeilen strukturierte Dateien. Das trifft sowohl auf Microsoft Office-Dokumente mit dem Suffix ".docx" zu, als auch auf sog. *Plain Text Files* (mit dem Suffix ".txt"). Letztere sind **nur** nach Zeilen strukturiert und k√∂nnen von den meisten Programmen auf s√§mtlichen Betriebssystemen und nat√ºrlich auch von Python ge√∂ffnet werden. Deshalb beschr√§nken wir uns im Folgenden auf Plain Text Files. 

Am Ende jeder Zeile in einer solchen Textdatei steht ein Zeilenumbruch, der als ```"\n"``` (ausgesprochen: *backslash n* oder *newline*) codiert wird. Wenn wir eine ".txt"-Datei z.B. in Microsoft Word √∂ffnen, werden uns i.d.R. nur die Zeilenumbr√ºche, nicht aber die daf√ºr verantwortlichen Zeichen angezeigt (links im Screenshot unten). Optional k√∂nnen wir sie uns aber einblenden lassen (rechts im Screenshot unten).

![Miss_Sara_Sampson.png](attachment:b9c3bd25-178f-442c-a8ef-9d07707e619e.png)

Hier handelt es sich um die ersten paar Zeilen aus Gotthold Ephraim Lessings [Miss Sara Sampson](https://www.projekt-gutenberg.org/lessing/sampson/sampson.html). 

An den sichtbar gemachten Zeichen f√ºr Zeilenumbr√ºche sehen wir, dass die letzten beiden Redebeitr√§ge jeweils nur in einer einzigen Zeile gespeichert sind. Hier werden sie blo√ü aufgrund der horizontalen Begrenzung des Fensters auf mehreren Zeilen angezeigt.

Auch bei Python werden Zeilenumbr√ºche nur in gewissen F√§llen als Zeichen angezeigt, wie wir gleich sehen werden. Damit arbeiten k√∂nnen wir aber in jedem Fall, also auch wenn Zeilenumbr√ºche als Zeichen bei einer Ausgabe mal nicht angezeigt werden.

Das wollen wir jetzt ausprobieren. Dazu lesen wir den im Screenshot gezeigten Text sowie den Rest des ersten Aufzugs aus dem Trauerspiel in Python ein. Die Datei befindet sich im Ordner "3_Dateien/Miss_Sara_Sampson". Die simpelste Methode zum Einlesen einer Datei hei√üt wie oben erw√§hnt ```read```:

In [None]:
#um in den Ordner "3_Dateien" zu gelangen, navigieren wir mit "../" erst eine Ordnerebene nach oben
with open("../3_Dateien/Miss_Sara_Sampson/Miss_Sara_Sampson_Aufzug_1.txt", encoding="utf-8") as read_file:
    miss_sara_sampson = read_file.read()
    
print(miss_sara_sampson[0:200], "\n")

"""Tipp: im Output hier werden Zeilenumbr√ºche nicht als Zeichen angezeigt; 
will man dies forcieren, kann man die repr-Funktion verwenden"""
#print(repr(miss_sara_sampson[0:200]))

print(len(miss_sara_sampson))

Bei ```read``` wird die gesamte Textdatei in einen einzigen langen string √ºberf√ºhrt. Da der erste Aufzug recht lange ist (26960 Zeichen), geben wir hier mithilfe von Slicing nur die ersten 200 Zeichen aus. Indem Du die eckigen Klammern entfernst, kannst Du Dir den gesamten ersten Aufzug zu Gem√ºte f√ºhren (das ist nicht n√∂tig, aber f√ºrs weitere Verst√§ndnis lohnt es sich, ihn zumindest zu √ºberfliegen).

Nat√ºrlich wollen wir den Text nicht nur lesen. Daf√ºr h√§tten wir ein beliebiges Textverarbeitungsprogramm verwenden und uns das Programmieren sparen k√∂nnen. Programmieren bringt erst dann einen Vorteil, wenn wir es mit sinnvoll strukturierten Daten zu tun haben (dieses Merkmal ist hier ja u.a. durch die Zeilenumbr√ºche gegeben) und wir uns diese Strukturiertheit bei der Verarbeitung und Auswertung der Daten zunutze machen k√∂nnen. 

Machen wir es konkret und stellen uns vor, wir w√ºrden gerne s√§mtliche Redebeitr√§ge der Protagonistin Sara extrahieren. Wie bereits erw√§hnt, entspricht jeder Redebeitrag einer Zeile. Es macht in einem ersten Schritt also Sinn, dass wir das strukturelle Merkmal der Zeilenumbr√ºche ausnutzen und den Text in Zeilen (und damit in Redebeitr√§ge) unterteilen. Dazu k√∂nnten wir die string-Methode ```split``` auf ```miss_sara_sampson``` anwenden. Es gibt aber genau daf√ºr auch eine eigene Lesemethode:

In [None]:
with open("../3_Dateien/Miss_Sara_Sampson/Miss_Sara_Sampson_Aufzug_1.txt", encoding="utf-8") as read_file:
    miss_sara_sampson = read_file.readlines()

print(miss_sara_sampson[0:5])

Mit ```readlines``` werden die einzelnen Zeilen einer Textdatei als string-Elemente in eine Liste aufgenommen. √úber den ```print```-Befehl lassen wir uns die ersten f√ºnf Elemente, also die ersten f√ºnf Zeilen, ausgeben. Wir sehen, dass einige Zeilen nur aus einem ```"\n"``` bestehen (nat√ºrlich zeigten sich diese leeren Zeilen auch schon bei der vorherigen Ausgabe). Diese leeren Zeilen k√∂nnen wir mithilfe der (bisher uneingef√ºhrten) string-Methode ```isspace``` entfernen:

In [None]:
#wir iterieren √ºber alle Elemente in "miss_sara_sampson"
for line in miss_sara_sampson:
    
    #wenn das Element nur (!) aus whitespace-Zeichen (und dazu geh√∂ren Zeilenumbr√ºche) besteht...
    if line.isspace():
        
        #...dann entfernen wir das betreffende Element aus der Liste
        miss_sara_sampson.remove(line)
        
print(miss_sara_sampson[0:5])

Hat geklappt! 

Wir sehen auch, dass jeder string noch mit einem codierten Zeilenumbruch endet. Dies ist √ºberfl√ºssig, da sich die Struktur, die im Flie√ütext durch die Zeilenumbr√ºche entstand, bereits in Form der Elemente auf der Liste widerspiegelt. Die codierten Zeilenumbr√ºche k√∂nnen wir so entfernen:

In [None]:
preprocessed = []

for line in miss_sara_sampson:
    #hier entfernen wir s√§mtliche whitespace-Zeichen am rechten Rand (trailing whitespace) und h√§ngen das Resultat "preprocessed" an
    preprocessed.append(line.rstrip())

print(preprocessed[0:5])

Klappt ebenfalls.

Zeilenumbr√ºche (sowie sonstige whitespace-Zeichen) am rechten Rand k√∂nnen aber bereits beim Einlesen einer Textdatei entfernt werden. Dabei muss noch nicht mal eine Lesemethode verwendet werden. Zwar k√∂nnen wir uns die ge√∂ffnete Datei ```read_file``` nicht direkt als Zeichenkette ausgeben lassen (daf√ºr brauchen wir die Lesemethoden ```read``` oder ```readlines```; √ºberzeuge Dich selbst davon, indem Du versuchst, ```read_file``` auszugeben), aber es ist praktischerweise m√∂glich, √ºber ```read_file``` zu iterieren. Die einzelnen Elemente entsprechen ganz einfach den Zeilen:

In [None]:
# dieser Code erledigt alle Schritte von oben auf einmal

with open("../3_Dateien/Miss_Sara_Sampson/Miss_Sara_Sampson_Aufzug_1.txt", encoding="utf-8") as read_file:
    miss_sara_sampson = []
    for line in read_file:
        if line.isspace():
            continue
        miss_sara_sampson.append(line.rstrip())

for i in range(3,8):
    print(miss_sara_sampson[i])

Hier √ºberpr√ºfen wir erst, ob die Zeile nur aus whitespace besteht, und wenn ja, dann √ºberspringen wir sie (```continue```). Andernfalls h√§ngen wir die am rechten Rand von whitespace bereinigte Zeile an ```miss_sara_sampson``` an. Das Ergebnis ist das gleiche wie oben, nur haben wir uns dabei ein paar Zeilen Code gespart.

***

‚úèÔ∏è **√úbung 3:** Lies den ersten Aufzug aus Lessings [Nathan der Weise](https://www.projekt-gutenberg.org/lessing/nathan/chap002.html) ein. Die Datei befindet sich im Unterverzeichnis "Nathan_der_Weise" im Dateienordner. Finde heraus, welche der Figuren des St√ºcks (bereitgestellt in ```characters```) am h√§ufigsten erw√§hnt wird (wir unterscheiden nicht zwischen Erw√§hnungen in Redebeitr√§gen und sonst wo im Text, z.B. in der Sprecherkennzeichung).

Um Deine Fertigkeiten aus dem letzten Notebook gleich wieder einzusetzen, k√∂nntest Du dazu auch eine sortierte Frequenzliste mit allen Figuren und ihren jeweiligen Erw√§hnungsh√§ufigkeiten erstellen.

In [None]:
#In diese Zelle kannst Du den Code zur √úbung schreiben

characters = ["Sultan Saladin", "Sittah", "Nathan", "Recha", "Daja", "Tempelherr", "Derwisch", "Patriarch von Jerusalem", "Klosterbruder", "Emir"] 



***

Die Antwort ist nat√ºrlich keine gro√üe √úberraschung. üôà 

Zur√ºck zu ```miss_sara_sampson```, das ja mittlerweile eine Liste mit von trailing whitespace befreiten Zeilen darstellt. Die Liste enth√§lt neben Redebeitr√§gen auch noch Metakommentare wie *Sir William Sampson und Waitwell treten in Reisekleidern herein.* (Index 3). 

Um nun Saras Redebeitr√§ge zu extrahieren, k√∂nnen wir uns den strukturellen Umstand zunutze machen, dass am Anfang aller Redebeitr√§ge der Name der Figur gefolgt von einem Punkt steht:

In [None]:
saras_turns = []

for turn in miss_sara_sampson:
    if turn.startswith("Sara."): 
        saras_turns.append(turn)

#hier geben wir zur √úberpr√ºfung die Redebeitr√§ge mit Indizes 10, 11, 12, 13, 14 aus
for i in range(10,15):
    print(saras_turns[i], "\n")

print(len(saras_turns))

```startswith``` tut ganz klar seinen Dienst. 

### Exkurs: Die Wahrheitsmatrix

An dieser Stelle lohnt sich nochmal ein Blick in ```miss_sara_sampson```, zur Vergewisserung, dass wir mit obiger Bedingung auch wirklich alle Redebeitr√§ge von Sara extrahiert haben. Es k√∂nnte ja z.B. sein, dass ihr Name vor einem Redebeitrag aus welchem Grund auch immer kleingeschrieben ist ("sara.") oder aber, dass zwischen ihrem Namen und dem Punkt eine Klammer mit Metakommentaren steht. 

Und tats√§chlich: ein Redebeitrag beginnt so: "Sara (sie setzt sich)." (Index 71 in ```miss_sara_sampson```). Nach eingehender Pr√ºfung wissen wir, dass dies auch der einzige Redebeitrag ist, der nicht von ```turn.startswith("Sara.")``` "eingefangen" wird. Wir k√∂nnten nun etwas unelegant die zus√§tzliche Bedingung ```or turn.startswith("Sara (sie setzt sich).")``` aufstellen. 

Um sicherzustellen, dass der Code wiederverwendbar ist (z.B. beim zweiten Aufzug), w√§hlen wir den eleganteren Weg der regul√§ren Ausdr√ºcke (engl.: *regular expressions*, abgek√ºrzt: *RegEx*). Regul√§re Ausdr√ºcke sind ein √§u√üerst praktisches Werkzeug, das wir uns im n√§chsten Notebooks im Detail anschauen. Kurz gesagt: Wir definieren hier *einen* regul√§ren Ausdruck (```pattern```), der sowohl Redebeitr√§ge mit als auch solche ohne Metakommentar abdeckt. L√§sst sich der definierte regul√§re Ausdruck wie eine Schablone √ºber den Anfang eines Elements in  ```miss_sara_sampson``` legen, dann haben wir einen sog. *match* und wir h√§ngen das Element an ```saras_turns``` an. Wie wir sehen, erhalten wir dadurch 23 statt bisher 22 Redebeitr√§ge zur√ºck:

In [None]:
import re

saras_turns = []

#sieht kryptisch aus ü§Ø und Du musst diesen regul√§ren Ausdruck im Moment noch nicht nachvollziehen k√∂nnen
pattern = r"Sara( \S*)?."

for turn in miss_sara_sampson:
    if re.match(pattern, turn):
        saras_turns.append(turn)
        
for i in range(5):
    print(saras_turns[i], "\n")

print(len(saras_turns))

Das √úberpr√ºfen, ob wir mit der aufgestellten Bedingung auch wirklich alle wahren Redebeitr√§ge von Sara abdecken, ist ein sehr wichtiger Schritt. Konkret verhindern wir dadurch sog. *false negatives* im Sinne einer [Wahrheitsmatrix](https://de.wikipedia.org/wiki/Beurteilung_eines_bin√§ren_Klassifikators#Wahrheitsmatrix:_Richtige_und_falsche_Klassifikationen):

|              | ein Redebeitrag von Sara                 | kein Redebeitrag von Sara                |
|--------------|------------------------------------------|------------------------------------------|
| Test positiv | <font color=green>*true positive*</font> | <font color=red>*false positive*</font>  |
| Test negativ | <font color=red>*false negative*</font>  | <font color=green>*true negative*</font> | 

*False negatives* sind F√§lle, die in Wahrheit Redebeitr√§ge von Sara sind, die aber f√§lschlicherweise nicht als solche erkannt wurden. Mit anderen Worten: der Test (die Bedingung, die wir aufgestellt haben) fiel negativ aus (die Bedingung ergab ```False```), aber dieses Testresultat ist falsch. *True*/*False* bezieht sich bei allen vier Begriffspaaren jeweils auf die Richtigkeit des Testresultats und *positive*/*negative* auf das gef√§llte Testresultat.

Konsequenterweise m√ºssen wir umgekehrt sicherstellen, dass wir mit der aufgestellten Bedingung nicht √ºbers Ziel hinaus schie√üen und *false positives* "einfangen", also Redebeitr√§ge, die nicht von Sara sind, aber f√§lschlicherweise als solche erkannt wurden. Tats√§chlich sind das erste und dritte Element in ```saras_turns``` (Indizes 0/2) keine Redebeitr√§ge von Sara, sondern blo√ü Metakommentare:

In [None]:
#dies sind die beiden false positives
print(saras_turns[0:3:2])

Ein Blick auf alle Elemente in ```saras_turns``` verr√§t, dass diese die einzigen beiden *false positives* sind.

Wir m√ºssen also eine zweite Bedingung aufstellen, um diese beiden F√§lle auszuschlie√üen. Sie haben gemeinsam, dass nach "Sara." "Mellefont." steht. Bevor wir eine entsprechende Ausschlussbedingung aufstellen, m√ºssen wir √ºberpr√ºfen, ob dies nicht auch auf wahre Redebeitr√§ge (*true positives*) zutrifft (es ist ja denkbar, dass Sara einen Beitrag mit "Mellefont." anf√§ngt). Dies ist aber nicht der Fall.

Die zweite Bedingung stellen wir so auf: Das zweite Wort (Index 1) auf einer Liste mit allen W√∂rtern im jeweiligen ```turn``` (die W√∂rterliste erhalten wir mittels ```split```) darf nicht (```!=```, vgl. Vergleichsoperatoren ) "Mellefont." sein. Wenn dies wahr ist, und die erste Bedingung ebenfalls (```and```), dann h√§ngen wir den ```turn``` an ```saras_turns``` an.

In [None]:
saras_turns = []

pattern = r"Sara( \S*)?."

for turn in miss_sara_sampson:
    if re.match(pattern, turn) and turn.split()[1] != "Mellefont.":
        saras_turns.append(turn)

print(len(saras_turns))

#for turn in saras_turns:
    #print(turn, "\n")

Eine letzte √úberpr√ºfung zeigt, dass wir damit wirklich alle wahren Redebeitr√§ge von Sara (alle *true positives*) extrahiert haben (um das Bild zu vervollst√§ndigen: alle nicht extrahierten Elemente sind die *true negatives*). 

Dieses Beispiel lehrt uns, dass wir iterativ vorgehen m√ºssen, wenn wir mit strukturellen Merkmalen arbeiten. Selten denken wir von Anfang an an alle Ausnahmen, die beachtet werden m√ºssen, um wirklich das gew√ºnschte Ergebnis zu errechnen. 

√úbrigens haben wir f√ºr die letzte Bedingung keine besonders elegante L√∂sung gew√§hlt. Sie schlie√üt nur spezifisch Mellefont aus und keine weiteren Figuren. Gleichzeitig deckt sie wie gesagt theoretisch auch F√§lle ab, wo "Mellefont." das erste Wort eines Redebeitrags von Sara ist. W√§hrend wir es bei der ersten zus√§tzlichen Bedingung noch mit einfacher fassbaren strukturellen Merkmalen (n√§mlich den optionalen Metakommentaren in **Klammern**) zu tun hatten, zeigen sich hier die Grenzen von Datenfilterung basierend auf strukturellen Merkmalen. Denn "Mellefont." besteht strukturell aus Buchstaben und einem Punkt, wie sie auch in wahren Redebeitr√§gen von Sara vorkommen. Neben der iterativen Herangehensweise, sind in solchen F√§llen also auch sehr spezifische und vermeintlich unelegante Bedingungen in Ordnung.

***

‚úèÔ∏è **√úbung 4:** Im Gegensatz zu Miss Sara Sampson ist Nathan der Weise etwas anders formatiert, z.B. verteilen sich Redebeitr√§ge z.T. √ºber mehrere Zeilen. 

Lies den ersten Aufzug aus Nathan der Weise abermals ein. Schaue Dir die Formatierung des Textes genau an, um ein strukturelles Merkmal zu finden, anhand dessen Du eine Liste mit zusammengeh√∂rigen Redebeitr√§gen und Metakommentaren erstellen kannst. Ein √ºber mehrere Zeilen verteilter Redebeitrag oder Metakommentar soll jeweils in ein Element einflie√üen. 

Bereinige anschlie√üend die Liste von allem, was kein Redebeitrag darstellt. Auch hierf√ºr musst Du Dir die Liste gut anschauen, um ein strukturelles Merkmal zu identifizieren, anhand dessen Du die "Spreu vom Weizen" trennen kannst. Sollte sich ein Metakommentar innerhalb eines Redebeitrags befinden, kannst Du dies ignorieren. Stelle durch einen iterativen Ansatz sicher, dass Du am Ende wirklich alle Redebeitr√§ge und nur Redebeitr√§ge auf der Liste hast (also die *true positives*).

Dir steht wiederum eine Liste mit Figuren zur Verf√ºgung.

In [None]:
#In diese Zelle kannst Du den Code zur √úbung schreiben

characters = ["Sultan Saladin", "Sittah", "Nathan", "Recha", "Daja", "Tempelherr", "Derwisch", "Patriarch von Jerusalem", "Klosterbruder", "Emir"] 



***

Nun haben wir verschiedene Techniken zum Einlesen von Textdateien kennengelernt. Hier folgt eine kurze Zusammenfassung, wann Du welche Technik anwenden kannst:

- ```read``` √ºberf√ºhrt die gesamte Datei in einen einzigen string
- ```readlines``` √ºberf√ºhrt die einzelnen Zeilen der Datei in Elemente auf einer Liste
- ```for line in read_file``` iteriert √ºber die ge√∂ffnete Datei (ohne jegliche Lesemethode), wobei ```line``` einer Zeile in der Datei entspricht
- ```strip``` (meistens spezifisch ```rstrip```) entfernt (trailing) whitespace, insbesondere Zeilenumbr√ºche
- ```isspace``` in einem ```if```-Statement mit ```continue``` √ºberspringt leere Zeilen

Schauen wir uns nun an, wie wir Text in eine Datei schreiben k√∂nnen. Wir arbeiten daf√ºr mit dem Ergebnis der letzten √úbung, also mit der Liste an Redebeitr√§gen im ersten Aufzug von Nathan der Weise, weiter. Damit wir auf dem gleichen Stand sind, steht in der n√§chsten Zelle eine m√∂gliche L√∂sung der Aufgabe. Wenn Du sie ausf√ºhrst, siehst Du bereits anhand der ersten f√ºnf Redebeitr√§ge, dass diese *in sich* unterschiedlich formatiert sind. Zum Teil folgt auf den Figurenamen nach dem Punkt ein Zeilenumbruch, zum Teil mehrere Leerschl√§ge.

In [None]:
characters = ["Sultan Saladin", "Sittah", "Nathan", "Recha", "Daja", "Tempelherr", "Derwisch", "Patriarch von Jerusalem", "Klosterbruder", "Emir"] 

with open("../3_Dateien/Nathan_der_Weise/Nathan_der_Weise_Aufzug_1.txt", encoding="utf-8") as read_file:
    nathan_der_weise = read_file.read()

belongs_together = nathan_der_weise.split("\n\n")

actual_turns = []

for element in belongs_together:
    for character in characters:
        if element.startswith(character + "."):
            actual_turns.append(element)

for i in range(5):
    print(actual_turns[i], "\n")

Unser Ziel ist es, die Redebeitr√§ge in einheitlicher Formatierung in eine externe Datei zu schreiben. Der folgende Code √ºbernimmt die einheitliche Formatierung. Lies die Kommentare aufmerksam, um den Code nachzuvollziehen. 

In [None]:
#am Ende h√§ngen wir die vereinheitlichten Redebeitr√§ge an diese Liste an
standardized_turns = []

#wir iterieren √ºber die einzelnen Redebeitr√§ge in "actual_turns"
for turn in actual_turns:
    
    """Als N√§chstes splitten wir den 'turn' ein einziges Mal beim ersten Punkt, der ja auf den 
    Figurennamen folgt (damit wir nur einmal splitten und nicht bei jedem Punkt, setzen wir den
    optionalen Parameter maxsplit auf 1). Dadurch entsteht eine Liste, wobei das erste Element 
    (mit Index 0) der Figurenname ist. Diesen weisen wir 'turn_speaker' zu."""
    turn_speaker = turn.split(".", maxsplit=1)[0]
    
    #das zweite Element (mit Index 1) ist ja der eigentliche Redebeitrag, wir weisen ihn "turn_words" zu
    turn_words = turn.split(".", maxsplit=1)[1]
    
    """genau dieser Redebeitrag enth√§lt nun leading whitespace (was sowohl Zeilenumbr√ºche als auch 
    Leerschl√§ge umfasst). Wir entfernen diese und weisen das Resultat 'turn_words_stripped' zu"""
    turn_words_stripped = turn_words.lstrip()
    
    #nun konkatenieren wir einheitlich Figurennamen und Redebeitrag mit einem Doppelpunkt und Zeilenumbruch dazwischen
    standardized_turn = turn_speaker + ":\n" + turn_words_stripped
    
    """den standardisierten Redebeitrag h√§ngen wir an 'standardized_turns' an"""
    standardized_turns.append(standardized_turn)
    
    #s√§mtliche Schritte in einem Statement s√§he √ºbrigens so aus:
    #standardized_turns.append(turn.split(".", 1)[0] + ":\n" + turn.split(".", 1)[1].lstrip())
    
for i in range(5):
    print(standardized_turns[i], "\n")

Das schaut doch gleich viel besser aus. Zeilenumbr√ºche innerhalb der Redebeitr√§ge haben wir √ºbrigens unber√ºhrt gelassen, schlie√ülich handelt es sich um ein dramatisches Gedicht. 

Nun wollen wir die Redebeitr√§ge in eine externe Datei schreiben. Wie oben erkl√§rt, √∂ffnen wir dazu die gew√ºnschte Datei im Schreibmodus (```"w"```). Da die unten angegebene Datei noch nicht im Verzeichnis existiert, wird sie automatisch neu geschaffen. Anschlie√üend iterieren wir √ºber ```standardized_turns``` und schreiben Element f√ºr Element (Zeile f√ºr Zeile) in die ge√∂ffnete Datei (```write```). Wichtig: die Zeilenumbr√ºche m√ºssen wir explizit reinschreiben:

In [None]:
"""hier geben wir (in Form einer Variablen) einerseits den Speicherort an, gleichzeitig geben wir der Datei
auch einen Namen; bei Textdateien h√§ngen wir stets '.txt' als Dateisuffix an!"""
with open("../3_Dateien/Output/Nathan_der_Weise_Aufzug_1_standardisiert.txt", "w", encoding="utf-8") as write_file:
    for element in standardized_turns:
        
        """da es auch innerhalb der Redebeitr√§ge Zeilenumbr√ºche gibt, schreiben wir
        wie in der urspr√ºnglichen Datei zwei Zeilenumbr√ºche nach jedem Redebeitrag"""
        write_file.write(element + "\n\n")

Nun solltest Du die neue Datei im angegebenen Verzeichnis vorfinden. Du kannst sie entweder wieder in Python einlesen, oder mit einem Textverarbeitungsprogramm auf Deinem Computer √∂ffnen.

***

‚úèÔ∏è **√úbung 5:** Bisher haben wir nur mit dem ersten Aufzug aus Miss Sara Sampson gearbeitet. Das Trauerspiel besteht aber aus f√ºnf Aufz√ºgen, die sich allesamt im gleichen Verzeichnis wie der erste Aufzug befinden. 

√ñffne eine neue Textdatei mit Namen "Miss_Sara_Sampson_komplett.txt" im Verzeichnis "Output" und schreibe alle f√ºnf Aufz√ºge in der richtigen Reihenfolge in diese Datei.

Anstatt jede Datei √ºber ihren Pfad einzeln zu √∂ffnen, kannst Du die oben bereits vorgestellte ```listdir```-Funktion des ```os```-Moduls verwenden. Als Argument √ºbergibst Du ihr den Pfad zum betreffenden Verzeichnis. Du kriegst eine Liste mit den darin befindlichen Dateien und Unterverzeichnissen (jeweils als string) zur√ºck. √úber diese Liste kannst Du dann wie gewohnt iterieren.

In [None]:
#In diese Zelle kannst Du den Code zur √úbung schreiben




***

Soviel zu Textdateien. 

Wenden wir uns den tabellarischen Dateien zu.

## Tabellarische Dateien

Tabellarische Dateien kennst Du von Microsoft Excel (oder vergleichbaren Programmen). An der Benutzeroberfl√§che sind sie in Spalten und Zeilen organisiert, wie wir hier am Beispiel einer Tabelle √ºber die [zehn fl√§chengr√∂√üten Gemeinden Deutschlands](https://de.wikipedia.org/wiki/Liste_der_fl√§chengr√∂√üten_Gemeinden_Deutschlands) sehen:

![Fl√§chengr√∂sste_Gemeinden_Tabelle.png](attachment:20e93bff-a7bf-4717-bb17-e30f7bbe720d.png)

Der einzige strukturelle Unterschied zu Textdateien ist, dass es neben Zeilen auch eine zweite Strukturdimension gibt, n√§mlich die Spalten. 

"Hinter den Kulissen" werden die einzelnen Spalten durch ein Trennzeichen (verwirrenderweise teils *separator*, teils *delimiter* auf Englisch) strukturiert. Bei dieser Datei sind dies Semikola (Strichpunkte), wie wir hier sehen:

![Fl√§chengr√∂sste_Gemeinden_roh.png](attachment:3cd6c5e1-0540-4a54-9157-ddad9a010e69.png)

Die Zeilen wiederum werden wie bei Textdateien durch Zeilenumbr√ºche strukturiert, wobei die daf√ºr zust√§ndigen Zeichen im Screenshot oben einmal mehr nicht sichtbar sind.

Wenn wir tabellarische Dateien einlesen, m√ºssen wir wissen, mithilfe welchen Trennzeichens sie auf der Spaltenebene strukturiert sind, damit die Daten einer Zeile an den richtigen Orten in Spalten unterteilt werden. Neben Semikola (```";"```) sind Kommata (```","```) oder Tabs (```"\t"```) √ºbliche Trennzeichen. Wenn, wie oben, Semikola das Trennzeichen sind, k√∂nnen die anderen √ºblichen Trennzeichen ohne Weiteres zwischen den Semikola vorkommen (siehe z.B. die Kommata in den Fl√§chenangaben). Auch beim Schreiben von tabellarischen Dateien m√ºssen bzw. k√∂nnen wir spezifieren, welches Trennzeichen verwendet werden soll.

Zur Arbeit mit tabellarischen Daten (sowie generell f√ºr fortgeschrittene Datenanalyse) gibt es die Bibliothek ```pandas```, der das √ºbern√§chste Notebook gewidmet ist. Hier schauen wir uns das ```csv```-Modul an, das sich f√ºr den einfachen Umgang mit tabellarischen Daten eignet.

### Das ```csv```-Modul

Wie √ºblich importieren wir das ```csv```-Modul zu Beginn. Ebenfalls setzen wir stets "csv." vor den Namen von Funktionen aus diesem Modul (vgl. oben zum ```os```-Modul).

Die Datei mit den fl√§chengr√∂√üten Gemeinden lesen wir nat√ºrlich auch mittels ```open```, eingebettet in ein ```with```-Statement, ein. Das ```read_file``` √ºbergeben wir zusammen mit dem korrekten Trennzeichen (```delimiter=";"```) der ```reader```-Funktion (beachte die "agentive" Benennung von Funktionen im ```csv```-Modul). Standardtrennzeichen ist √ºbrigens das Komma (der Name des Moduls ist n√§mlich eine Abk√ºrzung f√ºr *comma-separated values*), das wie immer nicht angegeben werden muss. 

Die ```reader```-Funktion gibt uns nun nicht ein gew√∂hnliches Python-Objekt zur√ºck (etwa einen string oder eine Liste wie beim Textinput), sondern ein ```_csv.reader object```, das wir mit ```data``` referenzieren. √úber dieses ```_csv.reader object``` k√∂nnen wir wie gewohnt iterieren und die einzelnen Zeilen einer Liste anh√§ngen. Wir m√ºssen das innerhalb der Einr√ºckung machen, da  das ```_csv.reader object``` zusammen mit ```read_file``` wieder geschlossen wird, sobald wir die Einr√ºckung verlassen:

In [None]:
import csv

with open("../3_Dateien/Tabellarische_Daten/Liste_der_fl√§chengr√∂ssten_Gemeinden_Deutschlands.csv", encoding="utf-8") as read_file:
    
    data = csv.reader(read_file, delimiter=";")
    biggest_municipalities = []
    
    for row in data:
        biggest_municipalities.append(row)

for i in range(6):
    print(biggest_municipalities[i])

***

‚úèÔ∏è **√úbung 6:** Finde heraus, wieviele der 100 fl√§chengr√∂√üten Gemeinden zu jedem der 16 Bundesl√§nder geh√∂ren. Du kannst direkt mit ```biggest_municipalities``` weiterarbeiten. Dir steht ein dictionary mit Bundesl√§ndern zur Verf√ºgung. Ziel ist es, den Wert (jetzt noch 0 f√ºr alle Bundesl√§nder) f√ºr jedes Bundesland korrekt zu berechnen.

In [None]:
#In diese Zelle kannst Du den Code zur √úbung schreiben

federal_states = {'Baden-W√ºrttemberg': 0, 'Bayern': 0, 'Berlin': 0, 'Brandenburg': 0, 'Bremen': 0, 'Hamburg': 0, 'Hessen': 0, 
                'Mecklenburg-Vorpommern': 0, 'Niedersachsen': 0, 'Nordrhein-Westfalen': 0, 'Rheinland-Pfalz': 0, 'Saarland': 0, 
                'Sachsen': 0, 'Sachsen-Anhalt': 0, 'Schleswig-Holstein': 0, 'Th√ºringen': 0}


***

Sehr gut ‚Äì in Brandenburg befinden sich also die meisten der 100 fl√§chengr√∂√üsten Gemeinden Deutschlands.

Das dictionary ```federal_states``` wollen wir nun als Tabelle extern speichern. Die Tabelle wird ganz einfach aus zwei Spalten sowie 17 Zeilen (1 Zeile mit Spalten√ºberschriften + 16 Bundesl√§nder) bestehen. 

Der Output von tabellarischen Dateien funktioniert wie gewohnt in einem ```with```-Statement √ºber die ```open```-Funktion mit dem Parameter ```"w"```. Nun kommt das Pendant zu ```reader```, n√§mlich ```writer```, zum Einsatz, dies jedoch auf ziemlich unintuitive Art. Wenn es Dich interessiert, wird im Folgenden erkl√§rt, was da genau geschieht. Andernfalls ist es auch in Ordnung, die Syntax unten einfach zu copy-pasten, wann immer Du tabellarische Daten schreiben musst.

1. Wir initialisieren ein ```_csv.writer object```, indem wir der ```writer```-Funktion die zu beschreibende Datei (```write_file```) als Argument √ºbergeben. Das ```_csv.writer object``` weisen wir der Variable ```federal_states_writer``` zu. Was wir nun in dieses Objekt reinschreiben, landet am Schluss in der externen Datei.
2. Wir wenden die Methode ```writerow``` auf das ```_csv.writer object``` an, um unsere Daten Zeile f√ºr Zeile zu schreiben:
    - wir schreiben die Spalten√ºberschriften (```header```) in die erste Zeile
    - wir iterieren danach √ºber ```federal_states``` und schreiben Zeile f√ºr Zeile in ```federal_states_writer```

In [None]:
#damit wir auf dem gleichen Stand sind, wird das dictionary mit den korrekten Werten pro Schl√ºssel hier nochmal initialisiert
federal_states = {'Baden-W√ºrttemberg': 1, 'Bayern': 5, 'Berlin': 1, 'Brandenburg': 30, 'Bremen': 1, 'Hamburg': 1, 'Hessen': 2, 
                  'Mecklenburg-Vorpommern': 0, 'Niedersachsen': 15, 'Nordrhein-Westfalen': 13, 'Rheinland-Pfalz': 0, 
                  'Saarland': 0, 'Sachsen': 5, 'Sachsen-Anhalt': 24, 'Schleswig-Holstein': 1, 'Th√ºringen': 1}

with open("../3_Dateien/Output/Anzahl_der_groessten_Gemeinden_pro_Bundesland.csv", "w", encoding="utf-8") as write_file:
    
    federal_states_writer = csv.writer(write_file, delimiter=";")
    
    header = ["Bundesland", "Anzahl der 100 fl√§chengr√∂√üten Gemeinden"]
    
    federal_states_writer.writerow(header)
    
    for row in federal_states.items():
        federal_states_writer.writerow(row)

Nun kennen wir die zwei grundlegenden Techniken zum Input bzw. Output von tabellarischen Dateien.

Vom Input externer Dateien wenden wir uns nun einer anderen Form des Inputs zu: User-Input in interaktiven Programmen.

## User-Input f√ºr interaktive Programme

Wie wir bereits im dritten Notebook gesehen haben, ist es ganz einfach, User-Input in Programme einzubauen. Wir verwenden daf√ºr die ```input```-Funktion und √ºbergeben ihr einen sog. *prompt* als string. Dieser *prompt* ist die Aufforderung, die der Benutzerin angezeigt wird, sobald Python die Code-Zeile mit der ```input```-Funktion erreicht. Das, was die Benutzerin nun eingibt (und durch Dr√ºcken von Enter "abschickt"), weisen wir direkt einer Variablen zu. 

Python interpretiert den Input standardm√§√üig als string. Wenn wir z.B. eine Ganzzahl erwarten (und der anschlie√üende Code darauf ausgerichtet ist), m√ºssen wir den Input vor der Variablenzuweisung entsprechend casten (s.u.).

F√ºhre die folgende Zelle aus und agiere im Anschluss als Benutzer:in. Eventuell musst Du erst ins Antwortfeld unter der Frage klicken, sodass der Cursor blinkt.

In [None]:
name = input("Wie hei√üt Du?\n")

#Handelt es sich um einen anderen Datentyp als string muss der Input gecastet werden
age = int(input("Und wie alt bist Du?\n"))

#ohne Casting w√ºrde diese bedingte Anweisung fehlschlagen, da strings nicht gr√∂√üer gleich 18 sein k√∂nnen
if age >= 18:
    print("Freut mich, ", name, ". Du darfst nat√ºrlich in den Club! üéâ", sep="")
else:
    print("Freut mich, ", name, ". Du darfst leider nicht in den Club! üò¢", sep="")

Solltest Du im Folgenden beim Ausf√ºhren einer Code-Zelle auf die Fehlermeldung ```Cell not executed due to pending input``` sto√üen, lies im dritten Notebook nach, woran das liegt.

Das ist auch schon alles, das wir √ºber User-Input wissen m√ºssen. 

Nun k√∂nnen wir uns unserem Anwendungsfall f√ºr dieses Notebook zuwenden.

***

## üîß Anwendungsfall: Einen Gedankenprotokollanten programmieren 

Deine Aufgabe ist es also, ein kleines interaktives Programm zu schreiben, mit dessen Hilfe eine Benutzerin schlaue Gedanken protokollieren kann. Hier folgt nochmal das gleiche Video vom Anfang:

In [None]:
#F√ºhre diese Zelle aus, um das Video einzubetten
from IPython.display import Video
Video("../3_Dateien/Grafiken_und_Videos/Gedankenprotokollant.mov", width=700)

Erg√§nzend zu diesem Video siehst Du unten eine Liste an einfachen Schritten, die ‚Äì korrekt implementiert ‚Äì die Aufgabe l√∂sen und das im Video gezeigte Endprodukt verwirklichen. Diese einzelnen Schritte entsprechen dem zweiten Punkt beim algorithmischen Denken (nach der initialen Problemanalyse und vor der konkreten Implementierung).

√úberlege Dir f√ºr jeden einzelnen Schritt, wie Du ihn konkret implementieren kannst, d.h. welche Funktionen oder Methoden sowie Kontrollstrukturen Du daf√ºr ben√∂tigst. Schreibe zu jedem Punkt alle Techniken auf, mithilfe welcher Du den jeweiligen Punkt konkret in Code umsetzen kannst. Ignoriere dabei erst einmal, wie und in welcher Reihenfolge Du die Schritte anschlie√üend miteinander verbindest:

1. Die Benutzerin wird gegr√º√üt und ihr wird erkl√§rt, welche Funktionen das Programm ihr bietet.
2. Die Benutzerin wird aufgefordert, anzugeben, in welchem Dokument sie ihre(n) Gedanke(n) festhalten will. Handelt es sich um ein noch nicht existierendes Dokument, so wird es f√ºr sie geschaffen. Existiert das Dokument bereits, so soll(en) ihr(e) Gedanke(n) an dessen Ende geh√§ngt werden.
3. Die Benutzerin wird aufgefordert, ihren Gedanken einzugeben.
4. Der Gedanke wird in das gew√§hlte Dokument geschrieben.
5. Die Benutzerin wird zur Entscheidung aufgefordert, ob sie einen weiteren Gedanken im selben Dokument festhalten will oder ob sie das Programm verlassen will.
    1. Will die Benutzerin einen weiteren Gedanken festhalten, so soll das Programm zu Schritt 3 zur√ºckspringen.
    2. Will die Benutzerin das Programm verlassen, so soll sie verabschiedet werden.

Du kannst nun w√§hlen, ob Du von hier aus selbst weiter machen willst. Der n√§chste Arbeitsschritt besteht nat√ºrlich darin, die einzelnen Techniken *in der richtigen Reihenfolge* in Code zu implementieren. Verwende daf√ºr die folgende Code-Zelle. Sollte Dir nicht zu allen f√ºnf Schritten eine m√∂gliche Technik einfallen, so findest Du nach der Code-Zelle m√∂gliche Implementierungsl√∂sungen f√ºr jeden einzelen Schritt.

In [None]:
# In diese Zelle kannst Du den Code zur √úbung schreiben.






















Hier siehst, wie die einzelnen Schritte implementiert werden k√∂nnen.

1. Die Benutzerin wird gegr√º√üt und ihr wird erkl√§rt, welche Funktionen das Programm ihr bietet. <br><br>
    - ```print("Gru√ü")``` bietet sich an, um die Benutzerin initial zu gr√º√üen.
    - Alternativ k√∂nnte man den Gru√ü auch in den ```input```-*prompt* von Schritt 2 integrieren (```input("Gru√ü + prompt")```; so wurde das im Video umgesetzt), an der Benutzeroberfl√§che sind beide Alternativen gleichwertig.
    - Wie stellen wir sicher, dass der Gru√ü nur wirklich am Anfang angezeigt wird, und nicht nochmal, wenn die Benutzerin einen weiteren Gedanken festhalten will (5.A.)? Wir f√ºhren eine Variable ```first_time``` ein und setzen sie ganz am Anfang auf `True` (```first_time = True```); das ```print("Gru√ü")```-Statement bzw. das kombinierte ```input("Gru√ü + prompt")```-Statement f√ºhren wir nur aus, wenn ```first_time``` `True` ist (```if first_time == True```); nach dem ersten Durchlauf setzen wir ```first_time``` auf `False` (```first_time = False```), der Gru√ü wird somit nicht mehr ausgegeben.<br><br>
2. Die Benutzerin wird aufgefordert, anzugeben, in welchem Dokument sie ihre(n) Gedanke(n) festhalten will. Handelt es sich um ein noch nicht existierendes Dokument, so wird es f√ºr sie geschaffen. Existiert das Dokument bereits, so soll(en) ihr(e) Gedanke(n) an dessen Ende geh√§ngt werden.
    - Den Namen des gew√ºnschten Dokuments fragen wir √ºber ```input(prompt)``` ab (ggf. mit dem Gru√ü davor, s.o.), das Resultat weisen wir einer Variablen namens ```file_name``` zu.
    - Wie unter 1. erw√§hnt, soll dieser ```input```-Befehl nur bedingt ausgef√ºhrt werden, n√§mlich nur  wenn ```first_time``` `True` ist (```if first_time == True```).
    - Das gew√ºnschte Dokument √∂ffnen wir in einem ```with```-Statement mittels ```open``` im *append*-Modus (```"a"```) und ```"encoding=utf-8"```. Der *append*-Modus schafft das gew√ºnschte Dokument, sollte es noch nicht existieren. Wenn es bereits existiert, wird der neue Inhalt an das gew√ºnschte Dokument angeh√§ngt. Wichtig: als Pfad √ºbergeben wir der ```open```-Funktion einen konkatenierten string bestehend aus dem Pfad zum Verzeichnis (das kannst Du selbst ausw√§hlen), dem ```file_name``` sowie dem Suffix ".txt". Das ge√∂ffnete Dokument weisen wir wie √ºblich einer Variablen zu: ```as write_file```.<br><br>
3. Die Benutzerin wird aufgefordert, ihren Gedanken einzugeben.
    - Daf√ºr verwenden wir wieder die ```input```-Funktion und weisen das Resultat der Variablen ```thought``` zu. Es spielt keine Rolle, ob wir dies vor oder einger√ºckt unter dem ```with```-Statement (s.o.) tun.<br><br>
4. Der Gedanke wird in das gew√§hlte Dokument geschrieben.
    - Einger√ºckt unter dem ```with```-Statement wenden wir die ```write```-Methode auf ```write_file``` an, in die Klammern setzen wir ```thought``` sowie einen finalen Zeilenumbruch. ```thought``` wird jetzt also auf eine eigene Zeile in ```write_file``` geschrieben. Durch das Verlassen der Einr√ºckung des ```with```-Statements wird das Dokument mit der neuen Zeile gespeichert und geschlossen.<br><br>
5. Die Benutzerin wird zur Entscheidung aufgefordert, ob sie einen weiteren Gedanken im selben Dokument festhalten will oder ob sie das Programm verlassen will.
    - Hier kommt nochmal ```input``` zum Einsatz. Da die Benutzerin ihre Entscheidung nicht √ºber eine bin√§re "Ja/Nein"-Taste mitteilen kann, empfiehlt es sich, sie zur Eingabe eines "Y" (oder sonst eines bestimmten Buchstaben) aufzufordern, sollte sie noch einen weiteren Gedanken festhalten wollen. Andernfalls soll sie irgendeine andere Eingabe t√§tigen. Ihre Eingabe weisen wir der Variablen ```repeat``` zu.
     - Sp√§testens an dieser Stelle f√§llt uns auf, dass wir den gesamten vorherigen Code in eine Schleife einbauen m√ºssen. N√§mlich in eine (potentielle) Endlosschlaufe, die nur dann abgebrochen wird, wenn sich die Benutzerin dazu entscheidet, *keinen* weiteren Gedanken festzuhalten (5.B.). Daf√ºr verwenden wir ```while True``` (vgl. drittes Notebook), eine Schleife, die sich unendlich wiederholt, es sei denn, Python trifft auf ein ```break```-Statement.
     - Am Ende des Codeblocks innerhalb der ```while```-Schleife m√ºssen wir also pr√ºfen, ob ```repeat``` "Y" (oder einem anderen festgelegten Zeichen) enspricht und abh√§ngig davon, die Schleife abbrechen (```break```) oder nicht.<br><br>
    1. Will die Benutzerin einen weiteren Gedanken festhalten, so soll das Programm zu Schritt 3 zur√ºckspringen.
        - In diesem Fall m√ºssen wir nichts weiter machen, die Schleife l√§uft ja von alleine weiter. Einzig wichtig ist, dass der Gru√ü sowie die Aufforderung nach dem Namen des gew√ºnschten Dokuments (Schritt 1 und 2) nicht wiederholt werden, indem wir hier ```first_time = False``` setzen.
        <br><br>
    2. Will die Benutzerin das Programm verlassen, so soll sie verabschiedet werden.
        - Entspricht ```repeat``` nicht "Y" (```if repeat != "Y"```), dann verabschieden wir uns von der Benutzerin √ºber eine ```print```-Ausgabe und brechen die Endlossschleife ab (```break```).
        
Solltest Du den Anwendungsfall nicht bereits gel√∂st haben, versuche es nun mithilfe all dieser Techniken in der Code-Zelle oben.

***

Damit sind wir in der Lage, unsere Python-Programme √ºber User-Input interaktiv zu gestalten. üòé

Abschlie√üend schauen wir uns noch die vermutlich am h√§ufigsten benutzte Funktion, n√§mlich ```print```, genauer an.

## Die ```print```-Funktion im Detail

```print``` gibt bekanntlich null, ein oder mehrere Objekte als string aus:

In [None]:
number = 5

print() #print ohne Argument gibt einfach eine leere Zeile aus
print("Hier wird ein Objekt ausgegeben")
print("Hier werden zwei Objekte", "ausgegeben.")
print("Hier", "werden", number, "Objekte", "ausgegeben.")

Am dritten und vierten Beispiel sehen wir, dass ```print``` die einzelnen Objekte mit einem Leerschlag dazwischen konkateniert. Verantwortlich daf√ºr ist der ```sep```-Parameter, der standardm√§√üig einem Leerschlag entspricht, aber nat√ºrlich anders spezifiziert werden kann:

In [None]:
print("Leer", "schlag", sep="")
print(13, 10, 1988, sep=".", end=" / ") #deutsche Schreibweise
print(10, 13, 1988, sep="-") #US-amerikanische Schreibweise

Im zweiten Beispiel haben wir zudem einen ```end```-Parameter spezifiziert. √úberleg Dir f√ºr einen Augenblick, was hier der Standardwert sein k√∂nnte.

Genau, ein Zeilenumbruch.

Der letzte optionale Parameter der ```print```-Funktion hei√üt ```file```. Statt das/die √ºbergegebe(n) Argument(e) standardm√§√üig im Outputfeld von JupyterLab auszugeben, k√∂nnen wir den Output in eine externe Datei *umleiten*. Wichtig dabei ist, dass die Datei ge√∂ffnet ist:

In [None]:
with open("../3_Dateien/Output/print_file.txt", "a") as write_file:
    print("So k√∂nnen wir in eine externe Datei schreiben.", file=write_file)
    
    #Dabei besteht √ºbrigens kein Unterschied zur oben kennengelernten write-Methode
    #write_file.write("So k√∂nnen wir in eine externe Datei schreiben.")

Wenn Du diese Zelle mehrfach ausf√ºhrst, schreibst Du jedes Mal eine weitere Zelle in die externe Datei. Dies liegt nat√ºrlich am *append*-Modus.

### f-strings

Im Zusammenhang mit ```print``` sind auch die sog. *f-strings* (abgek√ºrzt f√ºr *formatted string literals*) zu erw√§hnen. Gleich wie ```print``` (f√ºr die Ausgabe) und die Zeichenketten-Konkatenation mithilfe von ```+``` (vgl. erstes Notebook) k√∂nnen wir f-strings dazu nutzen, beliebig viele Werte zu einem string zusammenzusetzen. Das sieht syntaktisch so aus:

In [None]:
letter = "f"
sentence = f"Ein f-string beginnt mit einem kleinen '{letter}' oder gro√üen '{letter.upper()}'."
print(sentence)

Steht ein "f"/"F" vor dem √∂ffnenden Anf√ºhrungszeichen eines strings, k√∂nnen wir beliebig viele Werte, jeweils umrahmt von geschweiften Klammern *in* den string reinpacken. Der Wert kann dabei direkt von einer Variablen kommen (oben ```letter```) oder das Ergebnis eines komplexen Ausdrucks sein (oben bei ```letter.upper()```).  

Als Erinnerung (vom ersten Notebook): ein komplexer Ausdruck wie eine arithmetische Operation (```2*3```), eine Funktion (```sorted``` oder ```len```), eine Methode (s.o.), ein Werteabruf in einem dictionary (```dictionary[key]```) etc. gibt immer *einen* Wert zur√ºck (```6``` beim Beispiel f√ºr die arithmetische Operation). Genau dieser Wert wird dann an der Stelle der geschweiften Klammern im string eingesetzt.

Der selben Logik entsprechend lassen sich auch bedingte Anweisungen in einen f-string integrieren. Folgenden Code kennen wir bereits von oben. Dank f-strings ist er nun aber wesentlich k√ºrzer:

In [None]:
name = input("Wie hei√üt Du?")
age = int(input("Und wie alt bist Du?"))

print(f"Freut mich, {name}. Du darfst {'leider nicht' if age < 18 else 'nat√ºrlich'} in den Club.")

Spannender als das Einbauen von Werten in strings sind aber die durch f-strings entstehenden, unz√§hligen M√∂glichkeiten, diese Werte zu *formatieren*. Im Folgenden wollen wir uns auf die zwei wichtigsten Formatierm√∂glichkeiten konzentrieren. Weitere findest Du im Cheat Sheet zu f-strings.

1. Nachkommastellen: Besonders praktisch ist die M√∂glichkeit, die Anzahl an Nachkommastellen bei Dezimalzahlen festzulegen:

In [None]:
value = 23.238457584

#hier runden wir "value" auf zwei Nachkommastellen
print(f"Zahl mit nur zwei Nachkommastellen: {value:.2f}") 

Egal wie ein Wert formatiert werden soll, die Formatierung wird durch einen Doppelpunkt nach dem Wert eingeleitet. 

Danach wird spezifiziert, wie der Wert formatiert werden soll: ```.2``` definiert im Beispiel oben, dass ```value``` auf zwei Nachkommastellen gek√ºrzt werden soll, das ```f``` definiert, als welcher Datentyp der formatierte Wert ausgegeben werden soll (hier als Dezimalzahl, wobei das *f* von der englischen Bezeichnung *float* herr√ºhrt).

2. Ausrichten von Zahlen: Ebenso praktisch ist es, mehrere Zahlen, die aus einer unterschiedlichen Anzahl an Ziffern bestehen, einheitlich untereinander auszurichten:

In [None]:
value1 = 1
value2 = 123
print(f"Sch√∂n ausgerichtete Zahl: {value1:3} (ohne 'Auff√ºllung')")
print(f"Sch√∂n ausgerichtete Zahl: {value1:03} (mit Nullen 'aufgef√ºllt')")
print(f"Sch√∂n ausgerichtete Zahl: {value2:3} (keine 'Auff√ºllung', da dreiziffrig)")

Hier definieren wir nach dem Doppelpunkt einen sog. *digit space*, also die Anzahl an Stellen, die zur Ausgabe verwendet werden soll. In den Beispielen oben wird der digit space als aus drei Stellen bestehend definiert. Optional k√∂nnen wir davor angeben, ob etwaige leere Stellen (da die Zahl aus weniger Ziffern als Stellen des digit space besteht) mit Nullen "aufgef√ºllt" werden sollen (engl. *zero padding*). Zahlen, die aus weniger Ziffern als der digit space bestehen und nicht zero-gepaddet werden, werden rechtsb√ºndig ausgegeben. Wie Du diese Ausrichtung innerhalb des vorgegebenen digit space √§ndern kannst (engl. *alignment*), findest Du im Cheat Sheet.

Digit space und Nachkommastellen k√∂nnen nat√ºrlich auch zusammen definiert werden, die syntaktische Reihenfolge sieht dann so aus (die Leerschl√§ge dienen nur der besseren Lesbarkeit und m√ºssen im Code entfernt werden!):

```f"{value: (zero_padding) digit_space . decimals type}```

Genau diese Kombination aus digit space und Nachkommastellen kannst Du nun in der letzten √úbung einsetzen.

***

‚úèÔ∏è **√úbung 7:** In ```shopping_list``` finden sich Schl√ºssel-Werte-Paare bestehend aus Lebensmitteln und dem jeweiligen Preis. Deine Aufgabe ist es, die Ausgabe mithilfe von f-strings wie im folgenden Screenshot gezeigt auszugeben.

![Einkaufskorb.png](attachment:7f21be66-87ec-44e6-b0bd-84a947b7d201.png)

Hinweis 1: Einen digit space kannst Du nicht nur f√ºr Zahlen, sondern f√ºr Objekte jeglichen Datentyps festlegen. Der digit space f√ºr die Spalte "Product" soll 25 Stellen betragen, derjenige f√ºr "Price" 5.

Hinweis 2: Wie erw√§hnt werden Zahlen innerhalb des digit space standardm√§√üig rechtsb√ºndig ausgerichtet. Strings werden hingegen innerhalb des digit space standardm√§√üig linksb√ºndig ausgerichtet (Tabellenkalkulationsprogramme legen das gleiche Verhalten an den Tag, wie Dir vielleicht schon aufgefallen ist). Um die Darstellung im Screenshot umzusetzen, musst Du Dich folglich nicht um das Alignment k√ºmmern, da es dem Standard entspricht.

In [None]:
#In diese Zelle kannst Du den Code zur √úbung schreiben

shopping_list = {"Apple": 0.77, "Banana": 1.23, "Oat Milk": 1.944, "Olive Oil Extra Vergine": 11.17}




***

Damit wissen wir alles Wichtige rund um In- und Output von Daten. Gute Arbeit!