# Dateien lesen und schreiben
## Voraussetzungen
Diese Einheit setzt voraus, dass Sie folgende Inhalte kennen: 
- Variablen
- Ein- und Ausgabe
- primitive Datentypen
- Listen
- for-Schleife

## Motivation
Bei der Arbeit mit Computern sind Dateien allgegenw√§rtig. Dateien werden erstellt, gelesen, ge√§ndert, kopiert, verschickt, verschoben, gel√∂scht, wiederhergestellt, .... Bislang gehen bei unseren Programmen alle Daten verloren, sobald das Programm beendet wird. Mit Hilfe der Dateien ist es m√∂glich, Daten dauerhaft zu speichern (persistent) und sp√§ter wieder auf eben diese Daten zuzugreifen.

Nat√ºrlich ist es auch in Python üêç m√∂glich mit Dateien zu arbeiten. 

## Was ist eine Datei?
Alle von Ihnen haben schon mit Dateien gearbeitet: Word-Dateien, Excel-Dateien, dieses Notebook, Python-Programme, ... Was ist aber jetzt *genau* eine Datei? Eine m√∂gliche Definition k√∂nnte sein:

*Eine Datei ist eine Menge von **logisch zusammenh√§ngenden** und meist **sequentiell** geordneten Daten, die auf einem Medium **dauerhaft gespeichert** werden und √ºber einen **Namen** (Identifier) ansprechbar sind.*

Schauen Sie sich gerne auch den Artikel zum Thema [Datei](https://de.wikipedia.org/wiki/Datei) auf Wikipedia an.

### Beispiel: textdatei.txt
Speichern Sie eine einfache Mail als Textdatei (Endung .txt) mit dem Namen textdatei.txt ab. Wie kann man jetzt die obigen Punkte sehen?
- der Text der Mail ist in der Regel logisch zusammenh√§ngend, beizieht sich z.B. auf einen Betreff
- Der Text ist sequentiell aufgebaut: Eine Zeile folgt auf die andere, in den Zeilen steht ein Wort hinter dem anderen, in den Worten sind die Buchstaben hintereinander aufgereiht.
- Die Datei textdatei.txt ist (nachdem Sie diese abgespeichert haben) eben dauerhaft gespeichert. Auch wenn Sie das E-Mail-Programm schlie√üen oder gar den Computer ausschalten, ist die Datei weiter auf dem Speicher des Rechners vorhanden. Sie k√∂nnen die Datei beim n√§chsten Mal wieder √∂ffnen, auch mit einem anderen Programm.
- Die Datei hat einen eindeutigen Namen: textdatei.txt

## Wo liegt die Datei?
Heutzutage speichern die Programme und Apps die Dateien "irgendwo" in den Computern oder in das Smartphone. Sie als Nutzer sollen sich keine Gedanken machen m√ºssen, wo Dateien liegen, wo sie abgespeichert werden. (Wissen Sie, wo Ihre mp3 Dateien auf dem Smartphone liegen?)

Wenn Sie mit Programmen auf Dateien zugreifen wollen, m√ºssen Sie wissen, **wo** genau diese Dateien liegen. 
### Wichtig f√ºr dieses Notebook
F√ºr dieses und die weiteren Notebooks gilt: Solange nichts anderes angegeben wird, befindet sich die Datei, auf die zugegriffen wird, im gleichen Verzeichnis wie das Notebook. Wenn Sie ein Notebook herunterladen, dann m√ºssen Sie auch die Dateien herunterladen und im gleichen Ordner abspeichern. Sonst funktionieren einige Dinge nicht.

## In Python auf Dateien zugreifen
Der grunds√§tzliche Umgang mit einer Datei besteht immer aus den folgenden drei Schritten:
- √ñffnen der Datei und Zuweisung der Datei zu einer Variablen
- Bearbeiten der Datei
    - Lesen aus Datei (Lesezugriff)
    - Schreiben in Datei (Schreibzugriff)
- Schlie√üen der Datei

Um eine Datei zu √∂ffnen, gibt es die Funktion `open()`. F√ºr den weiteren Umgang mit der Datei gibt es Methoden wie `.write()`, `.read()` oder `.close()`. Dar√ºber hinaus gibt es noch Bibliotheken, die weitere Funktionen f√ºr spezielle Dateiformate anbieten wie z.B. .csv, .json, ...

## Dateien √∂ffnen
Mit der Python-Funktion `open()` kann eine Datei ge√∂ffnet werden. Die Funktion erwartet als Parameter den Namen einer Datei. (Dieser kann ggfs. um den Pfad zur Datei erweitert werden, sollte die Datei nicht im gleichen Verzeichnis wie das Programm liegen.) Zus√§tzlich kann noch optional der Modus angegeben werden, in dem die Datei ge√∂ffnet werden soll. Die verf√ºgbaren Modi sind in der [Python-Dokumentation](https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files) aufgef√ºhrt. Die wichtigsten Modi sind:

| Modus | Beschreibung                                  |
|:-------|:-----------------------------------------------|
| r | Aus der Datei wird nur gelesen. Schreibzugriff f√ºhrt zu	Fehler. Falls Datei nicht existiert --> Fehlermeldung. Am Anfang sitzt der Lesezeiger am Beginn der Datei |
| w | In die Datei wird geschrieben. Lesezugriff --> Fehler. Falls 	Datei NICHT existiert, wird eine neue Datei angelegt. Falls	Datei existiert wird der alte Inhalt gel√∂scht.|
| a | Neue Inhalte k√∂nnen an den alten Inhalt angeh√§ngt	werden (append). Der Schreibzeiger ist auf dem Ende der	Datei positioniert.|
| r+ | Lese- und Schreibzugriff. Fehler, falls Datei nicht existiert.|
| w+ | Schreib- und Lesezugriff. Neue Datei, falls Datei nicht 	existiert. Inhalt bestehender Datei wird gel√∂scht.!|
| rb | Der Modus kann um ein "b" erg√§nzt werden. In diesem	Fall liegt keine Textdatei sondern eine Bin√§rdatei vor.|

Falls kein Modus angegeben wird, ist der Defaultwert `"r"`. **Empfehlung:** Geben Sie IMMER einen Modus an. Das vereinfacht die Wartung des Programms.

## Beispiele und Aufgaben
In den folgenden Aufgaben und Beispielen sollen die Modi "r" und "w" nochmal vertieft werden.
### Erzeugen einer Datei im Schreibmodus
Im folgenden Programm wird eine Datei im Schreibmodus ge√∂ffnet. Da es die Datei (vermutlich) bei Ihnen auf dem Rechner noch nicht gibt, wird diese Datei erzeugt. Das Programm schreibt letztlich nichts in die Datei hinein, die Datei existiert trotzdem. (Wichtig: Wenn kein weiterer Pfad angegeben wird, wird die Datei in dem gleichen Ordner erzeugt, in dem das Notebook liegt.) 

Lassen Sie das Programm laufen und kontrollieren Sie anschlie√üend, ob die Datei erzeugt wurde. 

In [None]:
# Programm 1
# Datei wird zum Schreiben ge√∂ffnet
file = open("neue_Datei.txt", "w")
# Die Datei wird wieder geschlossen
file.close()

### √ñffnen einer Datei im Lesemodus
Im n√§chsten Programm wird die Datei aus dem ersten Programm im Lesemodus ge√∂ffnet und wieder geschlossen. Lassen Sie das Programm laufen. **L√∂schen** Sie dann die Datei "neue_Datei.txt" und lassen Sie das Programm nochmal laufen. Was passiert?

In [None]:
# Programm 2
# Datei wird zum Lesen ge√∂ffnet
file = open("neue_Datei.txt", "r")
# Die Datei wird wieder geschlossen
file.close()

### √ñffnen einer schon existierenden Datei im Schreibmodus
√ñffnen Sie die Datei "neue_Datei.txt" mit einem Texteditor, geben Sie ein paar Zeichen und Zeilen ein, speichern diese Datei und schlie√üen Sie den Texteditor wieder. Lassen Sie jetzt Programm 1 (s.o.) nochmal laufen. Kontrollieren Sie anschlie√üend mit dem Texteditor den Inhalt der Datei. Was ist passiert?

## Dateien lesen
Wie liest man jetzt aus einer Datei? Dateien sind sequentiell organisiert (s.o.), d.h. sie bestehen aus aufeinander folgenden Zeilen. Zur Bearbeitung von Sequenzen eignet sich die `for`-Schleife. Konkret kann man √ºber die Zeilen einer Datei iterieren: 

In [None]:
#Datei √∂ffnen 
file = open('lorem_ipsum.txt', 'r')

#Datei zeilenweise lesen und die Zeilen ausgeben 
for line in file:
    print(line)

#Datei schlie√üen
file.close()

Wenn Sie die Ausgabe des Programms mit dem Inhalt der Datei vergleichen (z.B. im Texteditor), f√§llt auf, dass in der Ausgabe Leerzeilen hinzugef√ºgt  wurden. Woran liegt das?

Am Ende jeder Zeile steht in der Textdatei ein Zeilenumbruch `\n`. Dieser ist nur indirekt zu sehen, da der Text eben in der n√§chsten Zeile weitergeht. Bei der Ausgabe f√ºgt die Funktion `print()` noch einen weiteren Zeilenumbruch hinzu, daher die Leerzeile. 

Man kann dieses Verhalten auf verschiedene Weise korrigieren. Zum einen k√∂nnen Sie in der Funktion `print()` den Parameter `end` auf ein leeres Zeichen setzen `end = ""`. Eine andere M√∂glichkeit ist es, die Zeile erst zu "strippen". F√ºr Strings gibt es die Methode `.strip()`. Diese entfernt am Anfang und am Ende eines Strings Leerzeichen, Tabs, Zeilenumbr√ºche. `.strip()` wird h√§ufig beim Einlesen von Formularen verwendet, um zu verhindern, dass ein f√ºhrendes Leerzeichen die Eingabe ver√§ndert. Alternativ kann auch `.lstrip()` oder `.rstrip()` verwendet werden. In diesem Fall wird nur links bzw. rechts etwas gel√∂scht.

In [None]:
#Datei √∂ffnen 
file = open('lorem_ipsum.txt', 'r')

#Datei zeilenweise lesen und die Zeilen ausgeben 
for line in file:
    line = line.strip()
    print(line)

#Datei schlie√üen
file.close()

### Inhalt einer Datei zweimal ausgeben
Im folgenden Programm wird die `for`-Schleife zweimal durchlaufen. Wie sieht die Ausgabe aus? Warum?

In [None]:
#Datei √∂ffnen 
file = open('lorem_ipsum.txt', 'r')

#Datei zeilenweise lesen und die Zeilen ausgeben 
print("Erste Runde")
for line in file:
    line = line.strip()
    print(line)
    
#Datei zeilenweise lesen und die Zeilen ausgeben 
print("Zweite Runde")
for line in file:
    line = line.strip()
    print(line)

#Datei schlie√üen
file.close()

Beim Lesen einer Datei wird der "Lesekopf" zeichenweise √ºber die Datei bewegt. Kommt der Lesekopf am Ende der Datei an und wird **nicht** zur√ºckgesetzt, kann er dort nicht weiterlesen. Um den Schreibkopf zu platzieren, wird weiter unten noch die Methode `.seek()` vorgestellt.

### Datei in einem Rutsch in eine Liste einlesen
M√∂glicherweise sind die Zeilenumbr√ºche √ºberfl√ºssig und nur vorhanden, weil z.B. eine Papierseite eine begrenzte Breite hat. In diesem Fall macht es m√∂glicherweise Sinn, den gesamten Text "in einem Rutsch" einzulesen, ohne mit einer Schleife √ºber die Zeilen zu iterieren. Hierf√ºr bietet sich die Methode `.readlines()` an. Das Ergebnis ist eine **Liste** mit einem Eintrag.

In [None]:
#Datei √∂ffnen 
file = open('lorem_ipsum.txt', 'r')

#Datei in einem Rutsch einlesen
line = file.readlines()
print(line)

#Datei schlie√üen
file.close()

### Datei mit `with` √∂ffnen
Wie in den vorherigen Beispielen zu sehen m√ºssen Dateien nach dem √ñffnen auch immer geschlossen werden. Da das Vergessen des Schlie√üens eine h√§ufige Fehlerursache darstellt, gibt es in Python das Schl√ºsselwort `with`. Dieses sorgt daf√ºr, das ge√∂ffnete Dateien immer korrekt geschlossen werden.

In [None]:
#Datei √∂ffnen
with open('lorem_ipsum.txt', 'r') as file:
    #Datei zeilenweise lesen und die Zeilen ausgeben 
    for line in file:
        print(line)

#Datei wird automatisch geschlossen 

## Dateien schreiben
Um in eine Datei schreiben zu k√∂nnen muss sie in einen Modus ge√∂ffnet werden, der das Schreiben erlaubt (z.B. der Modus `'w'`). Danach kann mit der Methode `write` Daten in die Datei geschrieben werden. Dies wird in folgender Zelle gezeigt. 

In [None]:
with open('zahlen.txt', 'w') as f:
    for i in range(100):
        f.write(str(i) + '\n')

Kontrollieren Sie in der Datei "zahlen.txt" mit einem Texteditor das Ergebnis. Frage: Warum wird die Integer `i` noch in einen String verwandelt? Noch eine Frage: Warum wird noch ein `\n` zu der Zahl hinzugef√ºgt? Experimentieren Sie mit obigen Programm, kontrollieren Sie jeweils die Ver√§nderung der Datei mit einem Texteditor.

### Aufgabe: Buchstaben von a-z in eine Datei schreiben
Erstellen Sie ein Programm (√§hnlich wie das vorherige), dass alle Buchstaben von a-z jeweils in eine Zeile einer Datei schreibt. Hinweis: Die Funktion `chr()` wandelt eine Zahl in einen Buchstaben. Dabei entspricht die Zahl 97 einem a, die Zahl 98 einem b usw. Hinter dieser Zuordnung steckt die ASCII-Tabelle. ASCII ist ein Codierungsstandard, der die Zeichen und Befehle einer Schreibmaschine den Bitkombinationen zuordnet. Dabei werden die Bitkombinationen in der Regel als Zahlen von 0 bis 127 angegeben. Siehe auch [hier](https://de.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange#ASCII-Tabelle).

In [None]:
with open ...

## Mit `.seek()` den Lesekopf platzieren
Mit Hilfe der Methode `.seek()` kann der Lesekopf (oder Lesezeiger) neu positioniert werden. Dabei werden der Methode zwei Argumente √ºbergeben. 
Das erste Argument gibt an, um wie viele Bytes (!) der Zeiger verschoben wird. Das zweite Argument legt fest, von wo aus positioniert wird. Dabei gilt
* Zweites Argument = 0 ‚Üí  von Beginn (Defaultwert)
* Zweites Argument = 1 ‚Üí  von aktueller Position aus
* Zweites Argument = 2 ‚Üí  vom Ende aus

Beispiel:
* file.seek(3) ‚Üí Zeiger steht auf dem dritten Byte
* file.seek(5,1) ‚Üí Zeiger wird um 5 Positionen von der aktuellen Position ausgehend weitergeschoben
* file.seek(0,0) ‚Üí Zeiger zur√ºck auf den Anfang der Datei

Experimentieren Sie in der folgenden Datei mit den Parameter von `.seek()`.

In [None]:
file = open("zahlen.txt", "r")
file.seek(60,0)
for line in file:
    print(line)

file.seek(0)
for line in file:
    line = line.strip()
    print(line)
file.close()

## Aufgabe 1: Zwei Ausgaben
Oben wurde ein Programm angek√ºndigt, das den Inhalt einer Datei zweimal ausgibt. Kopieren Sie das Programm von oben in die folgende Zelle und erg√§nzen es so, dass jezt tats√§chlich zwei Ausgaben erfolgen.

## Aufgabe 2: Datei kopieren
Erstellen Sie ein Programm, dass eine Datei kopiert. Erstellen Sie zuerst ein Programm, das eine Kopie von "lorem_ipsum.txt" erzeugt. Erweitern Sie das Programm anschlie√üend so, dass zuerst nach dem Dateinamen der zu kopierenden Datei gefragt wird, anschlie√üend nach dem Namen der neuen Datei. Danach wird kopiert. Gehen Sie davon aus, dass die Datei tats√§chlich existiert.

## Aufgabe 3: Zahlen aus einer Datei addieren
Die Datei "08_zahlen.txt" auf Ilias enth√§lt mehrere Zahlen. In jeder Zeile steht eine Zahl. Lesen Sie die Datei ein. Geben Sie an wie viele Zahlen die Datei enth√§lt und wie gro√ü die Summe der Zahlen ist.

## Aufgabe 4: Erzeugen Sie eine Datei mit Zufallszahlen
Erzeugen Sie eine Datei mit 1.000 Zufallszahlen zwischen 0 und 10.000. Zur Erinnerung: Mit `import random` laden Sie die Bibliothek mit den Zufallszahlen. Anschlie√üend k√∂nnen Sie mit `random.randint(0,100)` eine Zufallszahl zwischen 1 und 100 erzeugen.

94
30
12
65
18
91
31
2
40
92
