<img src="IMG/PYT_G01_logo.svg" width="100%"/>
<a href="0_Einfuehrung_Inhalt.ipynb" target="_blank">&larr; Einführung/Inhalt</a>

# 5. File I/O

Um Daten aus einer Datei zu lesen oder auch zu schreiben, muss die entsprechende Datei zuerst mit der `open()`-Funktion geöffnet werden. Damit wird ein Dateiobjekt erzeugt, das eine Referenz auf die Datei enthält.

Wir lernen hier die generische Methode kennen, um den Inhalt einer beliebigen Textdatei zu lesen. Dies ist für einfache/kleine Textdateien geeignet. Arbeitet man mit grossen Datensätzen bzw. strukturierten Daten, so stehen entsprechende Bibliotheken (*NumPy*, *pandas*) zur Verfügung, die das Filehandling erleichtern. Diese Bibliotheken werden Sie in zukünftigen Modulen kennenlernen.

Betrachten wir die Textdatei, welche wir einlesen wollen, mit einem Editor, so können wir feststellen, dass neben den eigentlichen Daten auch Steuerzeichen (LF bzw. \n für den Zeilenumbruch) enthalten sind.

<center><img src="IMG/textfile.png" width="100%"/></center>

## 5.1 Lesen einer Datei

In [2]:
dateiname = 'DATA/messung.txt'

f = open(dateiname, mode='r')

for linie in f:
    print(linie.rstrip())  # rstrip: entfernt allfällige Leerzeichen und Newlines vom rechten Rand

f.close()

0.00042713510204081626,-0.054554329590293701,-0.15027583170588285
0.0004271651020408163,-0.051068871794783817,-0.13629134071592999
0.00042719510204081629,-0.051068871794783817,-0.15027583170588127
0.00042722510204081627,-0.051068871794783817,-0.14677970895839146
0.00042725510204081631,-0.047583413999283446,-0.13978746346341822
0.00042728510204081624,-0.054554329590284195,-0.14677970895838191
0.00042731510204081628,-0.044097956203764048,-0.14328358621090007
0.00042734510204081626,-0.033641582817239155,-0.13978746346341026
0.00042737510204081625,-0.040612498408247821,-0.13629134071592047
0.00042740510204081629,-0.04061249840824941,-0.13978746346340709


## 5.3 Die Methoden read() und readlines()

Im Beispiel oben wurde die Datei Zeile für Zeile gelesen. Häufig möchte man aber den Inhalt einer Datei in eine komplette Datenstruktur einlesen. Auf diese Weise kann die Datei schnell wieder geschlossen und man arbeitet nur noch auf der Datenstruktur und nicht mehr mit der Datei. Dafür stehen die Methoden `.read()` bzw. `.readlines()`.

> Zu beachten gilt es, dass der Inhalt einer Textdatei immer als String eingelesen wird (egal, ob Zahlen oder sonstige Zeichen in der Textdatei vorkommen). Mit der `read()`-Funktion erhält man einen String des gesamten Inhaltes zurück und mit der `readlines()`-Funktion eine Liste, in der jedes Element einer Zeile entspricht und ebenfalls ein String ist.

In [53]:
messdaten = open(dateiname).read()  # komplette Datei in einen String einlesen (Output: String)
messdaten

'0.00042713510204081626,-0.054554329590293701,-0.15027583170588285\n0.0004271651020408163,-0.051068871794783817,-0.13629134071592999\n0.00042719510204081629,-0.051068871794783817,-0.15027583170588127\n0.00042722510204081627,-0.051068871794783817,-0.14677970895839146\n0.00042725510204081631,-0.047583413999283446,-0.13978746346341822\n0.00042728510204081624,-0.054554329590284195,-0.14677970895838191\n0.00042731510204081628,-0.044097956203764048,-0.14328358621090007\n0.00042734510204081626,-0.033641582817239155,-0.13978746346341026\n0.00042737510204081625,-0.040612498408247821,-0.13629134071592047\n0.00042740510204081629,-0.04061249840824941,-0.13978746346340709'

In [54]:
messdaten = open(dateiname).readlines()  # Zeilenweises Lesen der Datei (Output: Liste)
messdaten

['0.00042713510204081626,-0.054554329590293701,-0.15027583170588285\n',
 '0.0004271651020408163,-0.051068871794783817,-0.13629134071592999\n',
 '0.00042719510204081629,-0.051068871794783817,-0.15027583170588127\n',
 '0.00042722510204081627,-0.051068871794783817,-0.14677970895839146\n',
 '0.00042725510204081631,-0.047583413999283446,-0.13978746346341822\n',
 '0.00042728510204081624,-0.054554329590284195,-0.14677970895838191\n',
 '0.00042731510204081628,-0.044097956203764048,-0.14328358621090007\n',
 '0.00042734510204081626,-0.033641582817239155,-0.13978746346341026\n',
 '0.00042737510204081625,-0.040612498408247821,-0.13629134071592047\n',
 '0.00042740510204081629,-0.04061249840824941,-0.13978746346340709']

## 5.2 Schreiben einer Datei

Das Schreiben erfolgt analog zum Lesen. Der Modus `mode='w'` ermöglicht den Schreibzugriff bzw. ein File zu erstellen. Wiederum stehen die Methoden `.write()` bzw. `.writelines()` zur Verfügung.

In [3]:
dateiname = 'DATA/data.txt'

f = open(dateiname, mode='w')

text = '''Hallo
Ich bin ein mehrzeiliger String und
werde in eine Textdatei geschrieben.
'''

f.write(text)
f.close()

## 5.4 Context-Manager (with-Block)

Die beste Methode im Zusammenhang mit dem Lesen bzw. Schreiben von Files besteht darin, einen sogenannten Context-Manager zu verwenden (*with-Block*). Der Context-Manager stellt sicher, dass die Datei geschlossen wird, wenn das Lesen/Schreiben abgeschlossen ist oder ein Fehler auftritt. Damit ist sichergestellt, dass die Datei immer geschlossen wird, auch ohne ein explizites `close()`. Context-Manager werden in Python typischerweise eingesetzt, wenn eine Verbindung zu einer Datei, Datenbank oder einer Schnittstelle (Interface) etc. aufgebaut und schliesslich wieder geschlossen werden muss.

In [57]:
with open(dateiname, 'w') as f:
    data = f.write(text)

---
<p style='text-align: right; font-size: 70%;'>Grundlagen Python (PYT_G01) / 2024</p>