## Dateizugriff

[Video](https://youtu.be/vVMqbRQvpvw)

Vor dem Lesen oder Schreiben in eine Datei öffnen wir die Datei mit *open*. Nach der Verarbeitung schließen wir die Datei mit *close*.

In [6]:
%%writefile input1.txt
Dies ist Zeile1
Dies ist Zeile2
Dies ist Zeile3

Overwriting input1.txt


### read
*read* liest den gesamen Inhalt in einen String. Ein Zeilenvorschub wird als ```\n``` übernommen.

In [7]:
f = open('input1.txt')    
data = f.read()
f.close()
data

'Dies ist Zeile1\nDies ist Zeile2\nDies ist Zeile3\n'

#### encoding

In [8]:
f = open('demo1.txt')   
data = f.read()
f.close()
data

'Umlaute sind Ã¤,Ã¶,Ã¼.\nEin scharfes s ist ÃŸ.'

Wenn wir seltsame Zeichen sehen, müssen wir vermutlich das encoding ändern. Meist hilft die Angabe von utf-8.

In [9]:
f = open('demo1.txt',encoding='utf-8')   
data = f.read()
f.close()
data

'Umlaute sind ä,ö,ü.\nEin scharfes s ist ß.'

#### readlines

*readlines* erzeugt eine Liste von Strings, jeder String ist eine Zeile. Der Zeilenvorschub bleibt.

In [10]:
f = open('input1.txt')    
data = f.readlines()
f.close()
data

['Dies ist Zeile1\n', 'Dies ist Zeile2\n', 'Dies ist Zeile3\n']

#### readline

*readline* liest eine Zeile als String ein, der Zeilenvorschub bleibt.

In [11]:
f = open('input1.txt') 
data = []
for i in range(3):
    zeile = f.readline()      
    data.append(zeile)
f.close()
data

['Dies ist Zeile1\n', 'Dies ist Zeile2\n', 'Dies ist Zeile3\n']

In [12]:
f = open('input1.txt') 
data = []
for i in range(3):
    zeile = f.readline().strip()     # entfernen des Zeilenvorschubs
    data.append(zeile)
f.close()
data

['Dies ist Zeile1', 'Dies ist Zeile2', 'Dies ist Zeile3']

#### Fileobjekt als Iterator

Das Fileobjekt ist ein Iterator, wir können auch so durch die Zeilen laufen:

In [13]:
f = open('input1.txt') 
data = []
for zeile in f:
    data.append(zeile.strip())
f.close()
data

['Dies ist Zeile1', 'Dies ist Zeile2', 'Dies ist Zeile3']

Mit einer List-Comprehension:

In [14]:
f = open('input1.txt') 
data = [zeile.strip() for zeile in f] 
f.close()
data

['Dies ist Zeile1', 'Dies ist Zeile2', 'Dies ist Zeile3']

### Beispiele fürs Einlesen

##### Beispiel 1

Die erste Zahl gibt an, wieviele Zahlen noch folgen.

In [15]:
%%writefile input2.txt
3
10
20
40

Overwriting input2.txt


In [16]:
f = open('input2.txt')
n = int(f.readline())
data = []
for i in range(n):
    data.append(int(f.readline()))
f.close()
data

[10, 20, 40]

##### Beispiel2

Alle Zahlen stehen in einer Reihe

In [17]:
%%writefile input2.txt
3 10 8 4 -3 14 42 -9

Overwriting input2.txt


In [18]:
f = open('input2.txt')
a = f.readline().split()
f.close()
data = []
for x in a:
    data.append(int(x))
data

[3, 10, 8, 4, -3, 14, 42, -9]

oder kürzer mit einer list-Comprehension

In [19]:
f = open('input2.txt')
data = [int(x) for x in f.readline().split()]
f.close()
data

[3, 10, 8, 4, -3, 14, 42, -9]

##### Beispiel4

In [20]:
%%writefile input2.txt
3
10  Lena
20  Malte
40  Sam

Overwriting input2.txt


In [21]:
f = open('input2.txt')
n = int(f.readline())
data = []
for i in range(n):
    k, name = f.readline().split()
    data.append((int(k),name))
f.close()
data

[(10, 'Lena'), (20, 'Malte'), (40, 'Sam')]

##### Beispiel5

Einen Text einlesen.

In [22]:
%%writefile input3.txt
Wollen wir einen Computer für eine bestimmte Aufgabe einsetzen, dann
müssen wir uns nicht nur überlegen, wie der Verarbeitungsablauf in Form eines
Programms beschrieben werden kann. Es geht auch darum, das, was eigentlich
verarbeitet werden soll, darzustellen. Informationen müssen in Form von Daten
verpackt werden. Daten können alles Mögliche repräsentieren, von Zahlen und
Texten über Bilder und Tönen bis zu Finanztransaktionen oder Auswertungen
von Gesteinsproben. Da jedoch Computer intern nur mit den zwei Symbolen
0 und 1 operieren, müssen wir uns überlegen, wie Informationen damit
beschrieben werden können. Wie sieht eine Zahl aus, die nur aus Nullen und
Einsen besteht – oder ein Text oder ein Bild?

Overwriting input3.txt


In [23]:
f = open('input3.txt',encoding='utf-8')    
data = f.read().replace('\n',' ')
f.close()
data

'Wollen wir einen Computer für eine bestimmte Aufgabe einsetzen, dann müssen wir uns nicht nur überlegen, wie der Verarbeitungsablauf in Form eines Programms beschrieben werden kann. Es geht auch darum, das, was eigentlich verarbeitet werden soll, darzustellen. Informationen müssen in Form von Daten verpackt werden. Daten können alles Mögliche repräsentieren, von Zahlen und Texten über Bilder und Tönen bis zu Finanztransaktionen oder Auswertungen von Gesteinsproben. Da jedoch Computer intern nur mit den zwei Symbolen 0 und 1 operieren, müssen wir uns überlegen, wie Informationen damit beschrieben werden können. Wie sieht eine Zahl aus, die nur aus Nullen und Einsen besteht – oder ein Text oder ein Bild? '

### write

Beim Öffnen einer Datei können wir den Parameter *mode* mitgeben:

    * mode='r'     -  Datei wird zum Lesen geöffnet (default)
    * mode='w'     -  Datei wird zum Schreiben geöffnet, alter Inhalt wird gelöscht 
    * mode='a'     -  Datei wird zum Schreiben geöffnet, neuer Inhalt wird angehängt
    


In [24]:
f = open('output1.txt','w')
f.write('Montag\n')
f.write('Dienstag\n')
f.close()

In [25]:
f = open('output1.txt')
data = f.read()
f.close()
data

'Montag\nDienstag\n'

In [26]:
f = open('output1.txt','a')
f.write('Mittwoch\n')
f.close()

In [27]:
f = open('output1.txt')
data = f.read()
f.close()
data

'Montag\nDienstag\nMittwoch\n'

In [28]:
a = ['Montag','Dienstag','Mittwoch']
f = open('output1.txt','w')
f.writelines([s+'\n' for s in a ])
f.close()

In [29]:
f = open('output1.txt')
data = f.read()
f.close()
data

'Montag\nDienstag\nMittwoch\n'

#### Mit print in Datei schreiben

In [30]:
a = ['Montag','Dienstag','Mittwoch']
f = open('output1.txt','w')
for s in a:
    print(s,file = f)
f.close()

In [31]:
f = open('output1.txt')
data = f.read()
f.close()
data

'Montag\nDienstag\nMittwoch\n'

### Context-Manager

Warum sollte eine Datei nach der Verarbeitung geschlossen werden?

* jede geöffnete Datei verbraucht Systemressourcen
* beim Schreiben werden die zu schreibenden Daten häufig zunächst im Speicher portionsweise gesammelt (buffered), mit close wird auch die
  letzte Portion in die Datei geschrieben (flushed to disk).
* andere Anwendungen können auf die Datei zugreifen.

Wenn wir den Context-Manager benutzen, den uns das *open* liefert, müssen wir das *close* nicht mehr codieren. Der Context-Manager sorgt dafür, dass die Datei (auch im Fehlerfall) ordentlich geschlossen wird.  

In [32]:
with open('input1.txt') as f:
    print(f.read())

Dies ist Zeile1
Dies ist Zeile2
Dies ist Zeile3



Für Programmieranfänger ist häufig das Verfahren *open - read - close* verständlicher, deswegen nutzen wir nicht immer den Context-Manager. 