# Mit Dateien arbeiten

Bevor aus einer Datei gelesen oder in eine Datei geschrieben werden kann, muss diese Datei mit der Funktion `open()` geöffnet werden. `open()` erwartet mindestens ein Argument: Den Namen (evtl. mit Pfad) der Datei:

In [None]:
fh = open('data/vornamen/names_short.txt')

Falls nötig (und grundsätzlich empfehlenswert), kann noch das Encoding der Datei explizit angegeben werden, falls dieses bekannt ist:

Exkurs zum Encoding: Das Encoding bestimmt, wie ein Computer Bitfolgen als Zeichen interpretiert.  Wir werden dieses Thema ausführlicher in einer der Live Sessions behandeln. Zur Vertiefung (oder falls Sie das auf der Stelle wissen müssen), empfehle ich diese Texte:

* https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character-sets-no-excuses/
* https://docs.python.org/3/howto/unicode.html

Wenn wir die Datei nicht mehr brauchen, d.h. wenn wir die Datei eingelesen haben, sollte sie wieder geschlossen werden, damit das Betriebssystem die Ressource wieder freigeben kann.

In [None]:
fh.close()

Das Objekt, das die geöffnete Datei repräsentiert, bietet mehrere Möglichkeiten, auf den Inhalt 
der Datei zuzugreifen, darunter auch einen Iterator, den wir in einer `for`-Schleife nutzen können.

In [None]:
fh = open('data/vornamen/names_short.txt', encoding='utf-8')
for line in fh:
    print(line)
fh.close()

## Eine Datei in einem Context-Manager öffnen
Es ist guter Stil, eine geöffnete Datei auch wieder zu schließen. Wenn aber z.B. das Programm abstürzt, während die Datei geöffnet ist, kann die `close()`-Methode nicht mehr ausgeführt werden. Um solche Probleme zu vermeiden, empfiehlt sich die Verwendung eines Context-Managers:

In [None]:
with open('data/vornamen/names_short.txt', encoding='utf-8') as fh:
    for line in fh:
        print(line)

## Weitere Methoden um aus einer Datei zu lesen

### read()
Die `read()`-Methode liest den gesamten Dateiinhalt als String ein. Wie erhalten also den gesamten Dateiinhalt als einen (mitunter sehr langen) String:

In [None]:
with open('data/vornamen/names_short.txt', encoding='utf-8') as fh:
    data = fh.read()
print(data)    

### readlines()
Diese Methode liest jede Zeile der Datei als Element in eine Liste ein (eine Liste ist ein weiterer Sequenztyp, den wir bald kennen lernen werden):

In [None]:
with open('data/vornamen/names_short.txt', encoding='utf-8') as fh:
    lines = fh.readlines()
print(lines)    

<div class="alert alert-block alert-info">
<b>Übung File-1</b><p>wie viele Zeilen hat die Datei names_short.txt?</p></div>

## In eine Datei schreiben
Bisher haben wir nur aus Dateien gelesen. Um in eine Datei schreiben zu können, müssen wir sie auf eine besondere Weise öffnen. Die `open()`-Funktion erwartet als zweites Argument einen String, der angibt, wie eine Datei geöffnet werden soll. Falls wir nicht angeben, wird der Defaultwert 'r' (für `read`) angenommen.

```
with open('data/vornamen/names_short.txt', encoding='utf-8') as fh:
```
führt also zum selben Ergebnis wie 

```
with open('data/vornamen/names_short.txt', 'r', encoding='utf-8') as fh:
```


Wenn wir eine Datei zum Schreiben öffnen wollen, verwenden wir statt `'r'` `'w'` (für `write`).

In [None]:
with open('testfile.txt', 'w', encoding='utf-8') as fh:
    fh.write('Ich bin ein Text.')

Die `write()`-Methode des File-Objekts sorgt dafür, dass die als Argument übergebenen Daten in die Datei geschrieben werden. Dabei ist zu beachten, dass die Datei überschrieben wird, falls sie bereits existiert hat.

## An eine Datei anhängen

Wenn wir die Datei nicht überschreiben, sondern neue Daten an eine bestehende Datei anhängen wollen, müssen wir statt `'w'` den Mode `'a'` (für `append`) angeben. Falls die Datei zuvor noch nicht existiert hat, wird sie angelegt.

In [None]:
with open('testfile.txt', 'a', encoding='utf-8') as fh:
    fh.write('Ich bin ein Text.')

<div class="alert alert-block alert-info">
<b>Übung File-2</b><p>Schreiben Sie ein Programm, das folgende Schritte vornimmt:
<ol>
<li>Lesen Sie die Inhalte der Datei "data/vornamen/names_short.txt" ein.</li>
<li>Schreiben Sie den Inhalt der eingelesenen Datei in eine neue Datei "mynames.txt"</li>
<li>Fragen Sie (mit input()) den Benutzer nach seinem/ihrem Vornamen und speichern Sie diese in einer Variablen </li>
<li>Fügen Sie den erfragten Namen ans Ende der Datei "mynames.txt" an</li>
</ol>
</div>

## Binärdaten schreiben
Bisher haben wir immer angenommen, dass wir Texte aus einer Datei lesen oder in eine Datei schreiben. Falls wir es mit Binärdaten (d.h. mit allem was kein reiner Text ist, z.B. Bilder, PDF-Dateien, Word-Files usw.) zu tun  haben, müssen wir das explizit mit dem Buchstaben `'b'` angeben:

In [None]:
with open('img/string1.png', 'rb') as fh_in, open('testimage.png', 'wb') as fh_out:
    data = fh_in.read()
    fh_out.write(data)

## Vertiefende Literatur
Ich empfehle ausdrücklich, mindestens eine der folgenden Ressourcen zur Vertiefung zu lesen!

  * Python Tutorial: Kapitel 7.2
	(https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files)
  * Klein, Kurs: Dateien lesen und schreiben (http://python-kurs.eu/python3_dateien.php)
  * Sweigart: https://automatetheboringstuff.com/2e/chapter9/
  
  
  * Klein, Buch: Kapitel 10
  * Kofler: Kapitel 14.
  * Weigend: Kapitel 9.1 und 9.2
  * Briggs: Kapitel 10.2
  * Sweigart: Kapitel 8.
  * Pilgrim: Kapitel 11.1 bis 11.4
	(https://www.diveinto.org/python3/files.html)
  * Downey: Kapitel 14.1 bis 14.5
    (http://greenteapress.com/thinkpython/html/thinkpython015.html)

## Lizenz

This notebook ist part of the course [Grundlagen der Programmierung](https://github.com/gvasold/gdp) held by [Gunter Vasold](https://online.uni-graz.at/kfu_online/wbForschungsportal.cbShowPortal?pPersonNr=51488) at Graz University 2017&thinsp;ff. 

<p>
    It is licensed under <a href="https://creativecommons.org/licenses/by-nc-sa/4.0">CC BY-NC-SA 4.0</a>
</p>

<table>
    <tr>
    <td>
        <img style="height:22px" 
             src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1"/></li>
    </td>
    <td>
    <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/nc.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
             src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1" /></li>
    </td>
</tr>
</table>