# Computerphysik Programmiertutorial 11
Prof. Dr. Matteo Rizzi und Dr. Markus Schmitt - Institut für Theoretische Physik, Universität zu Köln
&nbsp;

**Github**: [https://github.com/markusschmitt/compphys2022](https://github.com/markusschmitt/compphys2022)

**Inhalt dieses Notebooks**: Dateien lesen und schreiben "zu Fuß", Dateien lesen und schreiben mit `JLD`, `do`-Block Syntax, Pipelines von Funktionen, Unicode Zeichen

# Dateien lesen und schreiben "zu Fuß"

Bisher haben wir gesehen wie man `DataFrame`s aus `.csv`-Dateien auslesen oder in `.csv`-Dateien schreiben kann.

Julia bietet auch die Möglichkeit Daten unstrukturiert in Dateien zu schreiben.

Die Funktion `write(<Dateiname>, <Variable>)` schreibt den Wert von `<Variable>` in die Datei `<Dateiname>`.

Falls die Datei bereits existiert, wird sie überschrieben:

Es können auch mehrere Variablen hintereinander geschrieben werden:

Der Rückgabewert von `write()` gibt an wie viele Bytes geschrieben wurden.

## Dateien explizit öffnen

Die Funktion `open(<Dateiname>, <(Schreib-/Lese-)modus>)` öffnet eine Datei und gibt einen `IOStream` zurück. Ein `IOStream` ist eine Datenstruktur, die die geöffnete Datei "verwaltet" und uns ermöglicht in der Datei zu schreiben/lesen.

Bei Öffnen können wir den Schreib-/Lesemodus wählen. Optionen sind:
- `"w"`: Schreiben und Datei überschreiben, falls sie bereits existiert. 
- `"a"`: Schreiben und an Datei anhängen, falls sie bereits existiert.
- `"r"`: Lesen.

Überschreiben:

Anhängen:

In die geöffnete Datei können wir immer weitere Daten schreiben, indem wir `write()` wiederholt aufrufen. Hier schreiben wir eine Reihe von Zufallszahlen in die Datei, jede gefolgt von dem Zeichen `\n`, das ein Zeilenende markiert.

## Dateien auslesen

Der Inhalt einer Datei kann mit `read(<Dateiname>, <Datentyp>)` ausgelesen werden. Dabei muss neben dem Dateinamen der `<Datentyp>` angegeben werden. Die Datei liegt auf der Festplatte als eine Folge von Bits, die Julia nur sinnvoll interpretieren kann, wenn wir vorgeben um welchen Datentyp es sich handelt.

Die Funktion `readline(<IOStream>)` liest die Datei nur bis zum nächsten Zeilenende, das mit `\n` markiert ist

Wenn wir eine Datei z.B. mit `readline` nur Stückweise auslesen, "merkt sich" die `IOStream` Datenstruktur die Stelle, bis zu der wir gelesen haben (mit einem "file pointer"). Beim nächsten Aufruf wird dann von dort weitergelesen:

Die Funktion `eof(<IOStream>)` testet ob beim Auslesen das Ende einer Datei erreicht ist. Das können wir nutzen um eine Datei vollständig zeilenweise auszulesen:

## Binäre Dateien

Bisher haben wir nur `String`s in Dateien geschrieben. Tatsächlich schreibt `write` die Daten einfach in Binärformat in die Datei. Daher können wir Variablen von beliebigen Datentypen auf die Festplatte schreiben:

Diese Zufallszahlen vom Typ `Float64` können wir auch der Reihe nach wieder auslesen:

**Achtung:** Beim Auslesen muss der Datentyp natürlich mit dem Datentyp übereinstimmen, der geschrieben wurde!

Beispiel: Schreibe `String`s

In [None]:
io = open("meine_datei.txt", "w")

for i in 1:10
    r = rand()
    write(io, "$r\n")
    println(r)
end

close(io)

Lese `Float64`s

In [None]:
io = open("meine_datei.txt", "r")

while !eof(io)
    println(read(io, Float64))
end

close(io)

Es können auch Arrays in Dateien geschrieben werden:

Zum Auslesen legen wir ein leeres Array `B` mit gleicher Größe und gleichem Datentyp an und verwenden die `read!()` Funktion:

# Daten lesen/schreiben mit `JLD`

Mit dem Paket `JLD` können wir beliebige Datenstrukturen sehr einfach in Dateien schreiben und auslesen ([Dokumentation](https://github.com/JuliaIO/JLD.jl)).

In [None]:
using JLD

Daten verschiedener Datenstrukturen speichern:

Gespeicherte Daten laden:

# `do`-Block Syntax

Der `do`-Block ist eine alternative Syntax um einer Funktion als erstes argument eine anonyme Funktion zu übergeben.

Ein Beispiel ist die `map` funktion, die ihr erstes Argument (eine Funktion) elementweise auf das Array anwendet, das als zweites Argument übergeben wird:

In [None]:
arr = [17, -16, 0]

map(x->begin
           if x < 0 && iseven(x)
               return 0
           elseif x == 0
               return 1
           else
               return x
           end
       end,
    arr)

Mit der `do`-Block Syntax kann das gleich in der folgenden Form geschieben werden:

Die `do`-Block Syntax wird häufig zum Öffnen von Dateien verwendet, da die `open()`-Funktion die Datei dann automatisch wieder schließt:

In [None]:
open("meine_datei.txt", "w") do io
    for i in 1:10
        write(io, "$(rand())\n")
    end
end

In [None]:
open("meine_datei.txt", "r") do io
    while !eof(io)
        println(readline(io))
    end
end

# Pipelines von Funktionen

Verschachtelte Funktionsaufrufe können alternativ als sogenannte *pipeline* geschrieben werden.

In [None]:
f(x) = 3*x + 5
g(x) = x^2.4 - x

Verschachtelter Funktionsaufruf:

Das gleiche mit dem pipeline-Operator `|>`:

Eine weitere Möglichkeit ist, den Verknüpfungsoperator `∘` zu verwenden:

# Unicode Zeichen

Wie oben gesehen sind Unicode Zeichen, wie z.B. `∘` als Teil der Julia Syntax erlaubt.

Diese Zeichen können in Julia Notebooks erzeugt werden, indem man den entsprechenden LaTex code eingibt und anschließend "tab" drückt.

Einige Beispiele:

Bezeichne eine Variable als `α`

Das `∈`-Zeichen kann `in` ersetzen

Den Vergleichsoperator `>=` können wir schreiben als `≥`

Der Operator `≈` ist äquivalent zur `isapprox()` Funktion:

**Warnung:** 

1. Unicode Zeichen sind in anderen Editoren unter Umständen nicht so leicht einzufügen.
2. Die großzügige Verwendung von Unicode Zeichen ist eine Besonderheit von Julia. In vielen anderen Programmiersprachen ist das nicht möglich.