# Daten laden und speichern
Dieser Abschnitt enthält Informationen über das Speichern und Laden von Arrays in und aus Dateien. Beginnen Sie mit dem Laden von NumPy.

In [None]:
import numpy as np
from os import path, remove

## Inhaltsverzeichnis
- [Beispieldaten](#Beispieldaten)
- [CSV](#CSV)
- [NumPy Binärdateien](#NumPy-Binärdateien)
- [Temporäre Dateien löschen](#Temporäre-Dateien-löschen)

## Beispieldaten
Erzeugen Sie zunächst ein Array mit zufälligen Zahlen, um die nachfolgenden Methoden testen zu können.

In [None]:
ar = np.random.randint(1, 8192, (1024, 1024))
ar.dtype, ar.shape, ar

## CSV
Mit CSV-Dateien haben Sie bereits in einem vorigen Kapitel Erfahrung gesammelt. NumPy kann direkt mit so formatierten Dateien interagieren und diese sowohl speichern wie auch einlesen. Zum Schreiben steht die Funktion `savetxt` bereit.

In [None]:
np.savetxt('random_array.csv', ar)

Sie können diese Datei mit einem Texteditor öffnen oder sich mit Hilfe des Kommandos `head` einige Zeilen anzeigen lassen.

Wenn Sie dem Pfad das Suffix `.bz2` oder `.gz` anfügen, wird automatisch eine Komprimierung im zugehörigen Format aktiviert.

In [None]:
np.savetxt('random_array.csv.bz2', ar)

Die Speicherung dauert vermutlich etwas länger, da die Kompression zusätzliche Zeit in Anspruch nimmt. Die Dateigröße unterscheidet sich jedoch in der Regel deutlich:

In [None]:
for file in 'random_array.csv', 'random_array.csv.bz2':
    size_in_mib = path.getsize(file) / (1024 * 1024)
    print(f'{file}: {size_in_mib:.1f} MiB')

Zum Laden steht die Funktion `loadtxt` bereit. Sie akzeptiert ebenfalls sowohl komprimierte wie auch nicht komprimierte Dateien.

In [None]:
ar2 = np.loadtxt('random_array.csv.bz2')

Der Vergleich des ursprünglichen und des geladenen Arrays sollte Gleichheit ergeben.

In [None]:
(ar == ar2).all()

## NumPy Binärdateien
NumPy bietet außerdem die Möglichkeit, Arrays mit Hilfe von Pickle in einem eigenen Binärformat zu speichern. Dazu existiert die Funktion `save`. Als Dateiendung verwendet man in der Regel `npy`.

In [None]:
np.save('random_array.npy', ar)

Mit `savez_compressed` existiert außerdem eine Funktion zur Speicherung mit Kompression bereit. Dafür wird die Dateiendung `npz` empfohlen.

In [None]:
np.savez_compressed('random_array.npz', ar)

Die Dateigrößen verhalten sich dabei wie folgt.

In [None]:
for file in 'random_array.npy', 'random_array.npz':
    size_in_mib = path.getsize(file) / (1024 * 1024)
    print(f'{file}: {size_in_mib:.1f} MiB')

Laden können Sie die Daten mit der Funktion `load`.

In [None]:
ar3 = np.load('random_array.npy')
(ar == ar3).all()

Beachten Sie, dass die Funktion `savez_compressed` eine Datei erzeugt, die mehrere Arrays enthalten kann. Sie müssen beim Laden daher zusätzlich das erste Array mit dem Namen `arr_0` auswählen.

In [None]:
ar4 = np.load('random_array.npz')['arr_0']
(ar == ar4).all()

## Temporäre Dateien löschen
Sie können die zu Anschauungszwecken angelegten Dateien nun wieder von Ihrem System löschen:

In [None]:
for file in 'random_array.csv', 'random_array.csv.bz2', 'random_array.npy', 'random_array.npz':
    if path.exists(file):
        remove(file)