# Daten strukturiert speichern

In diesem Notebook werden die zentralen Schritte zum Speichern strukturierter Daten in JSON- und CSV-Dateien skizziert.

## Daten in eine CSV-Datei speichern

Mit CSV-Dateien wollen wir tabellarisch strukturierte Daten verarbeiten.

In Python gibt es verschiedene Wege, mit CSV-Dateien zu arbeiten:
- Standardweg: [CSV-Modul](https://docs.python.org/3/library/csv.html)
- Alternative: [Pandas](https://pandas.pydata.org/docs/) 

### Aufbau

**Darstellung als Tabelle**

| ID | Titel | Autor:in | Erscheinungsjahr |
|:---|-------|-------|-----------------:|
| 1 | Der Prozess | Franz Kafka  | 1935 |
| 2 | Half of a Yellow Sun | Chimanda Ngozi Adichie  | 2006 |
| 3 | Network Effect | Martha Wells  | 2020 |

**Darstellung als CSV**
```
ID,Titel,Autor:in,Erscheinungsjahr
1,Der Prozess,Franz Kafka,1935
2,Half of a Yellow Sun,Chimanda Ngozi Adichie,2006
3,Network Effect,Martha Wells,2020
```

### CSV-Datei schreiben

In [None]:
import csv

book_list = [
    ["ID", "Titel", "Autor:in", "Erscheinungsjahr"],
    [1, "Der Prozess", "Franz Kafka", 1935],
    [2, "Half of a Yellow Sun", "Chimanda Ngozi Adichie", 2006],
    [3, "Network Effec", "Martha Wells", 2020]
]

with open("data/books.csv", "w", newline="") as csv_file: # newline v.a. bei Windowsrechnern relevant
    writer = csv.writer(csv_file)

    for book in book_list:
        writer.writerow(book)

### CSV-Datei einlesen und erweitern

In [None]:
with open("data/books.csv", "a", newline="") as csv_file: # modus "a" - append: CSV-Datei öffnen oder erstellen und Daten anhängen
    writer = csv.writer(csv_file)

    writer.writerow([4, "Das Haus - House of Leaves", "Mark Z. Danielewski", 2000])

### CSV-Dateien einlesen

In [None]:
# option 1: lists

with open("data/books.csv", "r", newline="") as csv_file: # modus "r" - read
    reader = csv.reader(csv_file, delimiter=",") # delimitier per default comma
    
    for row in reader:
        print(row) 

In [None]:
#option 2: dictionary

# option 1: lists

with open("data/books.csv", "r", newline="") as csv_file: # modus "r" - read
    reader = csv.DictReader(csv_file, delimiter=",") # delimitier per default comma
    
    for row in reader:
        print(row)

## Daten in eine JSON-Datei speichern

In [None]:
# Aufbau einer JSON (kein ausführbarer Code)

{
    "label": "My Library",
    "books available": true,
    "owner": "Melanie Althage",
    "books": [
        {
            "title": "Der Prozess",
            "author": "Franz Kafka",
            "year": 1935,
            "editions": [
                1935,
                1946,
                1963,
                1990,
                2011,
                2012
            ]
        },
        {
            "title": "Half of a Yellow Sun",
            "author": "Chimamanda Ngozi Adichie",
            "year": 2006,
            "editions": [
                2006,
                2007,
                2017
            ]
        },
        {
            "title": "Network Effect",
            "author": "Martha Wells",
            "year": 2020,
            "editions": [
                2020
            ]
        }
    ]
}

### JSON-Datei einlesen, erweitern und speichern

In [None]:
import json

with open("data/books.json", "r") as json_file:
    library_content = json.load(json_file)

print(type(library_content))
print(library_content)

In [7]:
library_content["books"].append(
    {"title": "Das Haus - House of Leaves",
            "author": "Mark Z. Danielewski",
            "year": 2000,
            "editions": [
                2000]})

with open("data/books_v2.json", "a") as json_file:
    json.dump(library_content, json_file, ensure_ascii=False, indent=4)  # per default wird die mit dump erzeugte JSON in einer Zeile geschrieben (ressourcenschonend), über die Konfiguration des Parameters indent wird die Datei besser lesbar         

## Aufgabe:

Sie planen eine Feier mit einem Buffet. Dafür möchten Sie eine strukturierte Auflistung der Teilnehmer:innen erstellen unter Angabe von Allergien und Ernährungsweisen (omnivor, vegetarisch, vegan, kein Schweinefleisch, ...), damit sie die Informationen entsprechend an das Cateringunternehmen weitergeben können.

Sie können frei wählen, ob Sie die Informationen als JSON oder CSV-Datei abspeichern möchten. Strukturieren Sie die Informationen beispielhaft für drei Teilnehmer:innen entweder als Dictionaries oder Listen und speichern die Informationen in eine Datei. Ihre JSON- oder CSV-Datei sollte die Informationen mindestens wie folgt strukturieren: Nachname, Vorname, Ernährungsform, Allergie.

Es hat sich noch ein:e Teilnehmer:in gemeldet. Öffnen Sie die von Ihnen gespeicherte Datei und fügen Sie einen weiteren Eintrag hinzu. Speichern Sie die aktualisierte Datei.

Wenn Sie das Thema "Dateien verarbeiten" noch mal etwas intensiver bearbeiten möchten, empfehlen wir Ihnen das entsprechende Kapitel im Jupyter Book [Python für Historiker:innen - Ein anwendungsorientierter und interaktiver Einstieg](https://digital-history-berlin.github.io/Python-fuer-Historiker-innen/ch04-dateien-verarbeiten/01-dateien-verarbeiten.html).