# Mit Daten spielen

In [None]:
import csv
from glob import glob


files = glob('data/*.csv')

for csvFile in files:
    print(csvFile)
    with open(csvFile, 'r') as f: # Datei öffnen im 'read'-Modus
        reader = csv.DictReader(f) # CSV-Reader-Objekt instanziieren
        for row in reader: # Das Reader-Objekt ist ein Iterator (iterierbar)
            print(row)

## Gesamtjahresausleihzahlen

In [None]:
gesamtYTD = dict()
for csvFile in files:
    # Jahr aus Dateinamen extrahieren
    jahr = csvFile[5:9]
    with open(csvFile, 'r') as f: # Datei öffnen im 'read'-Modus
        reader = csv.DictReader(f) # CSV-Reader-Objekt instanziieren
        for row in reader: # Das Reader-Objekt ist ein Iterator (iterierbar)
            # Prüfe, ob Key schon im Dictionary existiert
            if jahr in gesamtYTD:
                gesamtYTD[jahr].append(row['ytd'])
            # Sonst liste anlegen
            else:
                gesamtYTD[jahr] = [ row['ytd'] ]

for k, v in gesamtYTD.items():
    print(f"{k}: {sum(v)}")

Was verursacht den `TypeError: unsupported operand type(s) for +: 'int' and 'str'`?
Welche Lösung gibt es?

(Die Lösung findet sich bei Bedarf im nächsten Schnipsel)

Sich das Leben einfacher machen mit `defaultdict`.
Die `defaultdict`-Methode aus dem `collections`-Modul der Standardbibliothek stellt ein modifiziertes Dictionary bereit.
Ein `defaultdict` initialisiert automatisch einen neuen Dictionary-Eintrag, wenn der Key nocht nicht im Dictionary enthalten ist.

In [None]:
from collections import defaultdict

gesamtYTD = defaultdict(list) # gibt es den Key noch nicht, wird eine leere Liste angelegt
for csvFile in files:
    # Jahr aus Dateinamen extrahieren
    jahr = csvFile[5:9]
    with open(csvFile, 'r') as f: # Datei öffnen im 'read'-Modus
        reader = csv.DictReader(f) # CSV-Reader-Objekt instanziieren
        YTDs = list()
        for row in reader: # Das Reader-Objekt ist ein Iterator (iterierbar)
            gesamtYTD[jahr].append(int(row['ytd']))
            

for k, v in gesamtYTD.items():
    print(f"{k}: {sum(v)}")

Nun wollen wir die Jahreszahlen vor der Ausgabe sortieren. Aus der csv wurden sie als `str` ausgelesen, sie würden also alphabetisch sortiert.
Es ließen sich schon beim Einlesen in `int` umwandeln.

Alternativ kann man auch nur fürs Sortieren die Strings als Zahlen betrachten (etwas komplizierter wegen der lambda-Funktion im key-Argument)

In [None]:
for k, v in sorted(gesamtYTD.items(), key = lambda x:int(x[0])):
    print(f"{k}: {sum(v)}")