# Hackathon Example

Das Ziel des Hackathons ist, Energiedaten zu kombinieren und interessante Resultate zu visualisieren. Dazu verwenden wir am besten Jupyter Notebooks wie dieses hier.

In einem Notebook können wir Markdown-Code mit Python kombinieren, die einzelnen Code-Blöcke immer wieder anpassen, und die Resultate direkt modifizieren.

## Tools

### Python
Selbstredend.

### Jupyter Notebook Extension

Extension von Visual Studio Code. [Hier installieren](https://marketplace.visualstudio.com/items?itemName=ms-toolsai.jupyter).

### matplotlib (pyplot)
Eine Python-Bibliothek (also eine Sammlung von Funktionen), um mit Python schöne Grafiken zu erstellen. Generell lassen sich gängige Bibliotheken vom Terminal mit `pip` installieren

```bash
python -m pip install matplotlib
```
Wir können alternativ aber auch einfach sicherstellen, dass der _Kernel_, der den Python-Code dieses Notebooks ausführt, die Bibliotheke installiert hat:

In [2]:
import sys
!{sys.executable} -m pip install matplotlib

You should consider upgrading via the '/usr/local/bin/python3 -m pip install --upgrade pip' command.[0m[33m
[0m

## Comma-Separated Values

Wir wollen die öffentlich verfügbaren Datensätze verarbeiten. Die tabellarischen Daten liegen oft im CSV-Format (Comma-Separated Values) vor. Dabei repräsentiert jede Zeile ein Eintrag, wobei die Werte der einzelnen Spalten mit Kommas (manchmal auch Semikolons) abgetrennt sind. Enthält ein Wert ein Komma, kann der Wert in Anführungszeichen eingeschlossen sein. Die erste Zeile enthält oft die Spaltennamen:

```csv
Postleitzahl,Ort,Einwohner
8590,Romanshorn,11296
8580,Amriswil,14157
9320,Arbon,14872
```

Glücklicherweise gibt es in Python eine praktische [Bibliothek, um CSV-Daten](https://docs.python.org/3/library/csv.html) zu lesen.

Dazu verwenden wir `urllib.request` um die Daten direkt vom Internet zu laden, und `codecs` um die Binärdaten in Text umzuwandeln.

Zum Beispiel möchten wir mit den Daten zur Energieproduktion der Thurgauer Gemeinden arbeiten. Das Dataset findet sich unter https://data.tg.ch/explore/dataset/div-energie-10/table/, den Link zum CSV-Download findet sich unter _Exporte_. Der Download verwendet Semikolons.

Die Spaltennamen entnehmen wir ebenfalls der Webseite, um die Gemeinde und deren Energieproduktion zu erhalten.

In [14]:
import urllib.request
import codecs
import matplotlib as pyplot
import csv
import itertools

source = 'https://data.tg.ch/api/explore/v2.1/catalog/datasets/div-energie-10/exports/csv'

# Quelle übers Internet laden.
with urllib.request.urlopen(source) as energy_csv:
    # Binärdaten in Text konvertieren (Annahme: UTF-8 Encoding) und mit dem CSV-Reader einlesen
    # Achtung: wir verwenden Semikolons statt Kommas als Trennzeichen.
    reader = csv.DictReader(codecs.iterdecode(energy_csv, 'utf-8'), delimiter=';')
    # Für die ersten 10 Zeilen im Dataset geben wir den Namen und die totale Energieproduktion aus.
    for row in itertools.islice(reader, 0, 10):
        print(row['gemeinde_name'], row['total'])
        


Amlikon-Bissegg 8.26
Amriswil 5.061
Berg (TG) 3.21
Birwinken 0.971
Bischofszell 6.251
Braunau 0.844
Egnach 4.081
Erlen 2.51
Fischingen 2.532
Gottlieben 0.035
