# Jupyter Notebook: Temperaturverlauf

## Daten Laden
Als erstes laden wir die Datei (jährliche Durchschnittstemperaturen) aus der Datei 'regional_averages_tm_year.txt' und geben die Titelzeile aus damit wir wissen, dass wir die korrekte Datei lesen.

<div class="alert alert-info">

**Wichtig:** Die zu lesende Datei muss sich in demselben Verzeichnis befinden wie das Jupyter Notebook!

Falls dies nicht der Fall ist muss die Datei in dasselbe Verzeichnis kopiert oder ein absoluter Pfad angegeben werden. Ein absoluter Pfad wäre zum Beispiel: 'C:/Downloads/regional_averages_tm_year.txt' anstatt 'regional_averages_tm_year.txt'.

</div>

In [None]:
import csv
with open('regional_averages_tm_year.txt') as csvfile:
    readCSV = csv.reader(csvfile, delimiter=';')
    title = next(readCSV, None)  # returns title
    print(title)

Wir wollen nun die ersten 6 Spalten aus der Datei lesen. Dazu öffnen die Datei noch einmal. Nach dem Titel lesen wir die Zeile mit den Tabellenüberschriften (headers) und geben die ersten 6 Einträge aus. Danach lesen wir jede einzelne Zeile der Datei und tragen die Werte in den jeweiligen Array ein.

In [None]:
jahr = []
temperaturBerlin = []
temperaturBrandenburg = []
temperaturBW = []
temperaturBayern = []
temperaturHessen = []
with open('regional_averages_tm_year.txt') as csvfile:
    readCSV = csv.reader(csvfile, delimiter=';')
    title = next(readCSV, None)  # returns title
    headers = next(readCSV, None)  # returns headers
    if headers:
        print(headers[1:7])
    for row in readCSV:        
        jahr.append(int(row[0]))
        temperaturBerlin.append(float(row[3]))
        temperaturBrandenburg.append(float(row[4]))
        temperaturBW.append(float(row[5]))
        temperaturBayern.append(float(row[6]))
        temperaturHessen.append(float(row[7]))

## Daten Auswerten und Visualisieren
Als nächstes wollen wir die Daten visualisieren um ein besseres Verständnis von ihnen zu gewinnen. Die Bibliothek matplotlib ist für alle möglichen Arten der grafischen Darstellung geeignet. 
### Historischer Verlauf Berlin
Wir starten mit einem ganz einfachen Liniendiagramm. Auf der horizontalen Achse wird der Array jahr mit den Jahreszahlen dargestellt und auf der vertikalen Achse der Array temperaturBerlin also die erste Spale von Temperaturwerten aus der Quelldatei.

In [None]:
import matplotlib.pyplot as plt
plt.plot(jahr, temperaturBerlin)

### Niedrigste und höchste Durchschnittstemperatur Berlin
Eine einfache Auswertung ist die Untersuchung der minimalen und maximalen Werte eines Arrays.

In [None]:
minBerlin = min(temperaturBerlin)
jahrMinBerlin = jahr[temperaturBerlin.index(min(temperaturBerlin))]
print ("niedrigste jährliche Durchschnittstemperatur in Berlin: " + str(minBerlin) + " - aus Jahr " + str(jahrMinBerlin))
maxBerlin = max(temperaturBerlin)
jahrMaxBerlin = jahr[temperaturBerlin.index(max(temperaturBerlin))]
print ("höchste jährliche Durchschnittstemperatur in Berlin: " + str(maxBerlin) + " - aus Jahr " + str(jahrMaxBerlin))

### Darstellung von 5 Bundesländern
Als nächstes erstellen wir eine etwas aufwändigere Grafik, die alle Arrays enthält inklusive Beschriftungen. Es handelt sich um einen sogenannten Scatter plot (englisch Streudiagramm) in dem die verstreut dargestellt werden Datenpunkte.

In [None]:
plt.title("Temperaturen 5 Bundesländer")
plt.xlabel("Jahr")
plt.ylabel("Temperatur")
plt.plot(jahr, temperaturBerlin, "r*", markersize=6, linewidth=1, color='g', label="Berlin")
plt.plot(jahr, temperaturBrandenburg, "r*", markersize=6, linewidth=1, color='r', label="Brandenburg")
plt.plot(jahr, temperaturBW, "r*", markersize=6, linewidth=1, color='b', label="BadenWuerttemberg")
plt.plot(jahr, temperaturBayern, "r*", markersize=6, linewidth=1, color='y', label="Bayern")
plt.plot(jahr, temperaturHessen, "r*", markersize=6, linewidth=1, color='m', label="Hessen")
plt.legend(loc=(.95, 0.025))
plt.show()

### Verteilung von Temperaturdaten
Zur Darstellung der Verteilung von Daten verwendet man gerne den Box plot (englisch Kastengrafik). 

In [None]:
box_plot_data=[temperaturBerlin,temperaturBrandenburg,temperaturBW,temperaturBayern,temperaturHessen]
box_plot_names=["Berlin","Brandenburg","Baden-Wuerttemberg","Bayern","Hessen"]
fig = plt.figure(1, figsize=(12, 5))
ax = fig.add_subplot(111)
bp = ax.boxplot(box_plot_data)
ax.set_xticklabels(["Berlin","Brandenburg","Baden-Wuerttemberg","Bayern","Hessen"])
plt.show()