# Übung 1 - Aufgabe 2 - Zeitpunkt der Kirschblüte

Der Start der Kirschblüte in der japanischen Stadt Kyoto wird seit Jahrhunderten nahezu Jahr für Jahr aufgezeichnet. Diese ist neben dem Wetter allgemein besonders von der durchschnittlichen Temperatur im März abhängig. Aufzeichnungen und Einschätzungen zum Wetter in diesem Zeitraum finden sich ebenfalls für Jahrhunderte. Entwickeln und trainieren Sie ein neuronales Netz, welches die durchschnittliche Märztemperatur und das Jahr aufnimmt, um eine Prognose für den Start der Kirschblüte zu geben. Diese Vorhersage soll als absoluter Jahrestag (99, 100, 101, usw.) geliefert werden. Ein Einbezug des Jahr soll hierbei vorgenommen werden, um mögliche Klimatrends zu berücksichtigen. Der Datensatz liegt als Semikolon-separiertes CSV-Dokument vor, welches die Spalten Jahr (AD), absoluter Jahrestag (Full-flowering date (DOY)) und durchschnittliche Märztemperatur (March-Mean-Temp) beinhaltet.

Diese Aufgabe hält sich sehr nah an das zweite Kapitel im Buch. Sie können es daher jederzeit als Referenz nutzen.

## 1. Nötige Imports vornehmen

Die benötigten Imports werden mit der folgenden Zelle vorgegeben. Der sklearn import ist optional für die Verwendung von Skalierern. 

In [1]:
import numpy as np
import torch
import torch.nn as nn
from sklearn import preprocessing

## 2. Einlesen der Daten

Beginnen Sie mit dem Einlesen der Daten aus der Datei "FlowerAndTemp.CSV". Bedenken Sie, dass sie Datei Semikolons als Separator nutzt. Im Anschluss werden die Daten explizit in float32 umgewandelt.

In [None]:
flower = None # Hier das Einlesen vornehmen
flower = flower.astype(np.float32)

## 3. (Optional) Skalieren der Daten

Viele Algorithmen im maschinellen Lernen arbeiten besonders gut, wenn Daten normalisiert bzw. auf einen wohldefinierte Bereich skaliert werden. Auch neuronale Netze können mit unterschiedlichen Größenordnungen Probleme haben. Sie können daher optionalerweise hier mittels eines Skalierers von Scikit-Learn diesem Problem entgegenwirken. Beispiele für eine Min-Max-Skalierung finden sich [hier](https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.MinMaxScaler.html). Hier müssen die Label vorher mittels einem Reshape in eine eigene Dimension gepackt werden. Dies würde beim Ausführen sonst Probleme mit Scikit-Learn verursachen.

In [None]:
scaler_x = preprocessing.MinMaxScaler()
scaler_y = preprocessing.MinMaxScaler()

# Hier optional das Skalieren vornehmen

## 4. Transformation der Daten

Im nächsten Schritt müssen die Daten in ein korrektes Format gebracht werden. Teilen Sie die Daten in 80% Trainings- und 20% Testdaten und entnehmen Sie die korrekten Spalten. Für die Features werden dabei die Spalten 0 (Jahr) und 2 (Temperatur) verwendet. Die Label selber stehen mit dem Start der Kirschblüte in Spalte 1. Wenn dies abgeschlossen ist, können Sie die Daten mit der Funktion "torch.from_numpy" in Tensore umwandeln.

In [2]:
x_train = None # Hier die Transformation vornehmen
x_test = None
y_train = None
y_test = None

# Hier das umwandeln in Tensore vornehmen

AttributeError: 'NoneType' object has no attribute 'reshape'

## 5. Aufbau des neuronalen Netzes

Nun, können Sie die Definition des neuronalen Netzes vornehmen. Verwenden Sie hierzu die Klasse ANN, welche in der folgenden Zelle unvollständig vorgegeben ist. In der init-Methode wird dem Netz eine Inputgröße, eine Liste mit Layergrößen und eine Ausgabegröße übergeben. Überlegen Sie nun wie Sie mit diesen Informationen und beliebiger Layerzahlen ein korrekt definierte Liste von Layern erstellen können. Zur Erinnerung: nn.linear(in_features, out_features) erzeugt einen Neuronenlayer mit in_features-Eingaben und out_features-Ausgaben.

Nutzen Sie in der forward-Methode nun die vorher definierte Layerliste, um die Daten korrekt durch das neuronale Netz zu leiten. Die Hidden-Layer und der Eingabe-Layer sollen die ReLu-Aktivierungsfunktion und der Ausgabelayer die Sigmoidfunktion verwenden.

In [None]:
class ANN(nn.Module):
    def __init__(self, input_size, layers, output_size):
        super(ANN, self).__init__()
        self.layers = []
        # Hier die Definition der Layer vornehmen.

    def forward(self, x):
        # Hier die Weiterleitung der Daten vornehmen.
        return x

## 6. Neuronales Netz, Verlustfunktion und Optimierer anlegen

Im Folgenden kann nun eine Instanz der Netzdefinition erzeugt werden. Hier können Sie frei mit den Größen der Hidden-Layern experimentieren. Im Beispiel sollte die Eingabe allerdings zwei Neuronen und die Ausgabe ein Neuron umfassen. Nutzen Sie für die Verlustfunktion den MSELoss, eine typische Verlustfunktion für Regressionsprobleme, und für den Optimizer den stochastischen Gradientenabstieg.

In [None]:
my_network = ANN(input_size=2, layers=[], output_size=1) # Hier Hidden Layer definieren 
criterion = # Hier Loss definieren
optimizer = # Hier Optimierer definieren

## 7. Training und Test des neuronalen Netzes

Schließlich kann nun das Training ausgeführt werden. Denken Sie hierbei an die Schlüsseloperationen aus dem Buch und geben Sie mit jeder Epoche den aktuellen Verlust aus. Optional, da dies im Buch noch nicht behandelt wird, können Sie das Netz alle n-Epochen mit den Testdaten testen. Denken Sie hierbei aber daran die Berechnung von Gradienten mittels torch.no_grad() für das Testen auszuschalten.

In [None]:
epochs = 200 # Anzahl der Epochen festlegen

for epoch in range(epochs):
    # Hier Training und ggf. Tests definieren