# **Beispielaufgabe**

Das Flügelradanemometer einer Wetterstation misst die mittlere Windgeschwindigkeit aller 10 Minuten. Aufgrund von technischen Schwierigkeiten bei der Datenübertragung sind einzele Werte fehlerhaft und mit 0 m/s gespeichert. Daher ergibt sich folgender Graph für die mittlere Windgeschwindigkeit über die Zeit:

![alt text](Abbildungen/windgeschwindigkeit_aufgabe.png)

### **Teilaufgaben**

1. Lesen Sie die Geschwindigkeitsdaten aus der Datei `geschwindigkeiten.csv` ein und speichern Sie die Zeit und Geschwindigkeit in zwei Numpy-Arrays.
2. Schreiben Sie eine Funktion, welche zwischen zwei bekannten Stützwerten linear interpoliert. Dabei sollen der Stützpunkt sowie die zwei Stützstellen übergeben werden und der linear interpolierte Stützwert zurückgegeben werden.
3. Berechnen Sie die fehlerhaften Werte mit Hilfe einer linearen Interpolation zwischen den korrekt gemessenen, benachbarten Werten. Stellen Sie das bereinigte Ergebnis in einem Diagramm dar.

### **Lösung**

Zunächst werden zwei zusätzliche Bibliotheken geladen: (1) Numpy zum einlesen der Geschwindigkeitsdaten und speichern in einem Numpy-Array und (2) Matplotlib zur Erstellung von Diagrammen.

In [1]:
# Laden der Module
import numpy as np
import matplotlib.pyplot as plt

Anschließend werden die Geschwindigkeitsdaten über der Zeit aus der Datei `geschwindigkeit.csv` eingelesen, welche sich im `Daten` Ordner befindet. Hier wird der Numpy-Befehl `genfromtxt()` verwendet mit folgenden Parametern:
 - `"Daten/geschwindigkeit.csv"`: Gibt den Pfad zur Datei an, welche eingelesen werden soll.
 - `delimiter=","`: Da es sich bei der Textdatei um eine CSV-Datei (**C**omma **S**eparate **V**alues) handelt, sind die Spalten mit Kommas voneinander getrennt. Diese Trennung kann mit Hilfe des `delimiter` Parameters explizit angegeben werden.
 - `unpack=True`: Um beide Spalten der Datei direkt in zwei getrennte Numpy-Arrays einzulesen, wird der Parameter `unpack` auf Wahr gesetzt. Damit können links vom Zuweisungsoperator zwei Variablen angeben werden, in welchen die zwei Spalten getrennt gespeichert werden.

In [2]:
# Rohdaten von Zeit und Windgeschwindigkeit
zeit, geschwindigkeit = np.genfromtxt("Daten/geschwindigkeit.csv", delimiter=",", unpack=True)

Anschließend wird eine Funktion geschrieben, welche *einen* Stützwert *y* an einem Stützpunkt *x* zwischen zwei benachbarten Stützstellen (*x*<sub>k</sub>, *y*<sub>k</sub>) und (*x*<sub>k+1</sub>, *y*<sub>k+1</sub>) linear interpoliert. Mathematisch entspricht dies folgener Gleichung:

$$ p(x) = \frac{y_{k+1}-y_k}{x_{k+1}-x_k}(x-x_k)+y_k $$

In Python implementiert ergibt sich folgende Funktion:

In [3]:
def interpolate(x, x1, x2, y1, y2):
    '''
    Lineare Interpolation von x zwischen den Punkten (x1, y1) und (x2, y2)
    
        Parameter:
            x           : x-Wert, an dem interpoliert werden soll
            (x1, x2)    : Bekannte Stützstellen
            (y1, y2)    : Bekannte Stützwerte
            
        Rückgabe:
            y           : Lösungsvektor
    '''

    # Bedingung, dass x zwischen x1 und x2 liegt
    if x1 <= x <= x2:
    
        return (y2 - y1) / (x2 - x1) * (x - x1) + y1

    # Falls Bedingung nicht erfüllt, Fehlermeldung
    else:

        raise ValueError('x-Wert liegt nicht zwischen den Stützstellen!')

Für die Interpolation aller fehlerhaften Datenpunkte wird anschließend eine `for`-Schleife verwendet, um über alle Datenpunkte zu iterieren und bei fehlerhaften Geschwindigkeiten diese basierend aus den Nachbarwerten zu interpolieren. Die `for`-Schleife läuft dabei über alle Indizes der Geschwindigkeiten, d.h. von 0 bis 10. Über den Index an anschließend sowohl auf die Zeit als auch die Geschwindigkeiten des entsprechenden Punktes (via `[index]`) zugegriffen werden, als auch auf die für die Interpolation benötigten Nachbarwerte (via `[index-1]` bzw. `[index+1]`). Das Vorgehen ist in folgender Abbildung veranschaulicht:

![alt text](beispielaufgabe.png)

Die entsprechende `for`-Schleife in Python mit Überprüfung der Geschwindigkeit und anschließender Interpolation sieht wie folgt aus:

In [4]:
# Schleife über alle (inneren) Zeiten
for index in range(1, len(zeit)-1):

    # Überprüfe, ob Windgeschwindigkeit fehlerhaft (d.h. = 0) ist
    if geschwindigkeit[index] == 0:

        # Aufruf der Interpolationsfunktion und Überschreiben der fehlerhaften Geschwindigkeit
        geschwindigkeit[index] = interpolate(
            zeit[index],
            zeit[index-1],
            zeit[index+1],
            geschwindigkeit[index-1],
            geschwindigkeit[index+1]
        )

Wurden die fehlerhaften Geschwindigkeiten im Numpy-Array `geschwindigkeit` korrigiert, kann anschließend die Geschwindigkeit in einem Diagramm dargestellt werden:

In [None]:
# Darstellen der korrigierten Geschwindigkeiten
plt.xlabel("Zeit [min]")
plt.ylabel("Windgeschwindigkeit [m/s]")
plt.title("Korrigierte Windgeschwindigkeit")
plt.grid(linewidth=0.5)
plt.scatter(zeit, geschwindigkeit)
plt.tight_layout()
plt.ylim(0,10)

plt.show()