# Musterlösung zum 3. Python-Workshop

# Vorbereitungen
Wir binden vorbereitend für die Aufgaben die folgenden Pakete ein
* `numpy` für mathematische Funktionen
* `matplotlib.pyplot` zur Erstellung von Plots
* `interpolate` aus `scipy` zur Erstellung von Interpolationen (Polynominterpolation, Taylor Polynome, Splines)
* `optimize` aus `scipy` zur Berechnung von kleinste-Quadrate-Approximationen
* `matplotlib.animation` zur Erstellung animierter Plots
* `HTML`aus `IPython.display`, um das Animations-Widget ins Notebook einbinden zu können.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import interpolate
from scipy import optimize
import matplotlib.animation as animation
from IPython.display import HTML

# Aufgabe 1:
Plotten Sie die Graphen zu 
  \\[  f(x) = x^n, \quad x \in [0,1]  \\]
für \\(n=1,2,\dots,4\\) in einem gemeinsamen Koordinatensystem. Beschriften Sie die Linien.

In [None]:
x = np.linspace(0,1,1000)

for n in range(1,5):
    y = x**n
    plt.plot(x,y, label = 'n='+str(n))

plt.grid()
plt.legend()
plt.title('Die Monome x^n')
plt.show()

# Aufgabe 2:
Es bezeichne \\(p_n(x)\\) das Interpolationspolynom mit \\(n+1\\) gleichabständigen Stützstellen zur Funktion \\( f(x) =  \sin x, \quad x \in [0,4\pi]\\).
  
* Plotten Sie jeweils in einem gemeinsamen Plot:
    1.  \\(f,\, p_3,\, p_5, \, p_7, \, p_9\\) im Intervall 
      \\([0,4\pi]\\),
    2.  \\(f,\, p_3,\, p_5, \, p_7, \,p_9\\) im Intervall 
      \\([-\pi,5\pi]\\).
* Erstellen Sie einen animierten Plot für \\(p_5\\) bis \\(p_{20}\\) im Intervall \\([0,4\pi ]\\). Zeichnen Sie dabei die das aktuelle Interpolationspolynom sowie die Funktion \\(f\\) ein. Markieren Sie außerdem die aktuell verwendeten Interpoaltionspunkte und zeigen Sie den aktuellen Wert von \\(n\\) an.
* Weshalb gilt \\(\lim \limits_{n \to \infty} |p_n(x) - \sin x | =0\\) für \\(x \in [0,4\pi]\\)?
* Erstellen Sie einen analogen animierten Plot, aber für die Funktion \\(f(x) = \frac{1}{1+x^2}\\) über dem Intervall \\([-5,5]\\).

In [None]:
def f(x):
    return np.sin(x)

**Plot über dem Intervall \\([0,4\pi]\\)**

In [None]:
x = np.linspace(0, 4*np.pi, 1000)
y = f(x)

plt.plot(x,y,label = 'Sinus')

for n in [3,5,7,9]:
    x_data = np.linspace(0,4*np.pi,n+1)
    y_data = f(x_data)
    poly = interpolate.BarycentricInterpolator(x_data, y_data)
    y_poly = poly(x)
    plt.plot(x,y_poly,label = 'n='+str(n))

plt.legend()
plt.ylim(-2,2)
plt.title('Interpolationspolynome des Sinus zu äquidistanten Stützstellen')
plt.show()

**Plot über dem Intervall \\([-\pi,5\pi]\\)**

In [None]:
x = np.linspace(-np.pi, 5*np.pi, 1000)
y = f(x)

plt.plot(x,y,label = 'Sinus')

for n in [3,5,7,9]:
    x_data = np.linspace(0,4*np.pi,n+1)
    y_data = f(x_data)
    poly = interpolate.BarycentricInterpolator(x_data, y_data)
    y_poly = poly(x)
    plt.plot(x,y_poly,label = 'n='+str(n))

plt.legend()
plt.ylim(-2,2)
plt.title('Interpolationspolynome des Sinus zu äquidistanten Stützstellen')
plt.show()

**Animierter Plot für \\(f(x)=\sin(x)\\)**

In [None]:
fig = plt.figure()

# 1.) Grafik-Elemente, die statisch bleiben sollen, werden erstellt
x = np.linspace(0, 4*np.pi, 1000)
y = f(x)
plt.plot(x,y)
plt.ylim(-2,2)

# 2.) Dynamische Grafik-Elemente werden zunächst ohne Daten erstellt
line, = plt.plot([], [], 'r-' )   # Interpolationspolynom
points, = plt.plot([], [], 'ro' ) # Stützstellen
label = plt.text(2*np.pi, 1.5, '', ha='center', va='top', fontsize=24) # Beschriftung von n

# 3.) frames-Funktion
def frames(i):
    n=i+5 # Frame-Zähler startet immer bei 0, wir fangen mit p_5 an
    # Neue Daten generieren, neues Interpolationspolynom berechnen
    x_data = np.linspace(0,4*np.pi,n+1) # n-tes Inerpolationspolynom --> n+1 Interpolationspunkte
    y_data = f(x_data)
    poly = interpolate.BarycentricInterpolator(x_data, y_data)  # Interpolationspolynom (auswertbare Python-Funktion)
    y_poly = poly(x)
    # Interpolationspolynom-Plot updaten
    line.set_data(x,y_poly)
    # Stützstellen-Plot updaten
    points.set_data(x_data, y_data)
    # Beschriftung updaten
    label.set_text("n = " + str(n))
    return line,points,label

# 4.) Animationsbefehl
ani = animation.FuncAnimation(
    fig, frames, interval=500, blit=True, save_count=16)

plt.close()
HTML(ani.to_jshtml())

**Animierter Plot für \\(f(x)=\frac{1}{1+x^2}\\)**

In [None]:
def f(x):
    return 1/(1+x**2)

Nachdem wir die neue Funktion \\(f\\) definiert haben, können wir den Code von oben kopieren und brauchen lediglich die Intervallgrenzen für den Vektor \\(x\\), den dargestellten \\(y\\)-Achsen-Abschnitt, die Position der Beschriftung sowie die Intervallgrenzen für den Stützstellenvektor `x_data` ändern.

In [None]:
fig = plt.figure()

# 1.) Grafik-Elemente, die statisch bleiben sollen, werden erstellt
x = np.linspace(-5, 5, 1000)
y = f(x)
plt.plot(x,y)
plt.ylim(-0.5,1.5)

# 2.) Dynamische Grafik-Elemente werden zunächst ohne Daten erstellt
line, = plt.plot([], [], 'r-' )   # Interpolationspolynom
points, = plt.plot([], [], 'ro' ) # Stützstellen
label = plt.text(0, 1.25, '', ha='center', va='top', fontsize=24) # Beschriftung von n

# 3.) frames-Funktion
def frames(i):
    n=i+5 # Frame-Zähler startet immer bei 0, wir fangen mit p_5 an
    # Neue Daten generieren, neues Interpolationspolynom berechnen
    x_data = np.linspace(-5,5,n+1) # n-tes Inerpolationspolynom --> n+1 Interpolationspunkte
    y_data = f(x_data)
    poly = interpolate.BarycentricInterpolator(x_data, y_data)  # Interpolationspolynom (auswertbare Python-Funktion)
    y_poly = poly(x)
    # Interpolationspolynom-Plot updaten
    line.set_data(x,y_poly)
    # Stützstellen-Plot updaten
    points.set_data(x_data, y_data)
    # Beschriftung updaten
    label.set_text("n = " + str(n))
    return line,points,label

# 4.) Animationsbefehl
ani = animation.FuncAnimation(
    fig, frames, interval=500, blit=True, save_count=16)

plt.close()
HTML(ani.to_jshtml())

# Aufgabe 3:
Es bezeichne \\(s_n(x)\\) den eingespannten kubischen Spline mit \\(n\\) gleichabständigen Stützstellen zur Funktion
  
  \\[  f(x) = \frac{1}{1+x^2}, \quad x \in [-5,5],  \\]
  
  und den  Randbedingungen \\(s'(-5) = -s'(5) = \frac{5}{338}\\).
  
* Plotten Sie \\(f,\, s_6,\, s_7, \, s_{11}\\) und \\(s_{12}\\) in einem gemeinsamen Plot. 
* Erstellen Sie einen animierten Plot für \\(s_n, n=6,8,...,30\\). Markieren Sie dabei die aktuell verwendeten Interpolationspunkte und geben Sie den aktuellen Wert von \\(n\\) an.

In [None]:
def f(x):
    return 1/(1+x**2)

**Plot von \\(f, s_6, s_7, s_{11}, s_{12}\\)**

In [None]:
x = np.linspace(-5,5,1000)
y = f(x)

plt.plot(x,y, label = 'Funktion f')

for n in [6,7,11,12]:
    x_data = np.linspace(-5,5,n) # n-ter Spline --> n Stützstellen
    y_data = f(x_data)
    # Berechnung des Splines:
    spline = interpolate.CubicSpline( x_data, y_data, bc_type=((1,5/338),(1,5/338)) ) # Spline (auswertbare Python-Funktion)
    y_spline = spline(x)
    plt.plot(x,y_spline, label = 'n='+str(n))

plt.legend()
plt.show()

**Animierter Plot**

In [None]:
fig = plt.figure()

# 1.) Grafik-Elemente, die statisch bleiben sollen werden erstellt
x = np.linspace(-5,5,1000)
y = f(x)
plt.plot(x, y, 'b-', linewidth=2)

# 2.) Grafik-Elemente, die sich ändern sollen werden zunächst ohne Daten erstellt
line, = plt.plot([], [], 'r-' )   # Spline
points, = plt.plot([], [], 'ro' ) # Stützstellen
label = plt.text(-2.5, 0.8, '', ha='center', va='top', fontsize=24) # Beschriftung
    
# 3.) frames-Funktion
def frames(i):
    n=2*i+6 # Frame-Zähler startet immer bei 0, wir fangen mit s_6 an und gehen in 2er-Schritten nach oben
    # Neue Daten generieren, neuen Spline berechnen
    x_data = np.linspace(-5,5,n) # n-ter Spline --> n Stützstellen
    y_data = f(x_data)
    spline = interpolate.CubicSpline( x_data, y_data, bc_type=((1,5/338),(1,5/338)) ) # Spline (auswertbare Python-Funktion)
    # Spline-Plot updaten
    y_spline = spline(x)
    line.set_data(x,y_spline)
    # Stützstellen-Plot updaten
    points.set_data(x_data, y_data)
    # Beschriftung updaten
    label.set_text("n = " + str(n))
    return line,points,label

# 4.) Animationsbefehl
ani = animation.FuncAnimation(
    fig, frames, interval=500, blit=True, save_count=13)

plt.close()
HTML(ani.to_jshtml())

# Aufgabe 4:
Approximieren Sie die Funktion  \\(y = \ln x\\), \\(x \in [1,20]\\)  mit den
Stützstellen   \\(x_i = i\\), \\(i=1,\dots,20,\\)  mit der Methode der
kleinsten Quadrate wie folgt:

* Berechnen und plotten Sie die Ausgleichsgerade sowie die Ausgleichsparabel 3. und 5. Grades. Berechnen Sie jeweils die Summe der Fehlerquadrate. 
* Berechnen Sie das Interpolationspolynom \\(p\\) sowie den natürlichen Spline \\(s\\) zu den Stützstellen. Plotten Sie die Ausgleichsparabel 5. Grades gemeinsam mit \\(p\\) und \\(s\\).
* Stören Sie die Funktionswerte zufällig mit einem relativen Fehler von 5%. Berechnen und plotten Sie das zugehörige Interpolationspolynom, den Spline und die Ausgleichs\-parabel 5. Grades.

**Ablauf: Kleinste Quadrate Optimierung in Python**
Die kleinste Quadrate Optimierung läuft in Python folgendermaßen ab:
* Die Optmierung braucht das Paket `optimize` aus `scipy`. Durch den Befehl `from scipy import optimize` haben wir dieses zu Beginn des Notebooks bereits geladen.
* Zunächst gibt man den gewählten Modellierungsansatz an. Dazu definiert man eine Prozedur `fun`, die abhängig von den zu schätzenden Parametern `pars` den durch das Modell gegebenen y-Wert für einen x-Wert berechnet (vg. Gl. 4.10 im Skript), d.h. eine Prozedur der Form

```
def fun(pars,x):
    y=...
    return y
```
* Anschließend wird eine Prozedur `residuals` definiert, die für eine Funktion `fun` wie eben definiert, wieder in Abhängigkeit der Parameter `pars` für gegebene Werte x und y das Residuum berechnet, d.h. den Wert `y-fun(x)`. Die Summe der Quadrate dieser Residuen, die diese Funktion für unsere vorliegenden Messdaten liefert, werden später minimiert (vgl. Gl. 4.13 im Skript). Die Prozedur sieht also folgendermaßen aus:

```
def residuals(pars,fun,x,y):
    return y - fun(pars,x)
```
* Für die Optimierung werden Anfangs-Schätzungen `pars_0` für die Parameter `pars` benötigt. Als einfachste Variante kann man z.B. alle Parameter gleich Null setzen, d.h. `pars_0` als den Nullvektor passender Größe setzen.
* Nun können wir den Befehl `optimize.least_squares` verwenden, um die kleinste Quadrate Approximation zu berechnen. Dabei müssen wir folgende Parameter übergeben:
    1. Den Namen der Residuums-Funktion, bei uns `residuals`
    2. Die Anfangsschätzungen `pars_0`
    3. Ein Tupel `args`, das die Werte der weiteren Argumente der Funktion `residuals` abgesehen von den Parametern `pars` enthält. Es enthält also zunächst die Modellfunktion `fun`. Für `x` und `y` übergeben wir hier unsere Messwerte. Wir nehmen an, dass diese in zwei Vektoren `x_data` und `y_data` gespeichert sind. Die Ergebnisse der Optimierung speichern wir in der Variable `optimization_results`. Insgesamt rufen wir also den folgenden Befehl auf:

```
    optimization_results = optimize.least_squares(residuals, pars_0, args=(fun, x_data, y_data) )
```
* Das Element `optimization_results` enthält viele Details zu den Optimierungsergebnissen. Die eigentlichen Parameter, an denen wir in erster Linie interessiert sind, erhält man durch `optimization_results.x`. Die Summe der Fehlerquadrate erhält man durch `optimization_results.cost`.

**Nun zur eigentlichen Aufgabe:**

Erzeugung der Modelldaten:

In [None]:
def f(x):
    return np.log(x)

x_data = np.array(range(1,21))
y_data = f(x_data)

**Plot der Ausgleichsgeraden und Ausgleichsparabeln 3./5. Ordnung**

Wir wollen eine kleinste Quadrate-Approximation mit verschiedenen Modellfunktionen durchführen, nämlich mit einer Geraden (Polynom von Grad 1), einem Polynom von Grad 3 oder einem Polynom vom Grad 5 als Modellfunktion. Wir definieren daher eine Modellfunktion `polynomial` mit einem zusätzlichen Parameter `n`, der den Grad des Modellpolynoms angibt. Der Parametervektor `pars` entält dann dementsprechend `n+1` Parameter (=Koeffizienten des Polynoms). Auch die Residuums-Funktion `residuals`hat den zusätzlichen Parameter `n`, da in dieser ja wiederum die Modellfunktion `polynomial` aufgerufen wird.

In [None]:
def polynomial(pars,x,n):
    y=0
    for i in range(n+1):
        y = y + pars[i]*x**i
    return y

def residuals(pars,fun,x,y,n):
    return y - polynomial(pars,x,n)

Den Optimierungsbefehl wollen wir dann für `n=1,3,5` aufrufen. Dazu erstellen wir eine passende `for`-Schleife. In dieser erstellen wir zunächst als Anfangs-Schätzung einen Nullvektor der passenden Größe (`n+1` Nullen), rufen den Optimierungsbefehl auf (beachte, dass wir zusätzlich das Argument `n` der `residual`-Funktion im Tupel `args` übergeben müssen), lesen die Parameter aus dem Optimierungsergebnis aus und plotten die durch diese Parameter bestimmte Funktion. Außerdem geben wir das Fehlerquadrat aus.

In [None]:
for n in [1,3,5]:
    pars_0 = np.zeros(n+1)
    optimization_results = optimize.least_squares(residuals, pars_0, args=(polynomial, x_data, y_data, n) )
    optimal_pars = optimization_results.x
    # Gebe Fehlerquadrate aus
    print('n =',n,'--> Fehlerquadrat',optimization_results.cost)
    # Plotte Ergebnis-Funktion:
    x = np.linspace(1,20,1000)
    y_poly = polynomial(optimal_pars,x,n)
    plt.plot(x,y_poly, label = 'n = ' + str(n))

# Ergänze Plot der Datenpunkte und der Funktion f selbst:
plt.plot(x_data,y_data,'ro', label = 'Datenpunkte')
y = f(x)
plt.plot(x,y, label = 'f')

plt.legend()
plt.show()

**Interpolationspolynom, Spline & Ausgleichsparabel im Vergleich - ohne Störung der Messdaten**

In [None]:
# Ausgleichsparabel
n=5
pars_0 = np.zeros(n+1)
optimization_results = optimize.least_squares(residuals, pars_0, args=(polynomial, x_data, y_data, n) )
optimal_pars = optimization_results.x
x = np.arange(1,20+0.01,0.01)
y_poly = polynomial(optimal_pars,x,n)
plt.plot(x,y_poly, label = 'Ausgleichsparabel')

# Inerpolationspolynom
interpol = interpolate.BarycentricInterpolator(x_data, y_data)
y_interpol = interpol(x)
plt.plot(x,y_interpol, label = 'Interpolationspolynom')

# Spline
spline = interpolate.CubicSpline( x_data, y_data, bc_type='natural' ) # Spline (auswertbare Python-Funktion)
y_spline = spline(x)
plt.plot(x,y_spline, label = 'Spline')

# Datenpunkte
plt.plot(x_data,y_data,'ro', label = 'Datenpunkte')

plt.legend()
plt.show()

**Interpolationspolynom, Spline & Ausgleichsparabel im Vergleich - mit Störung der Messdaten**

Wir stören die Messdaten zufällig mit einem relativen Fehler von 5%. Durch den Befehl `np.random.rand(N)` werden \\(N\\) Pseudo-Zufallszahlen im Intervall \\([0,1]\\) (gemäß einer Gleichverteilung) erzeugt. Diese transformieren durch Muliplikation mit \\(2\\) und Subtraktion von \\(1\\) auf Zufallszahlen im Intervall \\([-1,1]\\). Die Messdaten stören wir, indem wir die Werte aus dem Vektor `y_data` mit Faktoren der Form \\(1+0.05\cdot z\\) multiplizieren, wobei \\(z\\) die Zufallszahlen sind. Anschließend können wir identisch wie oben Ausgleichsparabel, Spline und Interpolationspolynom zu den neuen Messdaten erzeugen.

**Man beachte das Ausbrechen des Interpolationspolynoms!**

In [None]:
# Zufällige Störung der Messdaten
x_data = np.array(range(1,21))
y_data = f(x_data)
z = np.random.rand(20)
y_data = y_data*(1+0.05*z)

# Ausgleichsparabel
n=5
pars_0 = np.zeros(n+1)
optimization_results = optimize.least_squares(residuals, pars_0, args=(polynomial, x_data, y_data, n) )
optimal_pars = optimization_results.x
x = np.arange(1,20+0.01,0.01)
y_poly = polynomial(optimal_pars,x,n)
plt.plot(x,y_poly, label = 'Ausgleichsparabel')

# Inerpolationspolynom
interpol = interpolate.BarycentricInterpolator(x_data, y_data)
y_interpol = interpol(x)
plt.plot(x,y_interpol, label = 'Interpolationspolynom')

# Spline
spline = interpolate.CubicSpline( x_data, y_data, bc_type='natural' ) # Spline (auswertbare Python-Funktion)
y_spline = spline(x)
plt.plot(x,y_spline, label = 'Spline')

# Datenpunkte
plt.plot(x_data,y_data,'ro', label = 'Datenpunkte')

plt.legend()
plt.ylim([0,4])
plt.show()

**Alternativ: Ausgleichsgerade und Ausgleichsparabeln durch manuelle Aufstellung des Normalgleichungssystems**

In [None]:
def poly(x,weights):
    n = len(weights)
    res = 0
    for i in range(n):
        res = res + weights[i]*x**i
    return res

In [None]:
x = np.arange(1,20+0.01,0.01)
y = f(x)
plt.plot(x,y, label = 'Funktion f')

x_data = np.array(range(1,21))
y_data = f(x_data)
plt.plot(x_data,y_data,'ro', label = 'Datenpunkte')

# Ausgleichsgerade y = a + bx
A = np.transpose( np.vstack( (np.ones(20),x_data) ) )
# Löse LGS A^T A w = A^T y_data
weights = np.linalg.solve(A.T@A,A.T@y_data)
# Berechne Funktionwerte der Gerade und plotte sie
y_1 = poly(x,weights)
plt.plot(x,y_1, label = 'Ausgleichsgerade')

# Ausgleichsparabel 3. Ordnung y = a + bx + cx^2 + dx^3
A = np.transpose( np.vstack( (np.ones(20),x_data,x_data**2,x_data**3) ) )
# Löse LGS A^T A w = A^T y_data
weights = np.linalg.solve(A.T@A,A.T@y_data)
# Berechne Funktionwerte der Parabel 3. Ordnung und plotte sie
y_3 = poly(x,weights)
plt.plot(x,y_3, label = 'Parabel 3. Ordnung')

# Ausgleichsparabel 5. Ordnung y = a + bx + cx^2 + dx^3 +ex^4 + fx^5
A = np.transpose( np.vstack( (np.ones(20),x_data,x_data**2,x_data**3,x_data**4,x_data**5) ) )
# Löse LGS A^T A w = A^T y_data
weights = np.linalg.solve(A.T@A,A.T@y_data)
# Berechne Funktionwerte der Parabel 3. Ordnung und plotte sie
y_5 = poly(x,weights)
plt.plot(x,y_5, label = 'Parabel 5. Ordnung')

plt.legend()
plt.show()