# Kapitel 9 - Taylorreihen

In [1]:
import sys
sys.path.append("../src/") 
from quiz import start_quiz
from utils import css_styling, hide_code
from IPython.display import IFrame
from functionplotter import plt_function
css_styling()

## 1. Kapitelübersicht <a class="anchor" id="1"/>

In diesem Kapitel schauen wir uns an, wie wir sehr komplexe Funktionieren **approximieren**/ annähern können, indem wir eine Reihe simplerer Funktion zur Approximation verwenden. Dazu führen wir die **Taylorreihen** ein. Um diese aber besser verstehen zu können, gucken wir uns vorher die allgemeineren **Potenzfunktionen** an. Zuletzt schauen wir uns Taylorreihen für multivariate Funktionen an.


<b>Abschnittsübersicht</b><br>

[1. Kapitelübersicht](#1)<br>
[2. Approximationen von Funktionen](#2)<br>
[3. Potenzreihen](#3)<br>
[3.1. Die Formel im Detail](#3-1)<br>
[3.2. Abgeschnittene Potenzreihen](#3-2)<br>
[4. Taylorreihen](#4)<br>
[5. Multivaribale Taylorreihen](#5)<br>

<b>Quizübersicht</b><br>
[Taylorreihen Quiz](#q1)<br>

<b>Behandelte Themen</b><br>
- Approximation von Funktionen
- Analytische und numerische Ableitungen
- Potenzreihen
- Abgeschnittene Potenzreihen
- Taylorreihen
- Multivariable Taylorreihen
- Linearisierung

## 2. Approximationen von Funktionen <a class="anchor" id="2"/>

Der Begriff **"Approximation"** bedeutet im mathematischen Sinne "**Näherung**" oder "**Annäherung**". Wir werden Approximationen verwenden, um Funktionen anzunähern. Tatsächlich sind alle Ableitungsfunktionen, die wir bis jetzt verwendet haben, im Grunde Annäherungen. In Kapitel 5 hatten wir gelernt, wie wir Funktionen einfach ableiten können. Doch ein Kapitel zuvor hatten wir uns die, den Ableitungsregeln aus Kapitel 5 zugrunde liegende, **h-Methode** angeguckt, die Formel dafür war:<br>

$ f'(x) = \lim \limits_{h \to 0} \dfrac{f(x + h) - f(x)}{h}$<br>

Die h-Methode enthält den namensgebenden Platzhalterwert $h$, der für den **Abstand** zweier Werte steht:<br>

$h = x_1 - x_0$<br>

Diesen Abstand minimieren wir, sodass dieser eine unendlich kleine Zahl wird und somit gegen $0$ tendiert. Dadurch können wir in der eigentlichen Ableitung diesen Wert weglassen, da er so gut wie keine Auswirkung auf die Ableitungsfunktion hat. Bei den vereinfachten Ableitungsregeln in Kapitel 5 wird dieser Wert deshalb immer weggelassen. Die beiden verschiedenen Arten der Ableitungsbildung werden **analytische Ableitungen** und **numerische Ableitungen** genannt:<br>

- **Analytische Ableitungen**: Exakte Ableitung, die <u>keine</u> Annäherung verwendet. Wird in der Praxis angewendet, da sie simpler und schneller zu berechnen ist (wurde ab Kapitel 5 verwendet).
- **Numerische Ableitungen**: Annäherende Ableitung, die eine Annäherung verwendet. Wird in der Praxis weniger häufig angewendet, da sie komplizierter und länger zu berechnen ist (wurde in Kapitel 4 gezeigt).

Doch wieso sollte uns die numerischen Ableitungen interessieren, wenn die analytischen Ableitungen exakter, simpler und schneller zu berechnen sind? Dafür gibt es mehrere Gründe, auf die wir aber nicht alle im Detail eingehen, da diese den Rahmen dieser Tutorialreihe sprengen würden.[<sup>1</sup>](#fn1) Ein Grund ist jedoch, dass die der analytische Ansatz der Berechnung einer Ableitung einer gegebenen Funktion unterschiedlich kompliziert werden kann, während der numerische Ansatz nie komplizierter wird. 

Die numerischen Ableitungen beinhalten aufgrund der Verwendung des Platzhalterwerts $h$ einen Fehler, auch wenn dieser sehr gering ist. Diese Idee, dass man einen geringen Fehler in Kauf nimmt, um so Probleme lösen zu können, wird auch bei der **Approximation von Funktionen** verwendet. Mithilfe dieser Technik können wir Funktionen durch eine Reihe anderer Funktion annähern, also mit einem gewissen Fehler/Unterschied darstellen. Doch wieso sollten wir das machen, vor allem wenn wir die Funktion bereits kennen? Die Funktionen, die wir bis jetzt betrachtet haben, waren nicht sonderlich komplex, es war eigentlich immer möglich, Ableitungen zu bilden oder andere Dinge zu bestimmen. Doch wie Sie sich sicher vorstellen können, können Funktionen sehr komplex werden. Einige Probleme können bei diesen Funktion gar nicht oder nur sehr schwer gelöst werden. Approximationen können in solchen Fällen hilfreich sein, da sie ein Problem einfacher oder teilweise überhaupt erst lösbar machen. Dieses <a href="https://www.youtube.com/watch?v=ZL8rbGD8WAk">Video</a> nennt dafür ein paar konkrete Beispiele.



<hr style="border: 0.1px solid black;"/>
<span id="fn1" style="font-size:8pt; line-height:1"><sup style="font-size:5pt">1</sup>&nbsp; Das mathematische Teilgebiet, welches sich damit beschäftigt, nennt sich <a href="https://de.wikipedia.org/wiki/Numerische_Mathematik#:~:text=Die%20numerische%20Mathematik%2C%20auch%20kurz,Approximationsalgorithmen%20mit%20Hilfe%20von%20Computern">Numerische Mathematik</a>.</span><br> 

## 3. Potenzreihen <a class="anchor" id="3"/>

Bevor wir uns die Taylorreihe anschauen, müssen wir erst einmal verstehen, wie eine **Potenzreihe** aufgebaut, da diese eine Verallgemeinerung der Taylorreihe ist. Die Formel für die Potenzreihe ist:<br>

$P(x) = \sum\limits_{n=0}^{\infty} a_n (x - p)^n$<br>

### 3.1. Die Formel im Detail <a class="anchor" id="3-1"/>

Schauen wir uns die Formel etwas genauer an. In der Formel wird etwas <u>aufsummiert</u>. Die untere Grenze für die Summe ist $n$, dass heißt, dass $n$ bei jedem Summand um $1$ erhöht wird. Die obere Grenze ist $\infty$, d.h. wir machen dies unendlich oft. Um ein besseres Verständnis dafür zu entwickeln, was die Potenzreihe im Grunde macht, setzen wir nun die obere Grenze für die Formel auf $3$ und schreiben die Summe aus:<br>

$P(x) = \sum\limits_{n=0}^{3} a_n (x - p)^n = a_0 (x - p)^0 + a_1 (x - p)^1 + a_2 (x - p)^2 + a_3 (x - p)^3$<br>


Nun haben wir die Formel etwas vereinfacht, jedoch sind immer noch mindestens zwei Dinge unklar: Was ist $a_n$ und was ist $p$? $a_n$ ist einfach nur ein **Koeffizient**. In der **Taylorreihe** wird dieser Koeffizient noch genauer definiert, aktuell definieren wir diesen nicht weiter. $p$ ist ein sogenannter **Entwicklungspunkt** (auch: **Entwicklungsstelle**), mit dem wir angeben, an welcher Stelle wir die Potenzreihe bilden wollen. Im Grunde ist das aber eine fixe Zahl, die zu Beginn der Berechnung der Potenzreihe gegeben ist und den wir einfach in die Formel einsetzen. Um die Formel nun also noch etwas zu vereinfachen, setzen wir $p = 0$ und wir erhalten:<br>

$P(x) =  a_0 x^0 + a_1 x^1 + a_2 x^2 + a_3 x^3$<br>

Ohne zu wissen was $a$ ist, können wir diese Gleichung noch weiter vereinfachen, da wir wissen, dass $x^0 = 1$ ist:<br>

$P(x) =  a_0 + a_1 x + a_2 x^2 + a_3 x^3$<br>

Dieser Aufbau der Gleichung sollte Ihnen nicht ganz unbekannt vorkommen. Wenn Sie sich an Kapitel 2 zurückerinnern, werden Sie feststellen, dass wir dort sogenannte **Polynomfunktionen** eingeführt hatten (Kapitel 2.5). Polynomfunktionen bestehen aus den namensgebenden **Polynomen**, d.h. einer Summe von Termen, die jeweils ein Produkt eines Koeffizienten mit einer Potenz $x^n$ sind. $n$ stand hier für den **Grad** des Polynoms, also den höchsten auftretenden Exponenten. Die Formel für die Polynomfunktionen war:<br>

$f(x) = a_n\cdot x^n + a_{n-1}\cdot x^{n-1} + … + a_1\cdot x + a_0$<br>

Stellen wir diese Funktion um und setzen wir $n = 3$, erhalten wir die folgende Formel:<br>

$f(x) =  a_0 + a_1 x + a_2 x^2 + a_3 x^3$<br>

Dies ist die gleiche Formel wie die vereinfachte Form der Potenzreihe! Jede **Polynomfunktion** lässt sich also als **Potenzreihe** auffassen. Im Zuge der Erklärung von Polynomfunktionen in Kapitel 2 hatten wir auch festgestellt, dass wir viele Funktionen wie *Konstante Funktionen*, *Lineare Funktionen*, *Quadratische Funktionen* und *Kubische Funktionen* als Sonderformen der Polynomfunktionen auffassen können. Im Umkehrschluss können wir diese also auch als Potenzreihen darstellen. Doch wir können nicht nur Polynomfunktionen mit der Potenzreihe darstellen, auch andere Funktion sind so darstellbar. Im Folgenden werden einige Beispiele genannt, die vor allem Funktionen aus Kapitel 3 behandeln und etwas spezieller sind:<br>

$e^x = \sum\limits_{n=0}^{\infty} \dfrac{x^n}{n!} = \frac{x^0}{0!}+ \frac{x^1}{1!} + \frac{x^2}{2!} + \dots$<br>

$\sin(x) = \sum\limits_{n=0}^{\infty} (-1)^n \frac{x^{2n+1}}{(2n+1)!} = \frac{x}{1!} - \frac{x^3}{3!} + \frac{x^5}{5!} \pm \dots$<br>

$\cos(x) = \sum\limits_{n=0}^{\infty} (-1)^n \frac{x^{2n}}{(2n)!} = \frac{x^0}{0!} - \frac{x^2}{2!} + \frac{x^4}{4!} \pm \dots$<br>

Weitere Beispiele können Sie auf der <a href="https://de.wikipedia.org/wiki/Potenzreihe">Wikipedia-Seite zu Potenzreihen</a> finden.

### 3.2. Abgeschnittene Potenzreihen <a class="anchor" id="3-2"/>

Schauen wir uns noch eine andere Darstellung der oben aufgestellten Potenzreihe an, in der wir $a_0$, $a_1$, $a_2$ und $a_3$ durch $a$, $b$, $c$ und $d$ ersetzen:<br>

$f(x) = a + bx + cx^2 + dx^3$<br>

Damit wird etwas deutlicher, dass $a_0$, $a_1$, $a_2$ und $a_3$ <u>unterschiedliche</u> Koeffizienten sind. Da wir die Potenzreihen für die Erläuterung der Taylorreihen benötigen, führen wir nun ein paar Begriffe ein. Wie Ihnen sicherlich aufgefallen ist, scheint es in der Formel ein Muster zu geben. Bei jedem Summanden wird der Exponent von $x$ um $1$ erhöht, wobei wir bei $0$ anfangen zu zählen (der erste Summand ist eigentlich $ax^0$). Die Taylorreihen werden wir Koeffizient für Koeffizient aufbauen, bei der jeder Term, den wir der Taylorreihe hinzufügen, die Approximation verbessert. Bei den meisten Anwendungen der Taylorreihe brauchen wir jedoch nur die ersten paar Terme, in der Hoffnung, dass diese Approximation für unsere Zwecke ausreicht. Diese Terme können wir auch aus der Potenzreihe ablesen und wir benennen diese folgendermaßen:<br>

$f_0(x) = a$ &nbsp; &rarr; &nbsp; **Approximation Nullter Ordnung**<br>
$f_1(x) = a + bx$ &nbsp; &rarr; &nbsp; **Approximation Erster Ordnung**<br>
$f_2(x) = a + bx + cx^2$ &nbsp; &rarr; &nbsp; **Approximation Zweiter Ordnung**<br>
$f_3(x) = a + bx + cx^2 + dx^3$ &nbsp; &rarr; &nbsp; **Approximation Dritter Ordnung**<br>

Diese Kurzschreibweisen der Potenzreihe werden **abgeschnittene Potenzreihen** (englisch: **truncated power series**) genannt. Eine abgeschnittene Potenzreihe, welche bei $n$ abgeschnitten wird, also eine **Approximation $n$-ter Ordnung** ist, beinhaltet alle Polynome der Approximationen davor sowie das Polynom, dessen Exponent von $x$ gleich $n$ ist. Dies klingt etwas kompliziert, ist aber im Grunde recht einfach, wie man oben sehen kann. Wenn wir also eine Approximation fünfter Ordnung ($n = 5$) darstellen wollen, besteht diese aus den folgenden Polynomen, die dann nur noch aufsummiert werden:<br>

$a_5 x^5$<br>
$a_4 x^4$<br>
$a_3 x^3$<br>
$a_2 x^2$<br>
$a_1 x^1$<br>
$a_0 x^0$<br>

Zusammengefasst sieht die Formel dann folgendermaßen aus:<br>

$f(x) = a_0 + a_1 x^1 + a_2 x^2 + a_3 x^3 + a_4 x^4 + a_5 x^5$

Wir werden nun wieder zu der Schreibweise mit $a_n$ wechseln, da diese allgemeingültiger ist. Da unsere obere Grenze $\infty$ ist (wir hatten diese nur für Demonstrationszwecke auf $3$ gesetzt), gehen uns irgendwann die Buchstaben des Alphabets aus. Wenn Sie zum Beispiel die Approximation fünfzigster Ordnung ($n = 50$) darstellen wollen, haben Sie keine Buchstaben mehr übrig, während Sie mit der anderen Schreibweise einfach $a_{50}x^{50}$ schreiben können. 

## 4. Taylorreihen <a class="anchor" id="4"/>

Nachdem wir gesehen haben, was die Grundidee der Approximation von Funktionen ist und wie Potenzreihen funktionieren, werden wir uns nun die <b>Taylorreihe</b> anschauen. Taylorreihen werden verwendet, um eine Funktion in der Umgebung einer Stelle durch eine <b>Potenzreihe</b> darzustellen. Taylorreihen erlauben uns also, eine Funktion durch eine Reihe anderer Funktionen als **Approximation** darzustellen. Wir haben oben bereits ein paar Beispiele für die Approximation einer Funktion mithilfe mehrerer Teilfunktionen gesehen, hier noch einmal die $e$-Funktion:<br>

$e^x = \sum\limits_{n=0}^{\infty} \dfrac{x^n}{n!} = \frac{x^0}{0!}+ \frac{x^1}{1!} + \frac{x^2}{2!} + \dots$<br>


Die Funktion, die wir mithilfe der Taylorreihe approximieren wollen, muss dabei eine <b>glatte Funktion</b> sein, d.h. sie muss *unendlich oft differenzierbar* sein. Eine Funktion wie $f(x) = x^2$ ist <u>keine</u> glatte Funktion, da bereits die dritte Ableitung gleich Null ist: $f^{3}(x) = 0$. Eine glatte Funktion wäre zum Beispiel die **Sinus-Funktion**, da wir diese unendlich oft ableiten können.

Taylorreihen sind eine untergeordnete Reihe der **Potenzreihe**. Sie haben die besondere Eigenschaft, dass ihre Koeffizienten, also $a_0$, $a_1$, $a_2$ usw. **Ableitungen** einer gegebenen Funktion sind. Bei der Potenzreihe ist dieser Koeffizient weniger genau definiert. Die Formel für die Taylorreihe ist:<br>

$f(x) = \sum\limits_{n=0}^{\infty} \dfrac{f^{(n)}(p)}{n!} (x - p)^n$<br>

Bis auf den Koeffizienten ist diese Formel identisch mit der Formel der Potenzreihe. Der Koeffizient wird hier also folgendermaßen dargestellt:<br>

$a_n = \dfrac{f^{(n)}(p)}{n!}$<br>

Wenn bei der Formel $p$ gleich $0$ gesetzt wird (also wie im Beispiel bei der Potenzreihe oben auch), dann heißt die Taylorreihe <a href="https://de.wikipedia.org/wiki/Maclaurinsche_Reihe">Maclaurinsche Reihe</a>. Oft ist es sinnvoll, die Maclaurinsche Reihe anstatt der Taylorreihe zu verwenden, da die Berechnungen weniger komplex sind. Jedoch kann die Maclaurinsche Reihe nicht für alle Funktionen verwendet werden. Setzen Sie in der folgenden Code-Zelle die Variablen $a$, $b$ und $m$ auf $1$. Sie sehen nun die Funktion $f(x) = \frac{1}{x}$. Diese hat keine Nullstelle, d.h. wir können für $x$ nicht $0$ verwenden. Hier müssen wir für die Approximation die Taylorreihe verwenden.

In [6]:
plt_function(name="broken_rational", space=(-10.0, 10.0), startvalue=0, slider_step=1)

interactive(children=(FloatSlider(value=0.0, continuous_update=False, description='a', max=10.0, min=-10.0, re…

<div class=task>
    <b>Aufgabe</b>: Herleitung des Koeffizienten
    <br>
    <br>Um zu verstehen, wie der Koeffizient $\frac{f^{(n)}(p)}{n!}$ innerhalb der Taylorreihe zustande kommt, schauen Sie sich die folgenden beiden Videos aus dem Coursera-Kurs "Math for Machine Learning: Multivariate Calculus" an:<br>
    
<a href="https://coursera.org/share/aba67c7a2a7e5e02e352845b5b486254">Video 1: Power series derivation</a><br>
    
<a href="https://coursera.org/share/0edb107197401cec6b17fab2c55f6cba">Video 2: Power series details</a>
</div>

<div class=note>
    <b>Hinweis</b>: Fakultät
    <br>
    <br>Für die Berechnung der Taylorreihe ist die Berechnung der <b>Fakultät</b> (in der Formel $n!$) essentiell. Sollten Sie nicht wissen, was die Fakultät ist und wie sie berechnet wird, schauen Sie sich diesen <a href="https://de.serlo.org/mathe/1765/fakult%C3%A4t">Artikel</a> an.
</div>

### Visualisierung von Taylorreihen

Bevor wir uns nun aber der Berechnung der Taylorreihe widmen, versuchen wir, ein visuelles Verständnis davon zu entwickeln, wie wir mithilfe der Taylorreihe eine Funktion **approximieren** können. Um die Komplexität etwas zu verringern, greifen wir noch einmal auf die allgemeinere Darstellung der Taylorreihe als **Potenzreihe** zurück, d.h. die Koeffizienten werden durch $a_n$ dargestellt. 

Betrachten Sie nun das Tool in der folgenden Code-Zelle. Wählen Sie als Funktion `Polynomial (6th Order)` aus und setzen Sie die Ordnung (`Order`) auf $0$. Sie sehen folgendes:<br>

- Die Funktion $f(x)$ in <span style="background-color: lightgreen;">Grün</span>. Dies ist eine Polynomfunktion mit Grad 6, d.h. die Funktionsgleichung enthält mindestens ein $x^6$. 
- Die **Approximation $n$-ter Ordnung**, dargestellt in <span style="background-color: orange;">Orange</span>. Sie können Approximationen der Ordnung $0$, $1$, $2$ und $3$ auswählen.
- Einen Punkt $P$ in <span style="background-color: pink">Pink</span>, dessen $x$-Koordinate Sie durch Verschiebung des Punktes bestimmen können.

Es wird nun für die Funktion die **Approximation nullter Ordnung** (in <span style="background-color: orange;">Orange</span>) geplottet. Diese lautet:<br>

$f_0(x) = a_0$<br>

Diese Approximation ist eine **konstante Funktion**, also eine waagerechte Linie, was wir auch im Tool sehen können. Diese nähert unsere Funktion sehr schlecht an, weshalb wir uns nun die **Approximation erster Ordnung** anschauen (`Order` auf $1$ setzen):<br>

$f_1(x) = a_0 + a_1x$<br>

Diese Approximation ist eine **lineare Funktion**. In wenigen Stellen der Funktion (wenn man z.B. den Punkt sehr weit nach rechts schiebt) bildet diese Approximation die Funktion schon besser ab, an den meisten Stellen ist sie jedoch auch zu unterschiedlich. Wir erhöhen die Ordnung nun auf $2$ und erhalten die **Approximation zweiter Ordnung**:<br>

$f_2(x) = a_0 + a_1x + a_2x^2$<br>

Diese Approximation ist eine **quadratische Funktion**. Schieben wir unseren Punkt an das rechte Maximum oder so, dass die $y$-Koordinate des Punktes $0$ ist, können wir sehen, dass die Approximation es schafft, die Funktion leicht anzunähern, da sie die Kurvenform in diesen Stellen nachahmt. Zuletzt erhöhen wir die Ordnung auf $3$ und erhalten die **Approximation dritter Ordnung**:<br>

$f_2(x) = a_0 + a_1x + a_2x^2 + a_3x^3$<br>

Diese Approximation ist eine **kubische Funktion**. Auch hier gab es wieder ein kleine Verbesserung hinsichtlich der Annäherung. Wie Sie sich vorstellen können, können Approximationen mit steigender Ordnung die Funktion $f(x)$ immer besser annähern.

In [2]:
IFrame('https://fourier.space/assets/taylor/index.html', width=700, height=500)

<div class=task>
    <b>Aufgabe</b>: Funktionen approximieren
    <br>
    <br>Nutzen Sie das Visualisierungstool und nennen Sie die Funktion, welche bereits ab der zweiten Ordnung perfekt approximiert.<br><br>
    
<label for="show1" class="show_answer">
    <span>Antwort zeigen</span>
</label>
<input type=radio id="show1" class="show" name="group">
<input type=radio id="hide1" class="hide" name="group">
<span class="content">
    <span><i>Parabola (2nd Order Polynomial)</i>, da diese einfach eine quadratische Funktion ist.</span>
    <br><br>
<label for="hide1" class="hide_answer">
    <span>Antwort verbergen</span> 
</label> 
</span>    
</div>

Im folgenden GIF wird die Funktion $\ln(1+x)$ an der Stelle $x = 0$ approximiert. Sie können sehen, dass selbst nach 100 Appproximationen die Taylorreihe die Funktion nicht perfekt annähern kann.

<img src="https://upload.wikimedia.org/wikipedia/commons/2/27/Logarithm_GIF.gif" width="500px" align="left">

### Die Berechnung der Taylorreihe

Schauen wir uns nun die Formel der **Taylorreihe** nochmal an.

$f(x) = \sum\limits_{n=0}^{\infty} \dfrac{f^{(n)}(p)}{n!} (x - p)^n$<br>

Bereits bei der Potenzreihe hatten wir die Formel ausführlicher behandelt, weshalb wir uns hier nur auf die Unterschiede, also den **Koeffizienten** konzentrieren. Die Berechnung von diesem ist aber nicht sonderlich schwer. In diesem <a href="https://www.youtube.com/watch?v=ELPvMyhNrz8&t=53s">Video</a> wird erklärt, wie man <b>Taylorpolynome</b> und <b>Taylorreihen</b> berechnet. Auch das folgende <a href="https://www.youtube.com/watch?v=ybFpBd_BT74&t=11s">Video</a> sollte hierbei behilflich sein.

<div class="tool">
<span class="invisible_border"><img src="img/icons/tools.svg" class="icon"/><b>Werkzeugkasten: <u>Taylorreihen</u></b></span>
    <br>
    <br>Die <b>Taylorreihe</b> ist eine spezielle Form der <b>Potenzreihe</b>. Mithilfe von Taylorreihen ist es möglich, beinahe jede beliebige Funktion mithilfe eines <b>Taylorpolynoms</b> darzustellen. Um Funktionen durch die Taylorreihe darstellen zu können, muss diese <i>unendlich oft differenzierbar</i> sein (= glatte Funktion).
    
Die Formel für die <b>Taylorreihe</b> lautet:<br>
    
$f(x) = \sum\limits_{n=0}^{\infty} \dfrac{f^{(n)}(p)}{n!} (x - p)^n$<br>
</div>

## 5. Multivariable Taylorreihen <a class="anchor" id="5"/>

Bis jetzt hatten wir uns die Approximationen nur für eindimensionale Funktionen angeguckt, also Funktionen, die nur eine Variable (z.B. $x$) als Eingabe erhalten. Die Taylorreihe gibt es jedoch auch als **multivariable Taylorreihe**, wodurch **multivariate Funktionen** angenähert werden können. Dies ist etwas komplizierter, weshalb es in diesem Abschnitt nur darum geht, die Inuition hier der multivariablen Taylorreihe zu verstehen und nicht, diese auch händisch zu berechnen. Dafür lösen Sie bitte die folgende Aufgaben.

<div class=task>
    <b>Aufgabe</b>: Linearisierung und multivariable Taylorreihen
    <br>
    <br>Um ein Verständnis für die multivariablen Taylorreihen zu entwickeln, müssen wir zunächst klären, was die <b>Linearisierung</b> ist. Schauen Sie sich deshalb die genannten Videos des Coursera-Kurs "Math for Machine Learning: Multivariate Calculus" an und lösen Sie dann die folgenden Aufgaben. Im Video wird der Begriff <b>Rise over Run</b> verwendet; damit ist das <b>Steigungsdreieck</b> aus Kapitel 4 gemeint. Zudem wird im Video die <b>Jacobi-Matrix</b> durch den <b>Gradienten</b> dargestellt, lassen Sie sich davon nicht verwirren, gemeint ist unsere Definition des Gradienten aus Kapitel 7.<br>    

<a href="https://coursera.org/share/91e366aa1dcb2add1f4889542e0946b6">Video 3: Linearisation</a><br>
<a href="https://www.coursera.org/learn/multivariate-calculus-machine-learning/lecture/dcp1h/multivariate-taylor">Video 4: Multivariate Taylor</a><br><br>
    
1. Was sind die Unterschiede zwischen der bisherigen Taylorreihen-Formel und der nun neu eingeführten Formel?<br>
2. Wie könnten Sie in ein bis zwei Sätzen beschreiben, was die <b>Linearisierung</b> (im Kontext der Taylorreihe) ist?<br>
3. Wenn wir die Funktion $f(x + \Delta x, y + \Delta y)$ approximieren, wie sieht dann die <b>Approximation Nullter Ordnung</b> aus?<br>
4. Wenn wir die Funktion $f(x + \Delta x, y + \Delta y)$ approximieren, wie sieht dann die <b>Approximation Erster Ordnung</b> aus?<br>
5. Wenn wir die Funktion $f(x + \Delta x, y + \Delta y)$ approximieren, wie sieht dann die <b>Approximation Zweiter Ordnung</b> aus?<br>
    
<br>
    <label for="show2" class="show_answer">
    <span>Antworten zeigen</span>
</label>
<input type=radio id="show2" class="show" name="group">
<input type=radio id="hide2" class="hide" name="group">
<span class="content">
    <span>
    1. $f(x + \Delta x) = \sum\limits_{n=0}^{\infty} \frac{f^{(n)}(x)}{n!} \Delta x^n$ &nbsp; Der Punkt $p$ wird nicht mehr verwendet, sondern durch $x$ und die Distanz zwischen $x$ und $p$ wird durch den Term $\Delta x$ ausgedrückt. Diese Schreibweise hatten wir auch schon in Kapitel 4 verwendet.<br>
    2. <b>Linearisierung</b> ist der Prozess, in der eine Funktion genommen wird und alle Terme oberhalb von $\Delta x$ ignoriert werden. Im Video wurde eine komplexe Funktion verwendet und mit einer Geraden, also einer linearen Funktion (deshalb auch der Begriff "Linearisierung"), approximiert.<br>
    3. Wie eine flache Oberfläche mit der gleichen Höhe wie der eingesetzte Punkt. Diese flache Oberfläche ist einfach die zweidimensionale Darstellung einer <b>konstanten Funktion</b>, die ja auch "flach" ist, da ihre Steigung gleich Null ist.<br>
    4. Sie ist dann ein <b>Gradient</b>. Die Formel wäre: $\nabla_f \cdot \Delta \mathbf{x}$, wobei $\mathbf{x}$ ein Vektor ist. Im Video wurde hier die Jacobi-Matrix in der Formel verwendet, gemeint ist nach unseren Definition aus Kapitel 7 der Gradient.<br>
    5. Sie ist dann eine <b>Hesse-Matrix</b>. Die Formel wäre: $\frac{1}{2} \Delta \mathbf{x}^T \cdot H_f \cdot \Delta \mathbf{x}$, wobei mit $T$ eine transponierte Matrix bzw. Vektor ausgedrückt wird.
    </span>
    <br><br>
<label for="hide2" class="hide_answer">
    <span>Antworten verbergen</span> 
</label> 
</span> 
</div>

## Taylorreihen Quiz <a class="anchor" id="q1"/><br>

<div class="imgrow">
  <div class="imgcolumn2">
       <figure>
          <img src="https://d3c33hcgiwev3.cloudfront.net/imageAssetProxy.v1/0NyD_AX8Eeiu6g4-2AcSqA_ebec026f13ec95ab245ab74cfca0c460_Q1a_BZ.gif?expiry=1616544000000&hmac=q8leq4yW9UD8vMnc6FTX_gSjxNrwq_-QWXlJBYLP4GM" align="center" alt="Entnommen aus dem Coursera Kurs 'Math for Machine Learning: Multivariate Calculus' aus dem Quiz '2D Taylor Series' aus Woche 4." width="500"/>
           <figcaption>Abbildung 1</figcaption>
    </figure> 
  </div>
  <div class="imgcolumn2">
       <figure>
          <img src="https://d3c33hcgiwev3.cloudfront.net/imageAssetProxy.v1/5gM_3QX8Eeiu6g4-2AcSqA_2a2e2378db89e0a37800735c02242a22_Q2a_BZ.gif?expiry=1616544000000&hmac=-Pal8RKwsWFIen2AstfI7DGjZE7Fc7Ob6igQF3G66_Y" align="center" alt="Entnommen aus dem Coursera Kurs 'Math for Machine Learning: Multivariate Calculus' aus dem Quiz '2D Taylor Series' aus Woche 4." width="500"/>
          <figcaption>Abbildung 2</figcaption>
    </figure> 
  </div>
</div>

<div class="task">
    <b>Aufgabe</b>: Taylorreihen Quiz 
    <br>
    <br> Lösen Sie das folgende Quiz "<b>Taylorreihen Quiz</b>". Hier finden Sie die jeweiligen Antwortmöglichkeiten zu jeder Frage, geben Sie im Quiz dann den entsprechenden Buchstaben an. Es wird empfohlen, die Aufgaben auf einem Blatt/Tablet/o.ä. zu rechnen und dann erst die Lösungen mit den Antwortmöglichkeiten abzugleichen. Die letzten beiden Aufgaben referenzieren auf die Abbildungen 1 und 2 über dieser Antwortbox.
    
    
<u>Antwortmöglichkeiten zu Frage 1</u>:
<ol style="list-style-type:lower-alpha">
    <li>$f(x) = 1 + \frac{1}{2}x^2$</li>
    <li>$f(x) = \frac{1}{2}x^2$</li>
    <li>$f(x) = x^2$</li>
    <li>$f(x) = 1 + x^2$</li>
</ol>
    
<u>Antwortmöglichkeiten zu Frage 2</u>:
<ol style="list-style-type:lower-alpha">
    <li>$f(x) = 1 + 3x + \frac{x^2}{2} + \frac{x^4}{6}$</li>
    <li>$f(x) = 1 + 3x - \frac{x^2}{2} + \frac{x^4}{6}$</li>
    <li>$f(x) = 1 + 3x - \frac{x^2}{2} + \frac{x^4}{24}$</li>
    <li>$f(x) = 1 + 3x + \frac{x^2}{2} + \frac{x^4}{24}$</li>
</ol>
    
    
<u>Antwortmöglichkeiten zu Frage 3</u>:
<ol style="list-style-type:lower-alpha">
    <li>Nullte Ordnung</li>
    <li>Erste Ordnung</li>
    <li>Zweite Ordnung</li>
    <li>Es ist keine gültige Approximation der Funktion.</li>
</ol>
    
<u>Antwortmöglichkeiten zu Frage 4</u>:
<ol style="list-style-type:lower-alpha">
    <li>Nullte Ordnung</li>
    <li>Erste Ordnung</li>
    <li>Zweite Ordnung</li>
    <li>Es ist keine gültige Approximation der Funktion.</li>
</ol>
    
</div>

In [13]:
start_quiz(91, "calculus")

VBox(children=(Output(), RadioButtons(layout=Layout(width='max-content'), options=(('a', 0), ('b', 1), ('c', 2…

VBox(children=(Output(), RadioButtons(layout=Layout(width='max-content'), options=(('a', 0), ('b', 1), ('c', 2…

VBox(children=(Output(), RadioButtons(layout=Layout(width='max-content'), options=(('a', 0), ('b', 1), ('c', 2…

VBox(children=(Output(), RadioButtons(layout=Layout(width='max-content'), options=(('a', 0), ('b', 1), ('c', 2…

---
---


VBox(children=(Button(description='Ausgewählte Antworten überprüfen', layout=Layout(width='40%'), style=Button…