# Sessie 2 - Foutenanalyse

In computers worden getallen inherent voorgesteld in hun floating-point representatie. De precisie hiervan is zeer hoog, maar de fout op de uitvoer kan opblazen wanneer het algoritme numeriek onstabiel is. In de meeste domeinen, zijn zulke foutmarges ongewenst.

In deze oefeningsessie maken we oefeningen rond numerieke stabiliteit. <b>(Gebruik voor de oefeningen altijd een eerste orde analyse.)</b>

# Herhaling



## 1. Conditionering

Geef een definitie voor conditionering met meer dan 1 invoer waarbij de relatieve fout gegeven wordt door
$$\delta x = \frac{||fl(x) - x||}{||x||}$$
met $||\cdot||$ de 2-norm.

(Hint: Gebruik de Jacobiaan $(i.e., \nabla F(x))$ voor de afgeleide van de functie $F$ naar meerdere inputs.)

<b>ANTWOORD:</b>

Relatieve fout op $F(x)$:
* $\delta F = \frac{||\color{blue}{F(fl(x))} - F(x)||}{||F(x)||}$
  * $\color{blue}{F(fl(x))} = F(x + \Delta x)$
      * $ F(x) \stackrel{\text{Taylor}}{\approx} F(a) + F'(a)(x-a)$
      * $ F(fl(x))\stackrel{\text{Taylor}}{\approx} F(x) + F'(x)(fl(x) - x))$
  * $\color{blue}{F(fl(x))} = F(x + \Delta x) \stackrel{\text{Taylor}}{\approx} F(x) + \nabla F(x) \Delta x \Leftrightarrow \color{green}{F(fl(x)) - F(x)} = \color{green}{\nabla F(x) \Delta x}$
* $\delta F = \frac{||\color{green}{F(fl(x)) - F(x)}||}{||F(x)||} = \frac{||\color{green}{\nabla F(x) \Delta x}||}{||F(x)||} = \frac{|\color{green}{\nabla F(x) \Delta x}|}{|F(x)|} $ [Lengte van een waarde $\Rightarrow$  absolute waarde]
 * $ \frac{|\color{green}{\nabla F(x) \Delta x}|}{|F(x)|} \le \frac{||\nabla F(x)||\cdot ||\Delta x||}{|F(x)|}$ [Cauchy-Schwarz ongelijkheid: $|x^T\cdot y| \le ||x^T||\cdot||y||$ voor kolomvectors $x, y$]
 * $\delta x = \frac{||fl(x) - x||}{||x||} = \frac{||x + \Delta x - x||}{||x||} \Leftrightarrow \color{red}{\delta x ||x||} = \color{red}{||\Delta x||}$
* $\delta F \le \frac{||\nabla F(x)||.\color{red}{||\Delta x||}}{|F(x)|} = \frac{||\nabla F(x)||.\color{red}{||x||}}{|F(x)|}\color{red}{\delta x }$
* $\delta F \le \color{purple}{\frac{||\nabla F(x)||.||x||}{|F(x)|}}\delta x = \color{purple}{\gamma F} \delta x$

Conditiegetal op $F(x)$:
* $\gamma F = \frac{||\nabla F(x)||.||x||}{|F(x)|}$

## 2. Zwakke stabiliteit

Toon aan dat de aftrekking van twee getallen met eenzelfde teken zwak stabiel is, gebruikmakend van een eerste orde analyse (i.e., alleen lineaire foutbijdragen worden in rekening genomen).

Een algoritme is zwak stabiel als haar *onvermijdelijke fout* vergelijkbaar is met de *conditionering* van het probleem.
$$\delta F(x) = C \gamma \epsilon  \qquad\text{[met $C > 0$]}$$

Dus, beschouw:
$$F(x, y) =  x - y$$
$$F_{fl}(x, y) =  fl(fl(x) - fl(y))$$
met $x, y \ge 0$ zonder verlies van algemeenheid en $F_{fl}$ correspondeert aan de functie $F$ met floating-point aritmetiek $fl$.

(Opmerking: zie de eerste oefening voor het conditiegetal van een functie met meerdere inputs.)

## <b>ANTWOORD:</b>

Eerst zullen we kijken waar de functie $F_{fl}(x, y)$ numeriek onstabiel wordt.

#### Stap 1: Bereken de onvermijdelijke fout via voorwaartse foutanalyse:

$$\begin{split} \color{blue}{F_{fl}(x, y)} &= fl(fl(x) - fl(y))\\
    &\approx fl(x - y)&\text{ [Negeer invoerfout! Aangezien we enkel de onvermijdelijke fout willen]} \\
    &= (x - y)(1 + \eta_{-}) \\
    &= x + \eta_{-}x - y - \eta_{-}y \\
    &= \color{blue}{x - y + x\eta_{-} - y\eta_{-}} \\
    \end{split}$$

* Bereken de relatieve fout:
$$\begin{split}
\delta F(x, y) 
&= \frac{\color{blue}{|F_{fl}(x, y)} - \color{green}{F(x, y)}|}{|\color{green}{F(x, y)}|} = \frac{|\color{blue}{x - y + x\eta_{-} - y\eta_{-}} - \color{green}{(x - y)}|}{|\color{green}{x - y}|}&\\
&= \frac{|x\eta_{-} - y\eta_{-}|}{|x - y|} = \frac{|x\eta_{-} + (-y\eta_{-})|}{|x - y|}&\\
&\le \frac{|x\eta_{-}| + |-y\eta_{-}|}{|x - y|} = \frac{|x\eta_{-}| + |y\eta_{-}|}{|x - y|} &\text{ [Driehoeksongelijkheid: $|x + y| \le |x| + |y|$]}\\
&=\frac{x\eta_{-} + y\eta_{-}}{|x - y|}&\text{ [$x, y, \eta_{-} \ge 0$]}\\
&\le \frac{x\color{blue}{\epsilon} + y\color{blue}{\epsilon}}{|x - y|}&\text{[$|\eta_{-}| \le \epsilon$] (slide 15)}\\
&= \epsilon \frac{|x| + |y|}{|x - y|}&\text{[notatie slide 16]}
\end{split}$$

De functie $F_{fl}(x, y)$ is onstabiel rond $|x - y| \approx 0$.

Het algoritme is mogelijks zwak stabiel indien er een constante $C$ bestaat die de expressie $\delta F \le C\epsilon$ eindig maakt.<br> Daarvoor moeten we conditiegetal van het probleem berekenen. Indien de onvermijdelijke fout vergelijkbaar is met de conditionering van het probleem dan is het algoritme numeriek zwak stabiel! (slide 37)


#### Stap 2: Bereken het conditiegetal (zie eerste oefening voor conditionering met meerdere inputs)


$$\begin{split}
\color{green}{\gamma F}
&= \frac{||\nabla F(x, y)||.||(x, y)||}{|F(x, y)|}&\\
&= \frac{||(1, -1)||.||(x, y)||}{|x - y|}&\\
&= \frac{\sqrt{1 + (-1)^2} \sqrt{x^2 + y^2}}{|x - y|}&\text{[$||x_1,x_2,..,x_n|| = \sqrt{\sum_{i=0}^n{x_i^2}}$]}\\
&= \color{green}{\frac{\sqrt{2} \sqrt{x^2 + y^2}}{|x - y|}}&\\
\end{split}$$

#### Stap 3: Aantonen dat onvermijdelijke fout $\approx$ conditionering

Met andere woorden, we tonen aan dat de er een constante $C$ bestaat zodat: $\delta F(x,y) = C \gamma F \epsilon$ met $C > 0$.

Zwakke stabiliteit rond $|x - y| \approx 0$:
$$\begin{split}
\delta F 
&\le \epsilon \frac{x + y}{|x - y|}&\\
&= \epsilon \frac{\color{blue}{x + y}}{\color{red}{|x - y|}} \frac{\color{red}{|x - y|}}{\color{blue}{\sqrt{2} \sqrt{x^2 + y^2}}} \color{green}{\frac{\sqrt{2} \sqrt{x^2 + y^2}}{|x - y|}}& \text{[$* \frac{A}{B} * \frac{B}{A}$]}\\
&= \color{blue}{\frac{x + y}{\sqrt{2}\sqrt{x^2 + y^2}}} \color{green}{\gamma F} \epsilon \\
&= \color{blue}{C} \gamma F \epsilon
\end{split}$$

#### Stap 4: Aantonen dat C eindig is.

Stel $|x - y| \le \eta$, zodat $0 \le \color{purple}{y - \eta} \le x \le \color{purple}{y + \eta}$.

We willen een bovengrens op $C$ bepalen.
$$\begin{split}C &= \frac{x + y}{\sqrt{2} \sqrt{x^2 + y^2}} \le \frac{\color{purple}{y + \eta} + y}{\sqrt{2} \sqrt{(\color{purple}{y - \eta})^2 + y^2}}&\text{[$x$ vervangen, max(teller) als $y + \eta$, min(noemer) als $y - \eta$]}\\
&= \frac{2y + \eta}{\sqrt{2} \sqrt{2y^2 - 2y\eta + \eta^2}} = \frac{2y + \eta}{\sqrt{2} \sqrt{\color{red}{2y(y - \eta)} + \eta^2}}&\\
&\le \frac{2y + \eta}{\sqrt{2} \sqrt{\eta^2}}&\text{ [$\eta, y, (y - \eta) > 0$]}\\
&\le \frac{2y + \eta}{\eta\sqrt{2}}&\end{split}$$

De aftrekking is zwak stabiel rond $|x - y| \approx 0$.
Voor $y \rightarrow \infty$ is er GEEN constante C, de aftrekking is dus niet uniform zwak stabiel. 
MAAR, aangezien we met computers werken, zal $y$ altijd eindig zijn en bestaat er dus altijd een constante.

# Extra oefeningen (oplossingen volgende week)

## 3. Discriminantmethode

Pas de discriminantmethode toe op de vergelijking
$10^{-3} x^2 + 5 x + 10^{-1} = 0$
in een systeem met precisie 3.

De discriminantmethode past de volgende formule toe:
$$\frac{-b \pm \sqrt{b^2 - 4ac}}{2a}$$
voor een vergelijking $ax^2 + bx + c = 0$.

Deze methode lijdt aan "catastrophic cancellation", aangezien

* $\frac{-b + \sqrt{b^2 - 4ac}}{2a} = \frac{-5 + \sqrt{5^2 - 4 \cdot \color{red}{10^{-4}}}}{2 \cdot 10^{-3}} \stackrel{\color{blue}{\text{prec. 3}}}{\approx} \frac{-5 + \sqrt{5^2 -  \color{red}{0}}}{2 \cdot 10^{-3}} = 0$

terwijl de exacte oplossing

* $\frac{-5 + \sqrt{5^2 - 4 \cdot 10^{-4}}}{2 \cdot 10^{-3}} \approx \frac{-4 \cdot 10^{-5}}{2 \cdot 10^{-3}} = -0.02$

geeft.

Gegeven dat je een positieve $b$ hebt en een aftrekking van twee getallen met hetzelfde teken, kan je deze methode stabiliseren?

In [1]:
import numpy as np
-5 + np.sqrt(5**2 - (4 * 10**(-4)))

-4.0000160001163465e-05

Oplossing:

$$\frac{-b \pm \sqrt{b^2 - 4ac}}{2a}$$

Probleem: bij de tweede case (-) en wanneer $a$ en $c$ zeer klein zijn:
$$ = \sqrt{b^2 - 4ac} -b$$

Stabiliseren door: 
$$ = \frac{\sqrt{b^2 - 4ac} -b}{2a}$$
$$ = \frac{\sqrt{b^2 - 4ac} -b}{2a} * \frac{\sqrt{b^2 - 4ac} + b}{\sqrt{b^2 - 4ac} + b}$$
$$ = \frac{b^2 - 4ac -b^2}{2a \sqrt{b^2 - 4ac} + b}$$
$$ = \frac{- 2c}{\sqrt{b^2 - 4ac} + b}$$

Afhankelijk van welke oplossing (+ of -) men zoekt en de waarde van $b$, kiest men het gepaste algoritme (discriminant of discriminant_stable)

In [6]:
import numpy as np

def discriminant(a, b, c):
    D = np.sqrt(b**2 - 4*a*c)
    x1 = (-b + D) / (2*a)
    x2 = (-b - D) / (2*a)
    return x1, x2

def discriminant_stable(a, b, c):
    D = np.sqrt(b**2 - 4*a*c)
    x1 = -2*c / (b + D)
    x2 = (-b - D) / (2*a)
    return x1, x2

In [7]:
### TEST ###
import numpy as np
from decimal import *

#Floating-point getallen
a = Decimal(1e-3); b = Decimal(5.00); c = Decimal(1e-1)

#Zet precisie op 28 en bereken de (zo goed als) exacte waarde
getcontext().prec = 28
exact = np.array([-0.02000008000064001, -4999.9799999199995])

#Zet precisie op 4 en zoek het nulpunt gebruikmakend van de stabielen en onstabiele discriminant methode.
#De coefficienten hebben dus invoerfout.
getcontext().prec = 3
approx = np.array(discriminant(a, b, c))
approx_stable = np.array(discriminant_stable(a, b, c))

#Bereken de exacte waarde en waardes gegeven door de stabielen en onstabiele discriminant methode
print("Exact solution:", tuple(map(float, exact)))
print("Discriminant method in prec. 3:", tuple(map(float, approx)))
print("Stable discriminant method in prec. 3:", tuple(map(float, approx_stable)))

Exact solution: (-0.02000008000064001, -4999.9799999199995)
Discriminant method in prec. 3: (0.0, -5000.0)
Stable discriminant method in prec. 3: (-0.02, -5000.0)


## 4. Stabiliteit van elementaire berekeningen

Zoek het snijpunt tussen twee rechten met Cartesische vergelijkingen
$$\begin{cases}1.00 x + 3.50 y = 8.00\\ 2.01x + 7.00 y = 16.1\end{cases}$$
in een systeem met precisie 3. Gebruik enkel elementaire berekeningen (namelijk, $+, -, *, /$).
Is er een verschil in numerieke stabiliteit als je eerst naar $x$ of eerst naar $y$ oplost?

In [4]:
def solve_x_to_y(a1, b1, c1, a2, b2, c2):
    a = a2 - a1 * b2 / b1
    c = c2 - c1 * b2 / b1
    x = c / a
    y = (c1 - a1 * x) / b1
    return x, y

def solve_y_to_x(a1, b1, c1, a2, b2, c2):  
    b = b2 - b1 * a2 / a1
    c = c2 - c1 * a2 / a1
    y = c / b
    x = (c1 - b1 * y) / a1
    return x, y

In [5]:
### TEST ###
import numpy as np
from decimal import *

#Floating-point getallen
a1 = Decimal(1.00); b1 = Decimal(3.50); c1 = Decimal(8.00)
a2 = Decimal(2.01); b2 = Decimal(7.00); c2 = Decimal(16.1)

#Zet precisie op 28 en bereken de (zo goed als) exacte waarde
getcontext().prec = 28
exact = np.array([Decimal(10.00000000000035527136788006), Decimal(-0.57142857142867293467653716)])

#Zet precisie op 3 en los op van x naar y en van y naar x.
#De coefficienten hebben dus invoerfout.
getcontext().prec = 3
approx_xy = np.array(solve_x_to_y(a1,b1,c1,a2,b2,c2))
approx_yx = np.array(solve_y_to_x(a1,b1,c1,a2,b2,c2))

#Bereken de relatieve fout tussen de benadering en de exacte waarde voor beide algoritmen
getcontext().prec = 28
print("Exact solution:", tuple(map(float, exact)))
print("Error x to y: ", np.linalg.norm(approx_xy - exact) / np.linalg.norm(exact))
print("Error y to x: ", np.linalg.norm(approx_yx - exact) / np.linalg.norm(exact))

Exact solution: (10.000000000000355, -0.571428571428673)
Error x to y:  0.00004278734291402200204093788760
Error y to x:  0.2076643721404332569655322541
