# Mantissenlängen verschiedener Gleitkommadarstellungen

In diesem Beispiel zeigen wir, wie man experimentell die Mantissenlänge einer Gleitkommadarstellung bestimmen kann.

In [27]:
import numpy as np
def get_mantissa_length(dtype=np.float64):
    m = 0
    x = np.array([1.0], dtype=dtype)
    while x != x + 2**-m:
        m += 1
    return m-1
print("Double precision Werte haben eine Mantissenlänge von", get_mantissa_length())
print("Single precision Werte haben eine Mantissenlänge von", get_mantissa_length(dtype=np.float32))
print("Half precision Werte haben eine Mantissenlänge von", get_mantissa_length(dtype=np.float16))
print("Extended precision Werte haben eine Mantissenlänge von", get_mantissa_length(dtype=np.longdouble))


Double precision Werte haben eine Mantissenlänge von 52
Single precision Werte haben eine Mantissenlänge von 23
Half precision Werte haben eine Mantissenlänge von 10
Extended precision Werte haben eine Mantissenlänge von 63


# Assoziativität von Gleitkommazahlen

In diesem Beispiel wollen wir Aufzeigen, dass die Assoziativität bei Gleitkommazahlen im Allgemeinen nicht mehr gilt.

In [2]:
import numpy as np

a = np.array([2**15, -2**15, 2**1,-2**0,2**2], dtype=np.float16)
print("Wir addieren folgende Zahlen aus dem Array a =", a)

print("Exaktes Ergebnis", np.sum(a))
print("Berechnung von a[0] + (a[1] + (a[2] + (a[3] + a[4]))) =", a[0] + (a[1] + (a[2] + (a[3] + a[4]))))
print("Berechnung von a[0] + (a[1] + (a[2] + (a[3]))) + a[4] =", a[0] + (a[1] + (a[2] + (a[3]))) + a[4])



Wir addieren folgende Zahlen aus dem Array a = [ 3.277e+04 -3.277e+04  2.000e+00 -1.000e+00  4.000e+00]
Exaktes Ergebnis 5.0
Berechnung von a[0] + (a[1] + (a[2] + (a[3] + a[4]))) = 0.0
Berechnung von a[0] + (a[1] + (a[2] + (a[3]))) + a[4] = 4.0


# Approximation der Exponentialfunktion mittels Seriendarstellung

Nun wollen wir die Exponentialfunktion mittels der Seriendarstellung approximieren für ein gegebenes $n_{max}$:
$$
e^x \approx \sum_{n=0}^{n_{max}} x^{n}/(n!) 
$$

In [31]:
import numpy as np
x = -20
n_max = 100

def exponential_series(x,n_max):
    tmp = 1
    result = 1
    for i in range(1,n_max+1):
        tmp = tmp*x/i
        result += tmp
    return result
print("Ergebnis mit double precision:", exponential_series(x,n_max))
print("Ergebnis mit half precision:", exponential_series(np.array([x],dtype=np.float16),n_max))
print("Ergebnis mit single precision:", exponential_series(np.array([x],dtype=np.float32),n_max))
print("Ergebnis mit extended precision:Ergebnis mit", exponential_series(np.array([x],dtype=np.longdouble),n_max))

Ergebnis mit double precision: 5.621884472130418e-09
Ergebnis mit half precision: [nan]
Ergebnis mit single precision: [-2.7566755]
Ergebnis mit extended precision:Ergebnis mit [2.06019941e-09]


  tmp = tmp*x/i
  result += tmp


# Instabile Nullstellensuche

In diesem Beispiel zeigen wir die Probleme bei der Berechnung der größeren der beiden Nullstellen von $x² + 2px -q \overset{!}{=} 0$.

Hierbei zeigen wir die instabile Lösungsformel $x = \sqrt{p^2+q} - p$ und die stabile Formulierung $ x = \frac{q}{\sqrt{p² + q} + p}$.

In [41]:
import numpy as np
from math import sqrt
def get_root_unstable(p,q):
    return sqrt(p**2 + q) - p
def get_root_stable(p,q):
    return q/(sqrt(p**2 + q)+p)

p = 500000000
q = 1
print("p und q (double precision): ", p, q)
print("Instabile Auswertung:", get_root_unstable(p,q))
print("Stabile Auswertung:", get_root_stable(p,q))

p = np.array([5000], dtype=np.float32)
q = np.array([1], dtype=np.float32)
print("p und q (single precision): ", p, q,)

print("Instabile Auswertung:", get_root_unstable(p,q))
print("Stabile Auswertung:", get_root_stable(p,q))

p und q (double precision):  500000000 1
Instabile Auswertung: 0.0
Stabile Auswertung: 1e-09
p und q (single precision):  [5000.] [1.]
Instabile Auswertung: [0.]
Stabile Auswertung: [1.e-04]
