# Zahlen in der Informatik

In diesem Notebook werden die Grundlagen von Zahlen und deren Repräsentation in der Informatik behandelt. Es beginnt mit einer Einführung in das Dezimalsystem, das in der menschlichen Kultur am weitesten verbreitet ist. Der Schwerpunkt liegt hierbei auf dem Verständnis des Positionswertsystems und der Darstellung von Zahlen durch Zehnerpotenzen.

Anschließend wird untersucht, wie Computer Zahlen intern repräsentieren. Insbesondere wird der IEEE 754-Standard vorgestellt, der ein weit verbreiteter Ansatz zur Darstellung von Gleitkommazahlen in Computern ist.

Zum Abschluss werden einige der Herausforderungen und Probleme bei der Zahlenrepräsentation in Computern diskutiert, insbesondere der Verlust der Genauigkeit bei größeren Zahlen.


<b> Python Grundlagen: </b>  /<br>
<b> Math. Grundlagen: </b>  / <br>

<b>Inhaltsverzeichnis:</b> <br>
<ul>
 <li><a href="#1">Das Dezimalsystem</a></li>
 <li><a href="#2">Wie ein Computer Zahlen darstellt</a></li>
 <li><a href="#3">IEEE 754</a></li>
</ul>
</p> 

## Das Dezimalsystem <a id="1"></a>

Das Dezimalsystem, auch bekannt als das Zahlensystem mit der Basis $10$, ist das vorherrschende Zahlensystem in der menschlichen Kultur. Seine Beliebtheit kann hauptsächlich auf unsere zehn Finger zurückgeführt werden, die als natürliche Zählwerkzeuge dienen. In diesem System gibt es zehn Ziffern, nämlich $0, 1, 2, 3, 4, 5, 6, 7, 8$ und $9$.

Ein charakteristisches Merkmal des Dezimalsystems ist sein Positionswertsystem. Das bedeutet, dass der Wert einer Ziffer stark von ihrer Position in der Zahl abhängt. Als Illustration hat die Ziffer $5$ in der Zahl $507$ einen anderen Wert als in der Zahl $750$.

Ein weiteres wichtiges Konzept im Dezimalsystem ist die Repräsentation von Zahlen durch Potenzen der Basis $10$. Jede Position in einer dezimalen Zahl stellt eine bestimmte Potenz von $10$ dar. Von rechts nach links beginnend mit der Position $0$:

- Einheiten (Position 0): $10^0=1$
- Zehner (Position 1): $10^1=10$
- Hunderter (Position 2): $10^2=100$
- Tausender (Position 3): $10^3=1.000$
- ... und so weiter.

Wenn man zum Beispiel die Zahl $57$ betrachtet, bedeutet das: <br>
$ 0×10^2+5×10^1+7×10^0=0+50+7=57$ .


<div style= "color: black;background-color: powderblue ;margin: 10 px auto; padding: 10px; border-radius: 10px">
    <p style="font-size:12pt; text-align:center; color:   black; background-color: lightskyblue ;margin: 10 px auto; padding: 10px; border-radius: 10px" id="1"><b>Aufgabe 1</b>  </p> 

Stellen Sie nun folgende Zahlen als Zehnerpotenzen dar:

- $17$
- $3467$
- $100303$ .

In [7]:
# Beispiel
0 * 10**2 + 5 * 10*1 + 7 * 10**0

57

In [None]:
# Codezelle für Aufgabe 1


Im Kontext des Dezimalsystems repräsentieren die Zahlen nach dem Komma (in europäischer Notation) oder dem Punkt (in US-Notation) Bruchteile eines Ganzen. Jede Position nach dem Komma repräsentiert eine negative Potenz von 10.

Hier ist eine Erklärung anhand des Beispiels $3,14$:

- Die Ziffer $3$ steht für $3 \times 10^0$ oder $3$ Einheiten.
- Die Ziffer $1$ nach dem Komma steht für $1 \times 10^{-1}$ oder ein Zehntel ($0,1$).
- Die Ziffer $4$ nach dem Komma steht für $4 \times 10^{-2}$ oder vier Hundertstel ($0,04$).

Zusammengenommen ergibt das $3 + 0,1 + 0,04 = 3,14$.

Im Allgemeinen repräsentiert die erste Ziffer nach dem Komma Zehntel, die zweite Ziffer Hundertstel, die dritte Tausendstel und so weiter. Es handelt sich also weiterhin um ein Positionswertsystem, aber die Positionen nach dem Komma repräsentieren negative Potenzen von $10$.

<div style= "color: black;background-color: powderblue ;margin: 10 px auto; padding: 10px; border-radius: 10px">
    <p style="font-size:12pt; text-align:center; color:   black; background-color: lightskyblue ;margin: 10 px auto; padding: 10px; border-radius: 10px" id="2"><b>Aufgabe 2</b>  </p> 

Stellen Sie nun folgende Zahlen als Zehnerpotenz dar:

- $1,79$
- $122,589$ 
- $0,7008$ 
.   

In [None]:
# Codezelle für Aufgabe 2

<a id="2"></a>
## Wie ein Computer Zahlen repräsentiert

Führen Sie zuerst die Codezelle aus und schauen Sie sich das Ergebnis an.

In [1]:
0.1 + 0.2

0.30000000000000004

Die Gleichung $0,1 + 0,2 = 0,30000000000000004$ illustriert ein bekanntes Problem bei der Darstellung und Berechnung von Fließkommazahlen in Computern. Dieses Problem tritt aufgrund der Art und Weise auf, wie Zahlen im Computer dargestellt werden.

Zuerst wird sich angeschaut wie ganze Zahlen in einem Computer dargestellt werden.

#### Vorzeichenlose Ganze Zahlen:

Diese Darstellung ist direkt und unkompliziert. Jede Kombination von Bits stellt eine eindeutige Zahl dar.

**Bit-Kombinationen**: Bei einer $8$-Bit-Darstellung gibt es $2^8 = 256$ mögliche Kombinationen, die Zahlen von $0$ bis $255$ repräsentieren.

**Beispiel**:
- Die Binärzahl $01010101$ repräsentiert die Dezimalzahl $85$.
- Die Binärzahl $11111111$ repräsentiert die Dezimalzahl $255$.

**Berechnung**: Die Umwandlung einer binären Zahl in eine dezimale Zahl erfolgt durch das Summieren der Potenzen von $2$, wobei jede Position im Binärwert einem spezifischen Exponenten entspricht. Bei $01010101$ beispielsweise:

$$
0 \times 2^7 + 1 \times 2^6 + 0 \times 2^5 + 1 \times 2^4 + 0 \times 2^3 + 1 \times 2^2 + 0 \times 2^1 + 1 \times 2^0 = 85
$$

#### Vorzeichenbehaftete Ganze Zahlen (Zweierkomplement):

Das Zweierkomplement ist eine Methode zur Darstellung von negativen Zahlen in binärer Form. Es verwendet das höchstwertige Bit (MSB) als Vorzeichenbit.

**Vorzeichenbit**: Bei einer $8$-Bit-Darstellung ist das linkeste Bit das Vorzeichenbit. Wenn es $0$ ist, ist die Zahl positiv. Wenn es $1$ ist, ist die Zahl negativ.

**Positive Zahlen**: Positive Zahlen werden genauso dargestellt wie im vorzeichenlosen Format.

**Negative Zahlen**: Um die Zweierkomplement-Darstellung einer negativen Zahl zu erhalten, invertieren Sie alle Bits der positiven Darstellung und addieren dann $1$.

**Beispiel**: Die Darstellung von $-5$

Zuerst die Binärdarstellung von $5$:
$$
5 = 00000101
$$
Invertiere alle Bits:
$$
11111010
$$
Addiere $1$:
$$
11111011
$$
Daher ist $-5$ im $8$-Bit-Zweierkomplement:
$$
-5 = 11111011
$$

**Bereich**: Bei einer $8$-Bit-Darstellung können mit dem Zweierkomplement Werte von $-128$ bis $127$ dargestellt werden.

**Berechnung**: Positive Zahlen werden genauso berechnet wie im vorzeichenlosen Format. Bei negativen Zahlen im Zweierkomplement wird die Binärzahl erst in ihre positive Form umgewandelt (Bits invertieren und $1$ addieren) und dann als negative Dezimalzahl interpretiert.

Das Zweierkomplement ist in Computern weit verbreitet, da es die arithmetischen Operationen (Addition, Subtraktion) vereinfacht, unabhängig davon, ob die Zahlen positiv oder negativ sind.

<div style= "color: black;background-color: powderblue ;margin: 10 px auto; padding: 10px; border-radius: 10px">
    <p style="font-size:12pt; text-align:center; color:   black; background-color: lightskyblue ;margin: 10 px auto; padding: 10px; border-radius: 10px" id="3"><b>Aufgabe 3</b>  </p> 

In dieser Aufgabe sollen Sie Zahlen aus dem Dezimalsystem in das Binärsystem übersetzen. Gehen Sie hierbei von einem $8$-Bit Zweierkomplement aus wie es obig erläutert wurde.   

Übersetzen Sie folgende Zahlen:

- $3$
- $-16$
- $100$
- $-128$ 

Zur Überprüfung ihrer Ergebnise steht ihnen der Code in der nächsten Zelle zur Verfügung. Gehen Sie vor wie in dem Beispiel.

In [2]:
# Führen Sie diese Zelle aus bevor Sie die nächste ausführen
# Sie müssen den Code nicht verstehen
# ------------------------------------------------------------------------------
def binary_to_int(binary_string):
    def positive_binary_to_int(binary_string):
        return int(binary_string, 2)

    def twos_complement(binary_string):
        inverted = ''.join(['1' if bit == '0' else '0' for bit in binary_string])
        inverted_int = positive_binary_to_int(inverted)
        return format(inverted_int + 1, '0' + str(len(binary_string)) + 'b') 

    if binary_string[0] == '0':
        return positive_binary_to_int(binary_string)
    
    else:
        return -positive_binary_to_int(twos_complement(binary_string))

In [3]:
# So können Sie ihre aufgestellten Binärzahl testen
# Ersetzen Sie die Zahl zwischen den Anführungszeichen und führen Sie dann die Codezelle aus
test_binary = "11111011"
binary_to_int(test_binary)

-5

Nun Zurück zu der Gleichung $0.1 + 0.2$. Hier sind im Gegensatz zu den obigen Beispielen Fließkommazahlen vorhanden. Wie diese im Dezimalsystem aufgestellt werden, wurde bereits zu beginn erläutert. Nun stellt sich die Frage wie dies im Computer geschieht und wie die Diskrepanz im Ergebnis ensteht. Dafür wird sich der IEEE 754-Standard angeschaut.

<a id="3"></a>
### IEEE 754

Stellen Sie sich vor, Sie haben eine Taschenlampe, die in der Lage ist, Licht über unglaublich weite oder unglaublich kurze Entfernungen zu werfen. Je nachdem, wie Sie den Fokus einstellen, kann sie sowohl den Mond als auch winzige Details direkt vor Ihnen beleuchten. So funktioniert im Grunde das IEEE 754-Format für Fließkommazahlen: Es kann sowohl sehr große als auch sehr kleine Zahlen mit einer bestimmten Genauigkeit darstellen.


**Die Teile:**

Jede Fließkommazahl im IEEE 754-Format besteht aus drei Teilen:

1. **Vorzeichen**: Sagt aus, ob die Zahl positiv oder negativ ist.
2. **Exponent**: Dies ist wie der "Fokus" unserer Taschenlampe. Er bestimmt, wie groß oder klein die Zahl ist.
3. **Mantisse**: Dies sind die eigentlichen "Ziffern" der Zahl.

**Wie es funktioniert:**

- **Vorzeichen**: Ein einfaches Bit bestimmt das Vorzeichen. Wenn es $0$ ist, ist die Zahl positiv; wenn es $1$ ist, ist die Zahl negativ.
  
- **Exponent**: Stellen Sie sich den Exponenten als "Verstärkung" oder "Verkleinerung" vor. Wenn Sie eine große Zahl haben, wird der Exponent den Wert "vergrößern", und wenn Sie eine kleine Zahl haben, wird er ihn "verkleinern". Es gibt jedoch einen kleinen Trick: Der Exponent hat einen "Bias", was bedeutet, dass eine bestimmte Zahl (z.B. $127$ für 32-Bit-Zahlen) hinzugefügt wird, um sicherzustellen, dass sowohl positive als auch negative Exponenten dargestellt werden können.
  
- **Mantisse**: Dies sind die eigentlichen "Ziffern" Ihrer Zahl, aber in binärer Form. Es gibt eine Besonderheit: Es wird angenommen, dass vor den binären "Ziffern" immer eine "1" steht. Das bedeutet, dass die Zahl $1,01$ in Binärform als $0,01$ gespeichert wird, weil die führende $1$ implizit ist.



**Beispiel**


**Darstellung der Zahl $-5,25$**

Die Zahl $-5,25$ soll im IEEE 754-Format dargestellt werden. Erinnern Sie sich an die Taschenlampe? Jetzt werden wird sie verwendet, um diese Zahl zu beleuchten!

**Grundlagen:**

**Binäre Darstellung von $-5,25$**:  
   Zuerst wird die Ganzzahl 5 in Binärform konvertiert, was $101$ ist. Dann wird der Dezimalteil $0,25$ konvertiert, der in Binärform $0,01$ ist. Zusammengenommen ergibt das $101,01$.

**Wie es funktioniert:**

- **Vorzeichen**: Die Zahl ist negativ, also wird das Vorzeichenbit auf $1$ gesetzt.
  
- **Exponent**: Für die Zahl $101,01$, wird der "Binärpunkt" zwei Stellen nach rechts verschoben, um eine Normalform zu erhalten: $1,0101$. Da der Punkt um zwei Stellen verschoben wurde, ist der Exponent gleich $2$. Jetzt wird der Bias ($127$ für 32-Bit-Zahlen) hinzugefügt: $2 + 127 = 129$. In Binärform ist das $10000001$.
  
- **Mantisse**: Nach der Normalisierung haben wir die Ziffern $0101$ nach dem Binärpunkt. Die restlichen Bits werden mit Nullen aufgefüllt.

Also, die IEEE 754-Darstellung von $-5,25$ ist:  
Vorzeichen: $1$  
Exponent: $10000001$  
Mantisse: $01010000000000000000000$

Zusammengesetzt Sieht die Zahl dann so aus: $11000000101010000000000000000000$
<div align="center">

![image info](ieee2.png)

</div>

<div style= "color: black;background-color: powderblue ;margin: 10 px auto; padding: 10px; border-radius: 10px">
    <p style="font-size:12pt; text-align:center; color:   black; background-color: lightskyblue ;margin: 10 px auto; padding: 10px; border-radius: 10px" id="4"><b>Aufgabe 4</b>  </p> 

In dieser Aufgabe sollen Sie Zahlen aus dem Dezimalsystem in das Binärsystem übersetzen. Gehen Sie hierbei davon aus, dass die Binärzahl dem IEEE 754-Standard entsprechen soll.   

Übersetzen Sie folgende Zahlen:

- $-6.75$
- $-42.875$ 

Zur Überprüfung ihrer Ergebnise steht ihnen der Code in der nächsten Zelle zur Verfügung. Gehen Sie vor wie in dem Beispiel.

In [5]:
import struct
def float_to_bin(num):
    bits, = struct.unpack('!I', struct.pack('!f', num))
    return "{:032b}".format(bits)

In [6]:
number = -5.25
print(float_to_bin(number))

11000000101010000000000000000000


### Problem mit der Darstellung:

Im Binärsystem können einige Dezimalzahlen nicht exakt dargestellt werden. Zum Beispiel:

- $0,1_{10}$ (in dezimaler Form) ist als Binärzahl eine wiederkehrende Sequenz: $0,0001100110011001100110011...$ (und so weiter).
- $0,2_{10}$ ist in Binärform: $0,001100110011001100110011...$ (und so weiter).

Beachten Sie, dass beide Zahlen nicht exakt als endliche binäre Fließkommazahlen dargestellt werden können.

#### IEEE 754 und Rundung:

Der IEEE 754-Standard für Fließkommazahlen speichert Zahlen mit einer festen Anzahl von Bits (z.B. 32 oder 64 Bits). Aufgrund dieser Beschränkung werden die wiederkehrenden Sequenzen nach einer bestimmten Anzahl von Bits abgeschnitten, was zu Rundungsfehlern führt.

Wenn Sie nun $0,1$ und $0,2$ im IEEE 754-Format addieren, addieren Sie tatsächlich zwei gerundete Werte. Da beide Werte nicht exakt sind, ist auch das Ergebnis nicht exakt, was zu dem kleinen zusätzlichen Betrag von $0,00000000000000004$ führt.



#### Verlust der Genauigkeit bei größeren Zahlen

ULP steht für "Unit in the Last Place" oder auf Deutsch "Einheit an der letzten Stelle". Es bezeichnet den Wert der kleinsten Ziffer in der Mantisse (Signifikand) einer Gleitkommazahl.

In einfachen Worten: ULP gibt den Unterschied zwischen einer gegebenen Gleitkommazahl und der nächstgrößeren (oder nächstkleineren) darstellbaren Zahl in diesem Format an. Es ist also der kleinste Unterschied, den man zu einer Gleitkommazahl hinzufügen (oder von ihr subtrahieren) kann, ohne dass sie sich im Gleitkommaformat ändert.

Ein einfaches Beispiel zur Veranschaulichung: Betrachten wir eine Dezimalzahl mit zwei Dezimalstellen. Für die Zahl $1,23$ wäre die ULP $0,01$, da dies der Wert der letzten Stelle (in diesem Fall der Hundertstelstelle) ist. Das Hinzufügen oder Subtrahieren von $0,01$ zu/von $1,23$ würde eine Veränderung in der letzten Stelle bewirken.

In der Gleitkommarepräsentation, insbesondere im IEEE 754-Standard, hängt der ULP-Wert vom Exponenten der Zahl ab. Für größere Zahlen (mit einem größeren Exponenten) wird der ULP-Wert größer, was bedeutet, dass der kleinste Unterschied, der zu solchen Zahlen hinzugefügt werden kann, größer ist als bei kleineren Zahlen. Dies ist ein Grund, warum die Präzision von Gleitkommazahlen bei größeren Werten abnimmt.

Die Tabelle enthält einige repräsentative Zahlen und den zugehörigen ULP-Wert für jede dieser Zahlen.

<div align="center">

|   Zahl   |   ULP-Wert   | |
|:--------:|:------------:|:------------:|
| $1,0 $     | $1,192 \times 10^{-7}$ | $0,0000001192$|
| $1,5 $     | $1,192 \times 10^{-7}$ | $0,0000001192$|
| $2,0   $   | $2,384 \times 10^{-7}$ | $0,0000002384$|
| $8,0   $   | $9,537 \times 10^{-7}$ | $0,0000009537$|
| $16,0 $    | $1,907 \times 10^{-6}$ | $0,000001907$|
| $32,0  $   | $3,815 \times 10^{-6}$ | $0,000003815$|
| $100,0 $   | $7,629 \times 10^{-6}$ | $0,000007629$|
| $1000,0  $ | $6,104 \times 10^{-5}$ | $0,00006104$|
| $10.000,0 $| $9,766 \times 10^{-4}$ | $0,0009766$|
| $100.000,0$| $7,812 \times 10^{-3}$ | $0,007812$|
| $1.000.000,0$| $6,250 \times 10^{-2}$ | $0,0625$|

</div>

Wie Sie sehen können, nimmt der ULP-Wert zu, wenn die Zahl ansteigt. Das bedeutet, dass der Unterschied zwischen einer gegebenen Zahl und der nächstgrößeren Zahl, die im IEEE 754-Format dargestellt werden kann, mit zunehmender Größe der Zahl ebenfalls zunimmt. Dies zeigt die Einschränkungen der Gleitkommagenauigkeit, insbesondere bei sehr großen Zahlen.