# Zahlensysteme in Python

**Prof. Dr. David Klotz** \
Hochschule der Medien Stuttgart \
Studiengang Wirtschaftsinformatik und digitale Medien (Bachelor) \
Grundlagen der Wirtschaftsinformatik

<img src="10-types-of-people.jpg" width="700">

## Dezimalzahlen umwandeln

Wir können die ```bin()```-Funktion verwenden, um Dezimalzahlen umzuwandeln:

In [85]:
bin(42)

'0b101010'

Python kennzeichnet Binärwerte durch das Präfix `0b`. Wir können mit der `format()`-Funktion jedoch auch eine Umwandlung in eine Zeichenkette mit reinem Binärwert umsetzen:

In [86]:
# Umwandlung mit Präfix und ohne Präfix
format(42, '#b'), format(42, 'b')

('0b101010', '101010')

**Wiederholung**\
Wir können das Ergebnis `'0b101010'` natürlich auch mit Python kontrollieren, indem wir die entsprechenden Zweierpotenzen wieder addieren:

$$\begin{split} (101010)_2 &= 1 \cdot 2^5 + 0 \cdot 2^4 + 1 \cdot 2^3 + 0 \cdot 2^2 + 1 \cdot 2^1 + 0 \cdot 2^0 \\
&= 1 \cdot 2^5 + 1 \cdot 2^3 + 1 \cdot 2^1 \\
&= 2^5 + 2^3 + 2^1 \\
&= 32 + 8 + 2 \\
&= 42
\end{split}
$$

Hinweis: Potenzen schreiben wir in Python mit dem `**`-Operator.

In [87]:
2**5 + 2**3 + 2**1

42

(Natürlich gilt: Punkt vor Strich! 😉)

**Aufgabe**\
Berechne nun Du mit Hilfe der `bin()`-Funktion die Binärzahl mit dem Wert 134:

In [None]:
# Berechne hier die Lösung:


In [164]:
# Musterlösung:
bin(134)

'0b10000110'

...und kontrolliere dein Ergebnis, indem Du die Zweierpotenzen wieder addierst:

In [166]:
# Berechne hier die Kontrollrechnung:


In [165]:
# Musterlösung:
1 * 2**7 + 0 * 2**6 +  0 * 2**5 +  0 * 2**4 +  0 * 2**3 + 1 * 2**2 + 1* 2**1 + 0 * 2**0

134

**Aufgabe** \
Schreibe eine eigene Python-Funktion, die eine Zeichenkette mit einer Binärzahl übergeben bekommt und diese in eine Dezimalzahl umwandelt.

In [None]:
# Die Umrechnungsfunktion
def bin_to_dec(s):
    """Diese Funktion wandelt die übergenene Zeichenkette in eine Ganzzahl um."""
    # Ersetze 'pass' durch deinen Code:
    pass

# Und hier der Test:
bin_str = input('Bitte gib eine Binärzahl ein: ')
print(f'Die Binärzahl {bin_str} entspricht der Zahl {bin_to_dec(bin_str)} im Dezimalsystem.')

In [173]:
# Musterlösung

# Die Umrechnungsfunktion
def bin_to_dec(s):
    """Diese Funktion wandelt die übergenene Zeichenkette in eine Ganzzahl um."""
    ergebnis = 0
    for stelle, wert in enumerate(s[::-1]):
        if wert == '1':
            ergebnis += 2 ** stelle
        elif wert != '0':
            raise ValueError("Übergebene Zeichenkette ist keine Binärzahl.")
    return ergebnis

# Und hier der Test:
bin_str = input('Bitte gib eine Binärzahl ein: ')
print(f'Die Binärzahl {bin_str} entspricht der Zahl {bin_to_dec(bin_str)} im Dezimalsystem.')

Bitte gib eine Binärzahl ein: 00000
Die Binärzahl 00000 entspricht der Zahl 0 im Dezimalsystem.


## Binärzahlen in Python

Sicherlich können wir auch mit Binärzahlen rechnen, oder?

In [91]:
bin(42) + bin(21)

'0b1010100b10101'

Oops. 🙈 \
Der Ausdruck liefert offenbar eine Zeichenkette zurück und der Plus-Operator `+` verkettet uns diese.

**Erinnerung**\
Im Hauptspeicher eines Rechners sind die beiden Zahlen `42` und `21` ohnehin als Binärzahlen gespeichert.

![binary-meme.jpg](attachment:binary-meme.jpg)

Aber wenn es dann doch mal unbedingt sein muss, dann geht es schon:

In [92]:
0b101010 + 0b10101

63

**Merke**: Ausdrücke, die mit `0b` beginnen, interpretiert Python als *Binärwerte*. Logischerweise dürfen diese Ausdrücke dann nur aus Nullen und Einsen bestehen.

In [95]:
0b123456

SyntaxError: invalid digit '2' in binary literal (4084708100.py, line 1)

Ein deutlich einfacherer Weg, die Kontrollrechnung zu einem gegebenen Binärausdruck durchzuführen:

In [96]:
0b101010

42

Oder wir wandeln eine gegebene Zahl wieder in eine Dezimalzahl mit Hilfe der `int()`-Funktion um:

In [97]:
int('0b101010', 2)

42

Die `int()`-Funktion kann Werte beliebiger Zahlensysteme in das Dezimalsystem umwandeln. Man muss lediglich mit dem zweiten Parameter die Basis übergeben.

Beispiel: Umwandlung der Zahl $ 6371_8 $ in das Dezimalsystem:

In [98]:
int('6371', 8)

3321

**Aufgabe**\
Jetzt bist Du wieder dran! Wandle den Wert `5A3BB18` aus dem 13er-System in das Dezimalsystem um.

In [None]:
int('5A3BB18', 13)

## Hexadezimalzahlen

![hex-meme.jpg](attachment:hex-meme.jpg)

Natürlich können wir auch Zahlen in das **Hexadezimalsystem** umwandeln. Es gibt dafür die eingebaute Funktion `hex()`.

Beispiel: Umwandlung der Zahl 42 in das Hexadezimalsystem:

In [101]:
hex(42)

'0x2a'

Wir sehen: Bei Hexadezimalzahlen lautet das Präfix `0x`.

Was wir zuvor für Binärzahlen gesagt haben, gilt auch für Hexadezimalzahlen: Wir können sie als Literale mit dem Präfix `0x` definieren und wir können sie mit der `int()`-Funktion in Dezimalzahlen umwandeln.

In [102]:
# Implizite und explizite Umwandlung in den Zahlenwert
0x2a, int('0x2a', 16)


(42, 42)

**Aufgabe**\
Probiere auch das aus! Wandle erst die Dezimalzahl 8146 in das Hexadezimalsystem und dann den Wert $D15FF_{16}$ in das Dezimalsystem um.

In [None]:
hex(8146), int('D15FF', 16)

## Umwandlung in beliebige Zahlensysteme

Mit den folgenden beiden einfachen Hilfsfunktionen lassen sich beliebige Dezimalwerte in Systeme einer anderen Basis umwandeln. `encode()` wandelt einen Zahlenwert in das jeweilige Symbol um und `dec_to_base()` führt die eigentlich Umrechnung durch.

In [105]:
ALPHABET = \
  "0123456789abcdefghijklmnopqrstuvwxyz"

def encode (n):
  try:
    return ALPHABET [n]
  except IndexError:
    raise Exception ("cannot encode: %s" % n)

def dec_to_base (dec = 0, base = 16):
  if dec < base:
    return encode (dec)
  else:
    return dec_to_base (dec // base, base) + encode (dec % base)

`dec_to_base()` in Action 😎:

In [106]:
z = int(input('Dezimalzahl: '))
b = int(input('Basis des Zielsystems: '))

print(f'Die Zahl {z} wird im {b}er-System als {dec_to_base(z, b)} dargestellt.')

Dezimalzahl: 2022
Basis des Zielsystems: 30
Die Zahl 2022 wird im 30er-System als 27c dargestellt.


## Binärzahlen über $\mathbb{N}$ hinaus

Bisher haben wir uns nur mit den natürlichen Zahlen und deren Umrechnung beschäftigt.

Python (und nahezu alle anderen Programmiersprachen auch) kann natürlich auch Zahlen aus anderen Zahlenräumen darstellen und damit rechnen.

### Negative Zahlen

Wir können auch den Binärwert negativer ganzer Zahlen problemlos über die `bin()`-Funktion berechnen. 

In [107]:
bin(-42)

'-0b101010'

Die Darstellung entspricht jedoch nicht ganz der binären Codierung im Speicher.

![meme-question.jpg](attachment:meme-question.jpg)

**Frage**: Wie könnte ein Computer kennzeichnen, dass eine Zahl negativ ist?


### Vorzeichen von binären Zahlen

Für die binäre Codierung von positiven und negativen Zahlen gibt es zwei Möglichkeiten:

1. Ein bestimmtes Bit wird für die Codierung des Vorzeichens verwendet. Voraussetzung: Zahlen müssen eine konstante Stellenzahl haben (z.B. 32 Bit), wodurch einige Speicherstellen ungenutzt sind.

2. Man verwendet das so genannte *Zweierkomplementformat*. Hier können Werte eine variable Breite haben und das höchstwertige Bit gibt an, ob die Zahl positiv (0) oder negativ (1) ist.

Python verwendet die 2. Variante, das Zweierkomplement.

### Zweierkomplement berechnen

Vorgehensweise zur Berechnung des Zweierkomplements eines beliebigen negativen Wertes $z$:
    
1. Umwandlung in eine positive Zahl gleichen Betrages durch Multiplikation mit $-1$.

2. Umrechnung in die Binärdarstellung

3. Negation aller Stellen der Binärzahl

4. Addition mit $1$

### Beispiel

Berechnung des Zweierkomplements von $-42$:

1. $-42 \cdot -1 = 42$

2. $42_{10} = 00101010_2$

3. Negation: $11010101_2$

4. $11010101_2 + 00000001_2 = 11010110_2$


Kann man die binäre Codierung einer negativen Zahl als Zweierkomplement in Python herausbekommen?

Ja -- aber es ist ein wenig kompliziert:

In [163]:
# 42 und -42 zum Vergleich
bin(42), bin(((1 << 7) - 1) & -42)

('0b101010', '0b1010110')

Das Zweierkomplementformat wirkt auf den ersten Blick recht verwirrend. Vielleicht macht jedoch mehr Sinn, wenn wir die Addition betrachten:

In [160]:
for i in range(7):
    print('{0: >2}'.format(str(i-3)), format(((1 << 4) - 1) & (i-3), '04b'))

-3 1101
-2 1110
-1 1111
 0 0000
 1 0001
 2 0010
 3 0011


Wir sehen, dass bei negativen Zahlen das höchstwertige Bit eine `1` enthält, während es bei positiven Zahlen immer eine `0` ist. Zudem funktioniert in diesem Format auch die Addition, z.B. ist `1101 + 0010` ($3+2$) tatsächlich `1111` ($-1$).  

Hinweis: Dies ist jedoch nur eine vereinfachte Darstellung zu Veranschauung des Zweierkomplements. Tatsächlich speichert Python Ganzzahlen nicht mit einer festen Länge. Details dazu findest du in der [Python Dokumentation](https://docs.python.org/3/library/stdtypes.html#numeric-types-int-float-complex).

### Rationale Zahlen

Versuchen wir einmal, die Binärdarstellung einer rationalen Zahl, z.B. $\frac 1 2$ zu berechnen:

In [120]:
bin(1/2)

TypeError: 'float' object cannot be interpreted as an integer

Schon wieder oooops. 🙈

Python macht es uns leider nicht so einfach.

### Gleitkommazahlen

Will man reele Zahlen in einem Computer darstellen und damit rechnen, so muss man sich die Position des Kommas im Speicher merken.

Erster Ansatz: Immer an der gleichen Stelle (Festkommaarithmetik)

**Problem**: Viele Rechnungen erzeugen einen Überlauf.

### Fließkommaarithmetik

Daher ist man dazu übergegangen, reelle Zahlen (bzw. ihre Annäherung) als Fließkommazahl zu speichern, d.h. in einer Darstellung, bei der das Komma flexibel gespeichert wird.

Dafür überführt man jede reelle Zahl $x$ in die folgende Notation:

$$ x = m \cdot b^e $$

Man nennt $m$ die *Mantisse*, $b$ die *Basis* und $e$ den *Exponenten*.

Zudem hat man für die Speicherung in Computern festgelegt, dass für die Mantisse $ 1 \le m \lt 2 $ gelten und das als Basis das Binärsystem ($b=2$) verwendet werden soll.

### Beispiel für die Fließkommadarstellung

$$ 0,75 = 1,5 \cdot 2^{-1}$$

### Speicherung von Gleitkommazahlen

Speicherung eines Wertes mit einfacher Genauigkeit (*single* oder *float* in vielen Programmiersprachen genannt) nach dem Standard IEEE 754-1985, an den sich die meisten Programmiersprachen halten.

![IEEE_754_Single_Floating_Point_Format.png](attachment:IEEE_754_Single_Floating_Point_Format.png)

Hinweis: Python folgt IEEE 754, nutzt jedoch für Gleitkommazahlen eine feste Breite von 64 Bit (Datentyp *Double* in C). 

### Rechnen mit Gleitkommazahlen

Probieren wir mal ein wenig einfache Rechenaufgaben mit Fließkommazahlen:

In [134]:
.1 + .1

0.2

In [135]:
.1 + .1 + .1

0.30000000000000004

![meme-dafu.jpg](attachment:meme-dafu.jpg)

Ja, für Python (und viele andere Programmiersprachen auch) hat das Ergebnis der Rechnung `0.2 + 0.1` den Wert `0.30000000000000004`.

Woran das liegt, wird hier sehr schön erklärt: https://0.30000000000000004.com/

**TLDR:** Werte wie $\frac 1 {10}$ und $\frac 1 {5}$ lassen sich nicht ganz exakt im Binärsystem abbilden, sondern sind dort ein periodischer Dezimalbruch. Berechnungen mit solchen Werten führen u.U. zu unerwarteten Restbeträgen, die dann bei der Konvertierung zurück in das Dezimalsystem vorhanden sind.

Besonders wichtig ist das, wenn wir Berechnungsergebnisse mit Gleitkommazahlen auf **Gleichheit** prüfen möchten:

In [131]:
0.2 + 0.1 == 0.3

False

**Die Lösung**

Wir prüfen nicht auf Gleichheit, sondern ob das Berechnungsergebnis sehr nahe bei unserem Vergleichswert liegt.

Dafür definieren wir als Schwelle einen sehr kleinen Wert *Epsilon*, z.B. `0.0000000001`. Ist dann die Differenz unseres Berechnungsergebnis und des Vergleichswert kleiner als dieser Vergleichswert Epsilon, dann unterstellen wir, dass die beiden Werte nah genug beieinander sind, um sie als "gleich" anzusehen.

In [138]:
if 0.1 + 0.2 == 0.3:
    print('So geht es nicht!')
    
if abs(0.1 + 0.2 - 0.3) < 0.00000001:
    print('Jetzt aber')

Jetzt aber


Die gezeigte Lösung funktioniert relativ pragmatisch in vielen Anwendungsbereichen, in denen die Präzision der Nachkommawerte nicht so hoch ist (z.B. Währungsbeträge mit 2 Nachkommastellen). Doch wie können wir einen Wert für Epsilon bestimmen, der uns mit möglichst großer Sicherheit die Gleichheit von beliebigen Gleitkommazahlen bestimmen lässt?

Die Lösung: Im Standard-Modul `sys` gibt es eine Konstante für Epsilon, welche den kleinstmöglichen Wert darstellt (für `float` Werte), der für den Test auf Gleichheit verwendet werden kann. Diese Konstante liefert in jeder Umgebung (unabhängig von der genutzten Hardware, dem Betriebssystem, etc.) den kleinstmöglichen Wert für Epsilon.

In [139]:
import sys
sys.float_info.epsilon

2.220446049250313e-16

**Beispiel für die ganz korrekte Anwendung**

Wir nutzen die `abs()`-Funktion, um den Betrag der Differenz zu berechnen und `sys.float_info.epsilon`, um die beiden Werte zu vergleichen:

In [140]:
import sys

if abs(0.1 + 0.2 - 0.3) < sys.float_info.epsilon:
    print('Das ist die beste Lösung! ☺️')

Das ist die beste Lösung! ☺️


**Merke:** Beim Rechnen mit Fließkommazahlen und insbesondere bei der Prüfung auf Gleichheit sehr vorsichtig sein!

![meme-float-too.jpg](attachment:meme-float-too.jpg)

## Referenzen

[`bin()`-Funktion in Python](https://docs.python.org/3/library/functions.html#bin)\
[`format()`-Funktion in Python](https://docs.python.org/3/library/functions.html#format)\
[`int()`-Funktion in Python](https://docs.python.org/3/library/functions.html#bin)\
[Generische Umwandlung in ein Zahlensystem](https://stackoverflow.com/questions/50261666/number-system-converter-python)\
[Codierung von Gleitkommazahlen nach IEEE 754-1985](https://en.wikipedia.org/wiki/IEEE_754-1985)\
[Warum ist `0.1 + 0.2 != 0.3`?](https://0.30000000000000004.com/)\
[Python Dokumentation zu numerischen Datentypen](https://docs.python.org/3/library/stdtypes.html#numeric-types-int-float-complex)