# Schönere Datendarstellung mit "Format Strings"

Möchte man eine Liste von Daten ausgeben, ist es für die Lesbarkeit bisweilen von Vorteil, sie zu formatieren, also sie beispielsweise rechtsbündig als Festkommazahl anzuzeigen. Für diese und andere Zwecke kann man so genannte "format strings" verwenden.

## Einfache Syntax

Im einfachsten Fall stehen in einem format string einige Paare geschweifter Klammern `{}` als Platzhalter, in die man mit einem an den String angefügten `.format(a,b,c,...)` die Argumente `a,b,c,...` einsetzen kann. Steht in dem Klammerpaar eine Zahl, so nimmt diese Bezug auf ein bestimmtes Argument, wobei man bei $0$ zu zählen beginnt. In manchen Beispielen verwende ich Brüche, daher importiere ich `Fraction`.

In [1]:
from fractions import Fraction

In [2]:
print( "{} entspricht dem Bruch {} durch {}".format( Fraction( 3, 5 ), 3, 5 ) )
print( "{1} durch {2} ist gleich {0}".format( Fraction( 3, 5 ), 3, 5 ) )

3/5 entspricht dem Bruch 3 durch 5
3 durch 5 ist gleich 3/5


In einem anderen Notebook geht es um exaktes Rechnen, und dort ist auch erwähnt, dass es ein Unterschied ist, ob man ein `Fraction` einfach nur als Ausgabe einer Zelle anzeigt oder mit der `print()`-Funktion darstellt. In einem format string kann man mit `{!r}` erzwingen, dass die "Zellenausgabe" statt die "Printausgabe" angezeigt wird:

In [3]:
print( "{0!r} wird normalerweise als {0} geprintet.".format( Fraction ( 3, 5 ) ) )

Fraction(3, 5) wird normalerweise als 3/5 geprintet.


Gleitkommazahlen werden normalerweise nur dann im Festkommaformat angezeigt, wenn der Exponent nicht zu groß und nicht zu klein ist:

In [4]:
1.23e-4

0.000123

In [5]:
1.23e-5

1.23e-05

In [6]:
1.23e15

1230000000000000.0

In [7]:
1.23e16

1.23e+16

In einem format string kann man erzwingen, dass ein Zahltyp als eine Festkommazahl mit einer bestimmten Anzahl von Nachkommastellen angezeigt wird. Will man Tabellenwerte anzeigen, ist es zudem nützlich, auch eine gemeinsame Anzahl von Vorkommastellen anzugeben, so dass eine linksbündige Anzeige zumindest dann möglich ist, wenn die tatsächliche Gesamtstellenzahl nicht zu groß ist. Wenn es einschließlich des Dezimalpunkts und ggf. vorangestellten Leerzeichen mindestens `k` angezeigte Stellen geben und dabei auf `d` Nachkommastellen gerundet werden soll, verwendet man `{:k.df}`:

In [8]:
print( "{:10.4f}".format( 2/3 ) ) # Man beachte: Es wird auf 4 Nachkommastellen gerundet
print( "{:10.4f}".format( 123.45 ) )
print( "{:10.4f}".format( 1234567.89 ) ) # Es gibt insgesamt mehr als 10 Stellen

    0.6667
  123.4500
1234567.8900


Beachten Sie dabei (wie in einem anderen Notebook dargestellt), dass Python bisweilen nicht *mathematisch*, sondern *kaufmännisch* zu runden scheint (was aber an der intern verwendeten Binär- statt Dezimaldarstellung liegt):

In [9]:
print( "{:10.4f}".format( 1.234450 ) ) # Unerwünscht!!
print( "{:7.1f}".format( 1234.450 ) ) # Unterwunscht!!
print( "{:5.0f}".format( 12344.5 ) ) # Erwünscht

    1.2345
 1234.5
12344


## Fortgeschrittene Syntax

Ab Python Version 3.6 ist eine noch flexiblere Verwendung von format strings möglich. Also testen wir zunächst die Python-Version:

In [10]:
import sys
print(sys.version)

3.10.6 (main, Mar 10 2023, 10:55:28) [GCC 11.3.0]


Format Strings können erzeugt werden, indem man vor die öffnenden Anführungsstriche des Strings ein `f` setzt. In geschweiften Klammern kann man auf beliebige Variablennamen Bezug nehmen und auch Funktionen ausführen; nach einem Doppelpunkt kann dann sogar noch ein Format für die tabellarische Anzeige definiert werden. Ein `.format(...)` ist dabei nicht mehr nötig, aber immer noch möglich (das zeige ich hier nicht).

Übrigens: Sogar in der Formatspezifikation kann man noch auf Variablen Bezug nehmen. Will man also auf `d` Nachkommastellen runden, kann man `d` als Variable definieren und dann das Format in der Art `{:.{d}f}` festlegen.

Wir nutzen nun die Rundungsfunktion aus `numpy`, da diese sich enger an die mathematische Rundung im Dezimalformat hält als die Standard-`round`-Funktion (aber auch numpy ist nicht perfekt, wie Sie in einem anderen Notebook sehen können).

In [11]:
a = 1.23445
b = 111.23455
d = 4

In [12]:
import numpy as np

In [13]:
print( f"{a:9.{d}f} ist Pythons kaufmännische Rundung von {a} auf {d} Nachkommastellen" )
print( f"{np.round( a, d ):9.{d}f} ist numpys mathematische Rundung von {a} auf {d} Nachkommastellen" )
print( f"{b:9.{d}f} ist Pythons half-to-odd Rundung von {b} auf {d} Nachkommastellen" )
print( f"{np.round( b, d ):9.{d}f} ist numpys mathematische Rundung von {b} auf {d} Nachkommastellen" )

   1.2345 ist Pythons kaufmännische Rundung von 1.23445 auf 4 Nachkommastellen
   1.2344 ist numpys mathematische Rundung von 1.23445 auf 4 Nachkommastellen
 111.2345 ist Pythons half-to-odd Rundung von 111.23455 auf 4 Nachkommastellen
 111.2346 ist numpys mathematische Rundung von 111.23455 auf 4 Nachkommastellen


Ist statt einer Festkommadarstellung ausdrücklich eine Zahldarstellung in wissenschaftlicher Notation der dezimalen Mantissenlänge `d` erwünscht, kann man dies mit `{:.{d}e}` erreichen. Man muss dann leider damit leben, dass Python wieder kaufmännisch rundet:

In [14]:
print( f"{a:.{d}e}: kaufmännisch gerundete Gleitkommazahl mit {d} Mantissen-Nachkommastellen")

1.2345e+00: kaufmännisch gerundete Gleitkommazahl mit 4 Mantissen-Nachkommastellen
