# Best Practices und Performance

## Ziele

### Kurz

- **Genauigkeit:** Der Code liefert genaue Ergebnisse und ist robust gegenüber numerischen Instabilitäten und Rundungsfehlern.
- **Effizienz:** Der Code ist optimiert, um die bestmögliche Leistung aus der zugrunde liegenden Hardware herauszuholen.
- **Modularität:** Der Code ist modular und wiederverwendbar, was das Testen und Debuggen erleichtert.
- **Verständlichkeit:** Der Code ist gut strukturiert, dokumentiert und leicht verständlich.

### Ausführlich

- **Genauigkeit:** Numerische Algorithmen müssen in der Lage sein, genaue Ergebnisse zu liefern. Dazu gehört auch, dass der Code numerische Instabilitäten vermeidet und robust gegenüber Störungen und Rundungsfehlern ist.
- **Effizienz:** Numerische Verfahren arbeiten oft mit grossen Datenmengen und müssen daher effizient sein, um innerhalb eines angemessenen Zeitrahmens ausgeführt werden zu können. Dazu gehört auch, dass der Code optimiert wird, um die bestmögliche Leistung aus der zugrunde liegenden Hardware herauszuholen.
- **Modularität:** Die Methoden bestehen oft aus mehreren Schritten oder Teilproblemen, die modular und wiederverwendbar sein sollten. Eine gute Modularität erleichtert auch das Testen und Debuggen des Codes.
- **Verständlichkeit:** Numerische Algorithmen können komplex sein, und es ist wichtig, dass der Code so geschrieben ist, dass er leicht verständlich ist. Dazu gehört auch, dass der Code gut dokumentiert und strukturiert ist.

## Best Practices

### Ziel Genauigkeit

- Bestehende Lösungen (Packages) verwenden (aber nur vertrauenswürdige Quellen)
- Fehlerhafte und inkonsistente Inputs abfangen und rückmelden
- Numerische Instabilitäten vermeiden (64-bit Fliesskommazahlen verwenden, Subtraktion von ähnlichen Zahlen und Division durch sehr kleine Zahlen vermeiden, etc.)
- Ergebnisse für mehrere Probleme validieren (z.B. mit anderen Methoden oder mit analytischen Lösungen)
- "Edge-Cases" auch in den Tests abdecken (z.B. Division durch Null, etc.)

### Ziel Effizienz

- Vermeiden von IO-Operationen (Console, Disk, Netzwerk, etc.)
- Vektorisierung (z.B. mit [`numpy.vectorize`](https://numpy.org/doc/stable/reference/generated/numpy.vectorize.html))
- Parallelisierung (z.B. mit [`multiprocessing`](https://docs.python.org/3/library/multiprocessing.html))
- C-Code Kompilierung (z.B. mit [`numba`](https://numba.pydata.org/) oder [`cython`](https://cython.org/))
- Manchmal durch Mutationen (z.B. in-place Operationen auf Arrays)

### Ziel Modularität

- Funktionen und Methoden schreiben, die nur eine Aufgabe erfüllen.
- Gleichartige Funktionalität in ein Module oder wenn nötig in eine Klasse packen.
- Klare Schnittstellen für Funktionen, Module und Klassen definieren, um Abhängigkeiten zu minimieren und transporent zu machen.
- Schnittstellen sollen sich an Standards orientieren (z.B. [`numpy`](https://numpy.org/), [`scipy`](https://www.scipy.org/), [`pandas`](https://pandas.pydata.org/), etc.)

### Verständlichkeit

- Klare, konsistente und aussagekräftige Namen für Funktionen, Module, Klassen und Variablen verwenden.
- Funktionen, Module und Klasse mit aussagekräftiger Dokumentationen versehen, z.B. auch Referenzen zur implementierten Methode angeben.
- Tests schreiben, um die Funktionalität zu testen und um die Verständlichkeit zu erhöhen, indem sie gleich Beispielcode liefern.

## Performance

> "Premature optimization is the root of all evil" (Donald Knuth)

### Einfache Zeitmessung mit [`timeit`](https://docs.python.org/3/library/timeit.html)

In [None]:
import numpy as np

l = list(range(1_000))
%timeit "-".join(str(n) for n in l)
%timeit "-".join([str(n) for n in l])
%timeit "-".join(map(str, l))
%timeit "-".join(np.array(l, dtype=str))

### Profiling mit [`cProfile`](https://docs.python.org/3/library/profile.html)

Video: ["Using "cProfile" to analyze Python code performance" - IDG TECHtalk](https://www.youtube.com/watch?v=dmnA3axZ3FY)

### Testfälle erzeugen