# Diskussion

Zur Diskussion der Performanceergebnisse werden die Werte eines bestimmten, aber nicht besonderen Durchlaufs genutzt. Die Werte können bei einem erneuten Durchlauf geringfügig abweichen. Zu beachten ist, dass bereits im Performancetest der Median aus mehreren Durchläufen genutzt wird.

## Vergleich der Datenstrukturen

Die folgende Tabelle listet noch einmal die Vergleiche zwischen den Splay Trees, den AVL-Bäumen und den Hashtabellen auf, wobei alle Implementierungen in Python und gegebenenfalls rekursiv sind. Die Angaben sind alle relativ zu den Splay Trees, da wir protagonistisch die Splay Trees betrachten. Wir vergleichen die Zeiten so, dass höher besser ist.

|Benchmark                 |AVL-Bäume|Splay Trees|Hashtabellen             |
|--------------------------|---------|-----------|-------------------------|
|Sieb des Eratosthenes     |$0.81$   |$1$        |$4.63$                   |
|$n$-Damen auf Davis-Putnam|$0.57$   |$1$        |$0.34$                   |
|Schiebepuzzle auf A$^*$   |$0.62$   |$1$        |*entfällt, da ungeordnet*|

Insgesamt betrachten wir, wenn, wie beim Sieb des Eratosthenes, häufig sequenziell über die untersuchte Menge iteriert wird, einen klaren Nachteil beider Baumimplementierungen gegenüber Hashtabellen, der sich auch in einem Faktor bemerkbar macht. Die AVL-Bäume sind noch etwas langsamer als die Splay Trees.

Beim Algorithmus von Davis und Putnam liegen die Hashtabellen jedoch hinter den Baumimplementierungen, besonders hinter den Splay Trees, hier sogar mit einem kleinen Faktor. Die AVL-Bäume liegen deutlich hinter den Splay Trees, jedoch ist hier kein Faktor zwischen den Ergebnissen.

Ähnliches gilt für den Vergleich von AVL-Bäumen und Splay Trees beim A$^*$-Algorithmus. Da die Implementierung auf geordnete Mengen setzt, sind die an sich ungeordneten Hashtabellen hier nicht Teil des Vergleichs.

Zusammenfassend beobachten wir, dass die Splay Trees stets etwas besser abschneiden als die AVL-Bäume. Die Ergebnisse der Hashtabellen sind eher gemischt, wir gehen allerdings sogleich noch weiter auf Hashtabellen ein.

## Vergleich mit nativen Mengen

Da uns auch die Praktikabilität der Splay Trees zur Verwendung als Mengen interessiert, betrachten wir noch einmal die Vergleiche mit den nativen Mengen, die auf Hashtabellen basieren. Wir nutzen dabei die Variante der Splay-Mengen, die der C-Implementierung von Python am nächsten kommt, die iterative Inline-Implementierung in Cython. Dennoch wäre der Vergleich erst in C ganz ebenbürtig. Hierfür schreiben wir keine Tabelle: Die nativen Mengen waren beim Sieb des Eratosthenes $5.9$-mal so schnell wie die geordneten Cython-Mengen, beim Algorithmus von Davis und Putnam sogar $182.55$-mal so schnell, der Vergleicht mit A$^*$ entfällt, da die nativen Mengen ungeordnet sind.

Wir betrachten also für Eratosthenes einen ähnlichen Speedup wie beim Datenstrukturvergleich, für den Algorithmus von Davis und Putnam sind aber die Splay Trees nicht etwa einen Faktor schneller, sondern zwei Größenordnungen langsamer. Es ist davon auszugehen, dass die nativen Mengen hier massiv nicht nur von der Sprache, sondern auch von Optimierungen, die die Python-Implementierung nicht hat, profitieren.

Ohne einen guten Grund für die Ordnung der Menge ist daher nicht zur Verwendung der geordneten Splay-Mengen zu raten, auch wenn die Funktionalität fast vollständig gedeckt ist (vgl. `4-Test.ipynb`), wenn man von `<` und `>` absieht.

## Vergleich der Optimierungslevel

Wir vergleichen noch eher interessehalber, welchen Speedup die sukzessiven Optimierungen der Splay Trees brachten, das heißt die iterative Implementierung des Splayvorgangs. dasselbe mit Inline-Operationen ohne Aufrufe für Methoden wie *Zig-Zag* und wiederum dasselbe mit Cython. Wir fassen noch einmal tabellarisch zusammen:

|Benchmark                 |rekursiv|iterativ|inline|Cython|
|--------------------------|--------|--------|------|------|
|Sieb des Eratosthenes     |$1$     |$1.08$  |$1.25$|$7.49$|
|$n$-Damen auf Davis-Putnam|$1$     |$1.31$  |$1.21$|$2.26$|
|Schiebepuzzle auf A$^*$   |$1$     |$1.09$  |$1.10$|$1.70$|

Wir beobachten für die reinen Python-Optimierungen einen Speedup im ein-, respektive zweistelligen Prozentbereich, außer für Davis-Putnam, wo schon der Umstieg auf die iterative Implementierung einen zweistelligen Prozentbereich bringt, die Inlinevariante (ebenfalls iterativ!) aber merkwürdigerweise einen leichten Rückgang verzeichnet. Cython bringt zweimal einen hohen Prozentsatz an Speedup, bei Eratosthenes sogar einen mittelgroßen Faktor.

Zusammenfassend können derartige Optimierungen im Code durchaus einen messbaren Unterschied machen, von den Speichereinsparnissen bzw. der Aufhebung von Rekursionsgrenzen durch Speicher ganz zu schweigen. Für performancekritische Projekte, die aber zum Beispiel aus Gründen der Umgebung und Interoperabilität in Python geschrieben werden müssen, kann der Speedup von Cython-Direktiven durchaus beeindrucken, insbesondere mit Blick darauf, wie wenig zusätzlicher Code geschrieben werden muss. Der *Rapid-Prototyping*-Ansatz von Python kann jedoch durch die Kompilierphase ein wenig untergraben werden.

# Literaturverzeichnis

Alle URLs zuletzt aufgerufen am 25. April 2020.

- S. Bank (2019): graphviz, GitHub. https://github.com/xflr6/graphviz
- S. Behnel et al. (2020): Cython: C-Extensions for Python. https://cython.org/
- J. Ellson et al. (2020): Graphviz. http://graphviz.org
- Free Software Foundation (2020): GCC, the GNU Compiler Collection. https://gcc.gnu.org/
- S. Gunasekaran (2018): Optimizing hash tables: hiding the hash code, V8 Blog. https://v8.dev/blog/hash-code
- R. D. Hettinger et al. (2019): cpython/Lib/test/test_set.py, GitHub. https://github.com/python/cpython/blob/3.7/Lib/test/test_set.py
- R. D. Hettinger et al. (2019): cpython/Objects/setobject.c, GitHub. https://github.com/python/cpython/blob/3.7/Objects/setobject.c
- Project Jupyter (2020): Home. https://jupyter.org/
- The Linux Kernel Developers (2016): Btrfs design. https://btrfs.wiki.kernel.org/index.php/Btrfs_design
- The LLVM Project (o. J.): Clang C Language Family Frontend for LLVM. https://clang.llvm.org/
- E. Mäkinen (1987): On top-down splaying. BIT Numerical Mathematics, 27 330-339
- Microsoft Corporation (2020): ISet$<$T$>$ Interface (System.Collections.Generic), Microsoft Docs. https://docs.microsoft.com/en-us/dotnet/api/system.collections.generic.iset-1?view=netframework-4.8
- Microsoft Corporation (2020): Visual Studio. https://visualstudio.microsoft.com/
- Oracle Corporation (2019): Set (Java SE 13 & JDK 13). https://docs.oracle.com/en/java/javase/13/docs/api/java.base/java/util/Set.html
- Oracle Corporation (2020): MySQL 8.0 Reference Manual/MySQL Glossary/B-tree. https://dev.mysql.com/doc/refman/8.0/en/glossary.html#glos_b_tree
- The PHP Group (2020): PHP: Set, Manual. https://www.php.net/manual/en/class.ds-set.php
- Python Software Foundation (2020): The Python Standard Library/Built-in Types/set, Python Documentation. https://docs.python.org/3.7/library/stdtypes.html#set
- Python Software Foundation (2020): The Python Standard Library/Data Types/collections/Counter, Python Documentation. https://docs.python.org/3.7/library/collections.html#collections.Counter
- Python Software Foundation (2020): The Python Standard Library/Data Types/collections/deque, Python Documentation. https://docs.python.org/3.7/library/collections.html#collections.deque
- Python Software Foundation (2020): The Python Standard Library/Data Persistence/object.\_\_getnewargs\_\_(), Python Documentation. https://docs.python.org/3/library/pickle.html#object.__getnewargs__
- Python Software Foundation (2020): The Python Standard Library/Data Persistence/object.\_\_reduce\_\_(), Python Documentation. https://docs.python.org/3/library/pickle.html#object.__reduce__
- Python Software Foundation (2020): The Python Standard Library/Functional Programming Modules/functools/reduce, Python Documentation. https://docs.python.org/3.7/library/functools.html#functools.reduce
- G. v. Rossum (2009): Neopythonic: Tail Recursion Eliminiation. https://neopythonic.blogspot.com/2009/04/tail-recursion-elimination.html
- D. D. Sleator, R. E. Tarjan (1985): Self-Adjusting Binary Search Trees. Journal of the ACM, 32(3) 652-686
- K. Stroetmann (2020): Algorithms/Python, GitHub. https://github.com/karlstroetmann/Algorithms/tree/master/Python
- K. Stroetmann (2020): Artificial-Intelligence/Python/1 Search, GitHub. https://github.com/karlstroetmann/Artificial-Intelligence/tree/master/Python/1%20Search
- K. Stroetmann (2020): Logic/Python, GitHub. https://github.com/karlstroetmann/Logic/tree/master/Python