# Sortieren

<div class="prereq">
    <h3>Was man wissen sollte</h3>
    <div>
        Die Daten, die wir sortieren werden, liegen in einem <a class="prereq" href="/user-redirect/algoviz/lessons/03_Fortgeschritten/00_Arrays.ipynb">Array</a> vor. Außerdem sollte man mit dem Konzept der <a class="prereq" href="/user-redirect/algoviz/lessons/04_Sortieren/03_AsymptotischeLaufzeiten.ipynb">asymptotischen Laufzeiten</a>
        vertraut sein.
    </div>
</div>    

Das Sortieren von Daten ist eines der grundlegenden Probleme der Informatik. Es spielt nicht nur bei der Präsentation und Bearbeitung von Daten eine große Rolle. Auch in der Algorithmik ist die Vorsortierung von Daten häufig für die Entwicklung von effizienten Methoden notwendig.

Da das Problem in vielen verschiedenen Kontexten auftirtt, gibt es eine ganze Reihe von Sortieralgorithmen, die alle ihre jeweiligen Besonderheiten haben. Und es kommt durchaus vor, dass ein Algorithmus, der in einer Situation schlechter erscheint als ein anderer, in einer anderen Situation durchaus besser ist. Aspekte, die dabei eine Rolle spielen sind unter anderem der Grad der Vorsortierung der Daten, die Größe und Anzahl der Daten, die Organisation des Speichers und ob die Daten vollständig im Arbeitsspeicher verarbeitet werden können oder Stückweise von einem externen Speicher - z.B. einer Festplatte - eingelesen werden müssen.

Außerdem bieten Sortieralgorithmen sehr gute Möglichkeiten sich mit der Entwicklung, Struktur und Analyse von Algorithmen zu beschäftigen. Und genau darauf wird unser Fokus liegen.

<div class="slideshow 04_Sortieren/11_Sortieren/slides.json">Das Sortierproblem</a>

Bevor wir **SelectionSort** implementieren, schauen wir ihn uns an einem Beispiel an. Dabei verwenden wir ein anderes Beispiel, wie man sich Algorithmen erschließen kann (nicht nur Sortieralgorithmen).

[](https://abbozza.informatik.uos.de/aud/slideshows/shows/04_Sortieren/SelectionSort.mp4)

<center>
  <video width="640" height="480" controls src="https://abbozza.informatik.uos.de/aud/slideshows/shows/04_Sortieren/SelectionSort.mp4">
  </video>
</center>

<div class="slideshow /04_Sortieren/12_SelectionSort/slides.json">SelectionSort</a>

Zur Implementierung nutzen wir das Struktogram.

![SelectionSort als Struktogramm](/user-redirect/algoviz/img/04_Sortieren/SelectionSort.png)

Damit ist die Implementierung nicht mehr sehr schwer.

In [1]:
// Da SelectionSort ein Eigenname ist, weichen wir bei der
// Benennung der Operation vom Styleguide ab und beginnen mit 
// einem Großbuchstaben.

void SelectionSort(int feld[], int len) {
    
    int max;
    
    // ende läuft rückwärts von len-1
    for ( int ende = len-1 ; ende > 0 ; ende-- ) {
        max = 0;
            
        // Die Suche nach dem Maximum
        for ( int pos = 1; pos <= ende ; pos++ ) {
            if ( feld[pos] > feld[max] ) {
                max = pos;
            }
        }
        
        // Der Tausch von feld[ende] mit feld[max]
        int helper = feld[ende];
        feld[ende] = feld[max];
        feld[max] = helper;
    }
}

### Ein neues Werkzeug

Da wir in der Zukunft etwas häufiger mit Arrays arbeiten, gibt es einige neue praktische Operationen, die wir ab jetzt nutzen. Dazu muss man die Bibliothek `Tools.hpp` einbinden.

In [2]:
#include <algoviz/Tools.hpp>

Alle Operationen, die durch die Bibliothek zur Verfügung gestellt werden, liegen in der Klasse **Tools** `aud`. Damit muss man immer `Tools::` voranstellen. Welche Operationen es gibt, sieht man in der Dokumentation.

In [3]:
?Tools

Probieren wir gleich zwei aus und lassen ein Array zufällig befüllen und ausgeben.

In [4]:
int feld[20];

Tools::fillArray(feld,20);
Tools::printArray(feld,20);

10 4 91 81 72 24 79 95 82 79 94 12 64 55 59 11 13 96 32 1 


Und jetzt können wir es sortieren lassen.

In [5]:
SelectionSort(feld,20);
Tools::printArray(feld,20);

1 4 10 11 12 13 24 32 55 59 64 72 79 79 81 82 91 94 95 96 


Sieht gut aus. Damit haben wir einen ersten Sortier-Algorithmus implementiert.

## Die Laufzeit von Selection Sort

Als nächstes wollen wir uns die Laufzeit von SelectionSort im Experiment ansehen. Dazu führen wir ihn auf zufällig befüllten Arrays verschiedener Größe aus und messen die Zeit, wie wir es schon bei der [linearen und binären Suche](/user-redirect/algoviz/lessons/04_Sortieren/02_BinaereSucheLaufzeiten.ipynb) gemacht haben.

Als erstes benötigen wir das Array und die Anzahl der Elemente. Hier können wir einen "Trick" anwenden, um uns die Arbeit etwas zu erleichtern. Dabei müssen wir uns daran erinnern, dass die Länge eines Arrays eine Konstante sein muss und nicht durch eine Variable gegeben werden kann. Das können wir umgehen, indem wir **garantieren**, dass die Variable knstant ist, d.h. dass wir ihren Wert nicht verändern. Das können wir erreichen, indem wir der Deklaration das Schlüsselwort `const` voranstellen. Dadurch können wir den Wert der Variable nicht mehr verändern. Probieren wir das mal aus.

In [65]:
const int konstante = 42;   // Eine Konstante

Und jetzt versuchen wir sie zu verändern, was zu einem Fehler führt.

In [67]:
konstante = 43; // Wir können sie nicht verändern!

[1minput_line_280:2:12: [0m[0;1;31merror: [0m[1mcannot assign to variable 'konstante' with const-qualified type 'const int'[0m
 konstante = 43; // Wir können sie nicht verändern!
[0;1;32m ~~~~~~~~~ ^
[0m[1minput_line_278:2:12: [0m[0;1;30mnote: [0mvariable 'konstante' declared const here[0m
 const int konstante = 42;   // Eine Konstante
[0;1;32m ~~~~~~~~~~^~~~~~~~~~~~~~
[0m

Interpreter Error: 

Wenn wir jetzt eine solche Konstante dazu nutzen die Länge des Arrays festzulegen, geht das.

In [76]:
const int len = 20000;
int feld[len];

Jetzt können wir das Array zufällig befüllen und sortieren. Dabei messen wir die benötigte Zeit.

In [77]:
%%timeit
Tools::fillArray(feld,len);
SelectionSort(feld,len);

212 ms +- 1.36 ms per loop (mean +- std. dev. of 7 runs 1 loop each)


Durch die Änderung von `len` kann man jetzt die Messung für verschiedene Arraylängen wiederholen.

<div class="task">
    <h3>Aufgabe</h3>
    <div>
        Führen Sie die Zeitmessung für die in dem Array <tt>laengen[]</tt> (siehe nächste Zelle) durch.
        Tragen Sie die Werte in Millisekunden (ms) in das Array <tt>messungen[]</tt> ein. Beachten Sie
        dabei die Reihenfolge.
    </div>
    <div>
        In dem Array <tt>referenz[]</tt> ist bereits eine Reihe von Messungen gegeben.
    </div>
</div>

In [1]:
double laengen[]   = { 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 12000, 15000, 20000 };
double messungen[] = {    0,    0,    0,    0,    0,    0,    0,    0,    0,     0,     0,     0,     0 };
    
double referenz[]  = { 0.56, 2.19, 4.86, 10.1, 15.2, 19.2, 26.3, 34.3, 43.5,  53.7,  76.9,   119,   212 };

Jetzt wollen wir uns die Werte mal ansehen. Dazu nutzen wir den View `DataPlot`. Er dient der Visualisierung von Dateneihen.

In [2]:
#include <algoviz/DataPlot.hpp>
AlgoViz::clear();
DataPlot plot = DataPlot(400,400);

// Plotte die beiden Messreihen.
plot.plot(laengen,messungen,13,"red");   // Die roten Punkte sind ihre Messungen
plot.plot(laengen,referenz,13,"black");  // Die schwarzen die Referenzmessungen

Wenn Sie den Verlauf der Zeiten in Abhängigkeit von der Größe des Arrays betrachten, sollten sie in beiden Messreihen relativ gut die Parabel erkennen, die die in der Analyse festgestellt quadratische Laufzeit $\mathcal{O}(n^2)$ bestätigt. Dabei können beide Messreihen, abhängig von der
Leistungsfähigkeit ihres Computers durch aus gegeneinander verschoben sein. Diese Verschiebung entspricht den unterschiedlichen Konstanten, die wir durch die Einführung der [asymptotischen Laufzeiten](/usr-redirect/algoviz/lessons/04_Sortieren/03_AsymptotischeLaufzeiten.ipynb) in den Griff bekommen wollten.

<div class="followup">
    <h3>Wo es weiter geht</h3>
    <div>
        Außer <b>SelectionSort</b> gibt es noche eine ganze Reihe anderer Verfahren, die auf ähnlichen
        Prinzipien beruhen. Sie sind Thema der Lesson <a class="followup" href="/user-redirect/algoviz/lessons/04_Sortieren/05_WeitereVerfahren.ipynb">"Weitere Sortierverfahren"</a>.       
    </div>
    <div>
    <div>
        Wer es eilig hat kann aber auch schon mal einen Blick auf <a class="followup" href="/user-redirect/algoviz/lessons/04_Sortieren/06_Heapsort.ipynb">HeapSort</a> werfen.
    </div>        
    </div>
</div>    