# Die Implementierung von MergeSort

<div class="prereq">
    <h3>Was man wissen sollte</h3>
    <div>
        Wir werden <a class="prereq" href="/user-redirect/algoviz/lessons/06_ADT/01_Liste.ipynb">Listen</a> verwenden um
        Wir werden <a class="prereq" href="/user-redirect/algoviz/lessons/07_Rekursion/00_Mergesort.ipynb">MergeSort</a> zu implementieren.        
        </div>
</div>

<div class="slideshow 07_Rekursion/01_MergesortImplementierung/slides.json">MergeSort Implementierung</a>

Wir werden im folgenden MergeSort auf Listen implementieren. Dabei werden wir die Listen dynamisch anlegen und somit Zeiger verwenden.

Wir beginnen damit die benötigten Bibliotheken einzubinden.

In [1]:
#include <list>
#include <iostream>
using namespace std;

Außerdem sind Hilfsoperationen zum zufälligen Befüllen und ausgeben einer Liste sinnvoll. Beide haben wir schon in diversen Varianten gesehen.

In [2]:
void fuelleListe(list<int> *liste, int n) {
    liste->clear();
    srand(time(nullptr));
    for ( int zaehler = 0; zaehler < n; zaehler++ ) {
        liste->push_back(rand() % 100);
    }
}

In [3]:
void printListe(list<int> *liste) {
    for ( int wert : *liste ) {
        cout << wert << " ";
    }
    cout << endl;
}

Jetzt probieren wir das mal aus. Dazu legen wir eine Liste an, befüllen sie und geben sie aus.

In [4]:
list<int> *liste = new list<int>();
fuelleListe(liste,20);
printListe(liste);

91 48 41 84 42 59 64 33 30 11 9 45 29 84 74 53 87 64 65 18 


Ok. Wenden wir uns nun den einzelnen algorithmischen Schritten zu. 

Als erstes teilen wir eine gegebene Liste auf. Dazu erhalten wir drei Zeiger auf Listen als Parameter. Der erste, `liste`, ist die Liste, die wir aufteilen. `teil1`und `teil2` sind die Listen, die befüllt werden. Beide werden anfänglich geleert!

In [5]:
void split(list<int> *liste, list<int> *teil1, list<int> *teil2) {
    int wert;
    
    // Leere die beiden Teile
    teil1->clear();
    teil2->clear();
    
    while ( !liste->empty() ) {
        // Hole das erste Element aus liste und füge es teil1 hinzu
        teil1->push_back(liste->front());
        liste->pop_front();
        
        // Wenn noch ein Element drin ist, hole es raus und füge es teil2 hinzu
        if ( !liste->empty() ) {
            teil2->push_back(liste->front());
            liste->pop_front();
        }
    }
}

Der nächste Punkt ist das Mischen der beiden sortierten Teile. Diese werden als die ersten beiden Parameter übergeben. Die Liste in die "gemerged" wird ist der dritte Parameter. Sie wird auch anfänglich geleert.

In [6]:
void merge(list<int> *teil1, list<int> *teil2, list<int> *liste) {
    
    liste->clear();
    
    while ( ( !teil1->empty() ) && ( !teil2->empty() ) ) {
        if ( teil1->front() <= teil2->front() ) {
            liste->push_back(teil1->front());
            teil1->pop_front();
        } else {
            liste->push_back(teil2->front());
            teil2->pop_front();            
        }
    }
    
    while ( !teil1->empty() ) {
        liste->push_back(teil1->front());
        teil1->pop_front();
    }
    
    while ( !teil2->empty() ) {
        liste->push_back(teil2->front());
        teil2->pop_front();
    }    
}

Jetzt können wir den eigentlichen Algorithmus implementieren. Dabei weichen wir beim Basisfall etwas von dem vorgestellten ab. Statt dass wir bereits bei zwei Elementen die Rekursion beenden, gehen wir noch einen Schritt weiter und beenden die Rekursion erst, wenn nur noch ein Element in der Liste ist.

In [7]:
void mergeSort(list<int> *liste) {
    
    // Wenn NICHT der Basisfall eintritt, 
    // führe die Rekursion aus.
    if ( liste->size() > 1 ) {

        list<int> *teil1 = new list<int>();
        list<int> *teil2 = new list<int>();
        
        split(liste,teil1,teil2);
        mergeSort(teil1);
        mergeSort(teil2);
        merge(teil1,teil2,liste);
        
        delete teil1;
        delete teil2;        
    }
    
}

Jetzt können wir tatsächlich mal sortieren.

In [13]:
fuelleListe(liste,20);
mergeSort(liste);
printListe(liste);

13 13 15 22 23 30 31 40 44 49 57 60 65 67 68 72 78 81 81 89 


## Ein paar Messungen

Im Folgenden werden wir mal ein paar Messungen durchführen, um die Laufzeit zu beurteilen. Dazu gehen wir genauso vor, wie bei den Messungen zu [HeapSort](/user-redirect/algoviz/lessons/04_Sortieren/07_HeapSortImplementierung.ipynb).

In [15]:
const int len = 9000;
int feld[len];

In [16]:
%%timeit
fuelleListe(liste,len);
mergeSort(liste);

39.7 ms +- 184 us per loop (mean +- std. dev. of 7 runs 10 loops each)


<div class="task">
    <h3>Aufgabe</h3>
    <div>
        Führen Sie die Zeitmessung für die in dem Array <tt>laengen[]</tt> (siehe nächste Zelle)
        durch. Tragen Sie die Werte in Millisekunden (ms) in das Array <tt>messungen[]</tt> ein.
        Beachten Sie dabei die Reihenfolge und die Einheiten.
    </div>
    <div>
        In dem Array <tt>referenz[]</tt> ist bereits eine Reihe von Messungen für MergeSort gegeben.
        In <tt>heapsort[]</tt> und <tt>selectionSort[]</tt> sind die Referenzmessungen für die
        entsprechenden Algorithmen enthalten.
    </div>
</div>

In [18]:
double laengen[]   = { 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 12000, 15000, 20000 };
double messungen[] = {    0,    0,    0,    0,    0,    0,    0,    0,    0,     0,     0,     0,     0 };

double referenz[] = {  3.61, 7.56, 12.4, 16.6, 21.2,   26, 31.2, 35.9,   41,  45.7,  55.9,  70.4,   95.3 };
double heapsort[]  = { 0.08, 0.21, 0.34, 0.469, 0.60, 0.74,  0.87, 1.01,  1.14,  1.29, 1.55,  1.95,  2.63 };    
double selectionSort[]  = { 0.56, 2.19, 4.86, 10.1, 15.2, 19.2, 26.3, 34.3, 43.5,  53.7,  76.9,   119,   212 };

In [36]:
#include <algoviz/DataPlot.hpp>
AlgoViz::clear();
DataPlot plot = DataPlot(400,400);

// Plotte die beiden Messreihen.
plot.plot(laengen,messungen,13,"red");   // Die roten Punkte sind ihre Messungen
plot.plot(laengen,referenz,13,"blue");   // Die blauen die Referenzmessungen
plot.plot(laengen,heapsort,13,"green");   // Die blauen die Referenzmessungen
plot.plot(laengen,selectionSort,13,"black");  // Die schwarzen sind die SelectionSort Messungen

Bei den Messung sollte deutlich werden, dass MergeSort deutlich langsamer ist als HeapSort. Dies liegt im Wesentlichen an der Verwendung von Listen. Aber es sollte auch deutlich werden, dass der Anstieg für MergeSort deutlich flacher ist als der von SelectionSort.

<div class="followup">
    <h3>Wo es weiter geht</h3>
        <div>
            Als nächstes
            <a class="followup" href="/user-redirect/algoviz/lessons/07_Rekursion/02_MergesortLaufzeit.ipynb">analysieren wir die Laufzeit von MergeSort</a>.
    </div>
</div>    