# Bubblesort

Bubblesort ist ein sehr berühmter Sortieralgorithmus. Das Prinzip ist recht einfach: Hohe Werte steigen schneller auf als weniger hohe Werte, analog der Luftblasen ("bubbles") in einem Glas Mineralwasser, wo grössere Luftblasen ebenfalls schneller aufsteigen.

## Algorithmus

Schauen Sie sich die folgende Animation von [visualgo.net](https://visualgo.net/en/sorting?slide=7) an. 

*Um den Videoclip sehen zu können, müssen Sie allenfalls die folgende Zelle ausführen.*

In [8]:
# Führen Sie diese Zelle aus, um den Videoclip sehen zu können.

import IPython

IPython.display.IFrame(src="https://www.youtube.com/embed/mcFOilpoGDA?rel=0&amp;controls=0&amp;showinfo=0", width=560, height=315)

**Aufgabe**

Schreiben Sie den Bubblesort-Algorithmus in eigenen Worten auf.

In [9]:
# Machen Sie aus dieser Zelle eine Markdownzelle und 
# beschreiben Sie den Bubblesort-Algorithmus in eigenen Worten.

### Implementation

Nun möchten Sie Bubblesort implementieren.

#### Stellentausch

Da bei Bubblesort sehr oft Elemente einer Liste getauscht werden, müssen Sie sich vorher Gedanken dazu machen, wie Sie die Plätze tauschen können.

**Aufgabe**

Implementieren Sie einen "Platztausch", oft auch "Swap" genannt.

<details>
    <summary>
        Hinweis 1
    </summary>

Überlegen Sie sich, wie Sie zwei Variablen vertauschen können, implementieren Sie den Variabeltausch und machen Sie anschliessend dasselbe für Listenelemente anstelle von Variablen.
    
</details>

<details>
    <summary>
        Hinweis 2 (nur lesen, falls Sie wirklich nicht weiterkommen)
    </summary>

Sie haben jederzeit die Möglichkeit, neue Variablen zu erstellen.
    
Zum Tauschen benötigen Sie eine Hilfsvariable.
    
</details>

## Optimierung 
Eine Liste aus einer überschaubaren Anzahl von Elementen würde sich problemlos von Hand sortieren lassen und wenn nur wenige Elemente sortiert werden sollen, macht es noch keinen Unterschied, ob Vergleiche mehrfach ausgeführt oder eingespart werden, da Ihr Computer so schnell ist, dass Sie kaum einen Unterschied erkennen werden. Bei grösseren Listen kann es aber bereits einen Unterschied machen und gerade das Sortieren ist eine Aufgabe, die immer wieder zur Anwendung kommt. Da ist es unabdingbar, effiziente Algorithmen zur Hand zu haben.

In der Regel werden Algorithmen aber nicht auf überschaubare Datenmengen angewandt, sondern auf Unmengen von Daten. Da ist durchaus ein Unterschied erkennbar. Die Investition in einen effizienten Algorithmus lohnt sich durchaus und ist überdies auch interessanter als das blosse Programmierhandwerk, denn damit können Sie einen wirklich wichtigen Unterschied machen.

Sie werden nun am Beispiel des Bubblesort-Algorithmus sehen, wie sich auch ein nicht gerade für seine Effizienz bekannter Algorithmus noch optimieren lässt.

### Brute Force

Beim Entwickeln lohnt es sich jeweils, sich zu Beginn eine ganz einfache Lösung zu überlegen und diese zu implementieren. Dabei spricht man von "Brute Force", "roher Gewalt". Das ist nicht so böse, wie es scheinen mag, aber vielleicht ist es eine Anspielung darauf, dass diese ersten Lösungen etwas unschön und unnötig kostspielig sind: Ohne viel zu überlegen wird einfach mal drauf los gearbeitet. Eine Brute Force Lösung zeigt auf, dass das Problem in seinen Grundzügen verstanden ist und sich lösen lässt. Sie bildet eine Basis, auf der aufgebaut werden kann.

Im Falle von Bubblesort besteht die Brute Force Lösung darin, für jedes Listenelement die ganze Liste durchzugehen.

**Aufgabe**

Implementieren Sie Bubblesort in einer Funktion `bubblesort0()`. Sie soll die Anzahl Vergleiche zurückgeben, die ausgeführt werden.

In [10]:
# Ihr Code...

In [11]:
# Lösung:
import random

liste = [x for x in range(1000)]
random.shuffle(liste)
print(liste)

# Bubblesort
def bubblesort0(liste):
    vergleiche = 0
    for j in range(0,len(liste)-1):
        for i in range(1,len(liste)):
            vergleiche +=1
            if liste[i] < liste[i-1]:
                temp = liste[i-1]
                liste[i-1] = liste[i]
                liste[i] = temp
            
    print("Anzahl Vergleiche:", vergleiche)
    print(liste)
    return vergleiche


bubblesort0(liste)

[609, 701, 764, 75, 306, 485, 850, 925, 532, 274, 570, 674, 971, 375, 305, 377, 422, 660, 176, 495, 388, 68, 727, 9, 197, 941, 895, 222, 464, 997, 722, 42, 457, 113, 949, 170, 460, 706, 697, 405, 515, 767, 115, 922, 592, 166, 826, 758, 762, 190, 417, 156, 218, 343, 740, 621, 297, 526, 266, 440, 803, 953, 672, 788, 275, 261, 618, 180, 775, 688, 638, 10, 249, 317, 310, 726, 622, 303, 893, 980, 886, 158, 979, 668, 408, 83, 583, 488, 214, 111, 965, 81, 96, 302, 514, 712, 403, 47, 538, 248, 847, 235, 711, 861, 591, 992, 779, 545, 655, 665, 748, 411, 339, 809, 165, 590, 675, 135, 970, 921, 387, 505, 935, 557, 127, 802, 471, 854, 149, 512, 247, 202, 246, 133, 342, 196, 444, 543, 909, 374, 961, 117, 258, 130, 707, 978, 942, 41, 200, 679, 143, 340, 147, 484, 692, 31, 367, 498, 689, 552, 264, 880, 686, 518, 902, 107, 640, 933, 912, 737, 240, 281, 139, 439, 828, 525, 295, 617, 928, 37, 36, 220, 578, 818, 841, 798, 352, 287, 418, 461, 151, 694, 265, 657, 511, 282, 188, 19, 549, 386, 671, 610, 848,

998001

### Erste Optimierung

Der Name *Bubblesort* kommt daher, dass grössere Luftblasen im Wasser schneller aufsteigen als kleine.

Eine Eigenschaft des Bubblesort-Algorithmus ist, dass bei jedem Durchgang das grösste Element am Ende des noch unsortierten Teils zu liegen kommt. Das grösste Element des vorherigen Durchgangs hat seinen Platz jeweils gefunden.

Nach dem 1. Durchgang ist das erste Element somit einsortiert und muss beim zweiten Durchgang nicht mehr angeschaut werden.

Optimieren Sie Ihre Lösung entsprechend in einer neuen Funktion `bubblesort1()`. Sie soll wiederum die Anzahl Vergleiche zurückgeben, die ausgeführt werden.

In [12]:
# Ihr Code...

In [13]:
# Lösung:
import random

liste = [x for x in range(1000)]
random.shuffle(liste)
#print(liste)

# Bubblesort
def bubblesort1(liste):
    vergleiche = 0
    for j in range(0,len(liste)-1):
        # print("Runde", j)
        for i in range(1,len(liste)-j):
            vergleiche +=1
            if liste[i] < liste[i-1]:
                temp = liste[i-1]
                liste[i-1] = liste[i]
                liste[i] = temp
    print("Anzahl Vergleiche:", vergleiche)
    return vergleiche
    #print(liste)
    
bubblesort1(liste)

Anzahl Vergleiche: 499500


499500

### Zweite Optimierung

Es ist noch eine weitere Optimierung möglich, denn aufgrund des häufigen Vertauschens zweier benachbarter Elemente kann es durchaus vorkommen, dass die Liste bereits vor dem letzten Durchgang sortiert ist. Vor allem wenn eine Liste fast sortiert ist

Überlegen Sie sich, wie Sie dies überprüfen könnten und setzten Sie diese Optimierung in einer neuen Funktion namens `bubblesort2()` um, welche die Anzahl Vergleiche zurückgibt, die ausgeführt werden.

In [14]:
# Ihr Code...

In [15]:
# Lösung:
import random

liste = [x for x in range(1000)]
random.shuffle(liste)
#print(liste)

# Bubblesort
def bubblesort2(liste):
    vergleiche = 0
    for j in range(0,len(liste)-1):
        # print("Runde", j)
        swaps = 0
        for i in range(1,len(liste)-j):
            vergleiche += 1
            if liste[i] < liste[i-1]:
                swaps +=1
                temp = liste[i-1]
                liste[i-1] = liste[i]
                liste[i] = temp
        if swaps == 0:
            print("--> Fertig nach Runde", j)
            break
    #print(liste)

    print("Anzahl Vergleiche:", vergleiche)
    return vergleiche
    #print(liste)

bubblesort2(liste)

--> Fertig nach Runde 957
Anzahl Vergleiche: 498639


498639

## Vergleiche

Wenn Algorithmen bezüglich Effizienz untersucht werden, wird verglichen, wie sie mit verschiedenen Eingabekonstellationen zurechtkommen. Dazu dienen in der Regel extreme und "normale" Ausgangslagen.

Als Extreme werden für Sortieralgorithmen sortierte und umgekehrt sortierte Listen (beste und schlechteste Ausgangslage) verwendet, sowie eine zufällige Liste als normale Ausgangslage.

**Aufgabe**

Erstellen Sie drei Funktionen `sortierte_liste`, `umgekehrt_sortierte_liste`, `zufaellige_liste`, die jeweils die Anzahl Elemente entgegennehmen und die entsprechende Liste aus aufeinanderfolgenden Ganzzahlen ab Null enthalten.

<details>
    <summary>
        Hinweis
    </summary>

Mit der Funktion `random.shuffle()` lassen sich Elemente einer Liste mischen.
    
</details>

In [16]:
# Ihr Code...

In [17]:
# Lösung:
import random

def sortierte_liste(anzahl_elemente):
    return [x for x in range(anzahl_elemente)]

def umgekehrt_sortierte_liste(anzahl_elemente):
    return [anzahl_elemente - x for x in range(anzahl_elemente)]

def normale_liste(anzahl_elemente):
    liste = [x for x in range(anzahl_elemente)]
    random.shuffle(liste) 
    return liste

print("Sortierte Liste:", sortierte_liste(10))
print("Umgekehrt sortierte Liste:", umgekehrt_sortierte_liste(10))
print("Normale Liste:", normale_liste(10))

Sortierte Liste: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Umgekehrt sortierte Liste: [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
Normale Liste: [2, 0, 1, 9, 3, 6, 8, 7, 5, 4]


Nun können Sie Ihre Implementationen vergleichen.

**Aufgabe**

Wenden Sie Ihre drei Algorithmen jeweils auf die drei Ausgangslagen an und erstellen Sie eine Tabelle, die den Vergleich sichtbar macht.

In [18]:
# Ihr Code...

In [19]:
# Lösung:
anzahl_elemente = 1000

ausgabe = [["Funktion", "sortiert", "zufaellig", "umgekehrt sortiert"],
           ["bubblesort0", bubblesort0(sortierte_liste(anzahl_elemente)), bubblesort0(normale_liste(anzahl_elemente)), bubblesort0(umgekehrt_sortierte_liste(anzahl_elemente))],
           ["bubblesort1", bubblesort1(sortierte_liste(anzahl_elemente)), bubblesort1(normale_liste(anzahl_elemente)), bubblesort1(umgekehrt_sortierte_liste(anzahl_elemente))],
           ["bubblesort2", bubblesort2(sortierte_liste(anzahl_elemente)), bubblesort2(normale_liste(anzahl_elemente)), bubblesort2(umgekehrt_sortierte_liste(anzahl_elemente))],
          ]

print("VERGLEICH")
for i in range(len(ausgabe)):
    print(ausgabe[i])

Anzahl Vergleiche: 998001
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216

Anzahl Vergleiche: 998001
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 2

# Hat es sich gelohnt?

Schauen Sie sich den folgenden Clip an.  

In [20]:
# Führen Sie diese Zelle aus, um den Videoclip sehen zu können.

import IPython

IPython.display.IFrame(src="https://www.youtube.com/embed/koMpGeZpu4Q", width=560, height=315)

Wie Sie sehen, haben Sie mit diesen Optimierungen die Hälfte der Vergleiche herausgeholt und sparen in guten Fällen sogar noch etwas mehr ein. Bei beinahe sortierten Listen gewinnen Sie am meisten. In diesem Fall kann es Ihr Bubblesort durchaus mit anderen Sortieralgorithmen aufnehmen, aber in den meisten Fällen ist er nicht der Algorithmus der Wahl, denn es gibt es noch einige effizientere Sortieralgorithmen. Positiv am Bubblesort-Algorithmus ist, dass praktisch kein zusätzlicher Speicherbedarf anfällt. Es gibt andere Sortieralgorithmen, die zwar sehr schnell sind, aber viel Speicher brauchen.

Bei Interesse können Sie [hier](https://www.toptal.com/developers/sorting-algorithms) einen Vergleich finden.