# Sortierverfahren

## Bubblesort am Beispiel
![](_images/Bubblesort1.svg)

## Bubblesort für n=5
![](_images/Bubblesort2.svg)

## Allgemeines Schema für Bubblesort:
![](_images/Bubblesort3.svg)

## Korrektheitsbeweis und Laufzeit für Bubblesort:
![](_images/Bubblesort4.svg)


---

__Beobachtung:__ Nach der $1$. Phase von $(n−1)$ kaskadierten Vergleichs- und
Tauschoperationen befindet sich das größte Element auf der Feldposition $(n − 1)$.

---

__Allgemeine Invariante:__ Nach der $i$-ten Phase von $(n − i)$ kaskadierten Vergleichs-
und Tauschoperationen befindet sich das $i$-t größte Element auf Feldposition $(n − i)$.

---

## Laufzeit von Bubblesort:

Sei $T(n)$ die Zahl der Vergleichsoperationen beim Sortieren von $n$ Elementen

$$
\begin{array}{rcccccccccccccc}
T(n) &=& (n\!-\!1) &+& (n\!-\!2) &+& (n\!-\!3) &+& \ldots &+& 3 &+& 2 &+& 1 \\[4mm]
2\cdot T(n) &=& (n\!-\!1) &\!+\!& (n\!-\!2) &+& (n\!-\!3) &+& \ldots &+& 3 &+& 2 &+& 1 \\[2mm]
&+& 1 &+& 2 &+& 3 &+& \ldots &+& (n\!-\!3) &+& (n\!-\!2) &+& (n\!-\!1) \\
\end{array}
$$

$$
T(n) = \frac{n\cdot(n-1)}{2} \approx c\cdot n^2
$$

$$
T(2n) \approx c\cdot (2n)^2 = c\cdot 4 n^2 \approx 4\cdot T(n)
$$

In [1]:
import random,time

# Wir messen die Laufzeit von Bubblesort für verschiedene Problemgrößen
n = 1000
while n <= 16000:
    a = []
    for i in range(0,n):
        x = random.randint(0,1000000)
        a.append(x)

    # print(a)

    # Wir starten die Stoppuhr zur Laufzeitmessung
    t1 = time.time()

    # Bubblesort arbeitet in n-1 Phasen. Die i-te Phase besteht aus n-i aufeinanderfolgenden
    # Elementvergleichen der Form a[j] <-> a[j+1], die eine Vertauschung durchführen, wenn
    # a[j] > a[j+1] ist.
    # Die Korrektheit der Sortierung ergibt sich induktiv aus folgender Invariante:
    # Nach der i-ten Phase sind die i größten Feldelemente ans Ende des Feldes gewandert
    # und befinden sich an ihrer korrekten Position.

    for i in range(1,n): # i steht für den Phasenzähler
        # Wir führen eine Kaskade von Vergleichen benachbarter Elemente durch.
        # Man beachte, dass in der i-ten Phase nur n-i Vergleiche nötig sind.
        for j in range(0,n-i): # j steht für den Vergleichszähler
            if a[j] > a[j+1]:
                # Tausch der Werte zwischen den Variablen a[j] und a[j+1]
                hilf = a[j]
                a[j] = a[j+1]
                a[j+1] = hilf

    # Die theoretische Gesamtlaufzeit können wir ermitteln, indem wir die Zahl
    # der Vergleichsoperationen zählen: n-1 in Phase 1, n-2 in Phase 2, ...,
    # n-i in Phase i, ... 1 in Phase n-1
    # Insgesamt: 1+2+3+...+n-1 = n*(n-1)/2 nach Gauss

    # Wieviel Zeit ist seit Beginn der Laufzeitmessung vergangen?
    t2 = time.time()

    # Ein Selbsttest, um zu bestätigen, dass wir korrekt sortiert haben.
    fehler = False
    for j in range(0,n-1):
        # Vergleich aufeinanderfolgender Element, um gegebenenfalls eine
        # Fehlstellung zu entdecken
        if a[j] > a[j+1]:
            fehler = True
            break

    if fehler:
        print("Sortierung falsch")
    else:
        print("Sortierung korrekt")
    # print(a)

    # Ausgabe der Laufzeit für die jeweilige Problemgröße
    print("T(", n, ") = ", t2 - t1)

    # Verdopplung der Problemgröße sollte zu einer Vervierfachung der Laufzeit führen,
    # denn T(n) = c*n^2 => T(2*n)=4*T(n)
    n *= 2


Sortierung korrekt
T( 1000 ) =  0.12259221076965332
Sortierung korrekt
T( 2000 ) =  0.46565985679626465
Sortierung korrekt
T( 4000 ) =  1.8948450088500977
Sortierung korrekt
T( 8000 ) =  7.15501594543457
Sortierung korrekt
T( 16000 ) =  28.994818925857544


## Sortieren durch Maximumssuche

In [2]:
import random
import time

# Anlegen einer leeren Liste / eines leeren Feldes
L = []
for i in range(16000):
    x = random.randint(0,1000000)
    # Wir fügen eine Zufallszahl an das Ende der Liste an
    L.append(x)

#print(L)

# Wir wollen die Laufzeit für das Sortieren experimentell ermitteln,
# indem wir die Zeit stoppen.
t1 = time.time()

# Wir sortieren die Elemente unseres Feldes, indem wir wiederholt die Position imax
# eines größten Elementes im Feld suchen und dieses ans Feldende tauschen: L[imax] <-> L[n-1]
# Nach diesem Tausch tun wir so, als ob die Feldlänge n um eins abgenommen hat.
for n in range(len(L),1,-1):
    # Wir starten mit der Annahme, dass das Element an Indexposition 0 ein größtes Element ist.
    imax = 0
    # Wir durchlaufen die Feldpositionen bis zum virtuellen Feldende. Wir lassen also die
    # Elemente außer Acht, die zuvor ans Feldende getauscht wurden und somit in der Sortierung
    # schon an ihrer richtigen Position stehen.

    for i in range(1,n):
        if L[i] > L[imax]:
            # Wir haben ein Element gefunden, das größer als das bisherige ist.
            imax = i

    # Wir vollziehen den Tausch unter Verwendung der Hilfsvariable hilf.
    hilf = L[imax]
    L[imax] = L[n-1]
    L[n-1] = hilf

# Wir stoppen die Zeit.
t2 = time.time()

print('Laufzeit = ',t2-t1)

# Wir führen einen Selbsttest durch, um entscheiden zu können, ob ein Fehler
# in der Sortierung vorliegt.
for i in range(len(L)-1):
    if L[i] > L[i+1]:
        print('Die Sortierung ist fehlerhaft.')
        break
else:
    print('Die Sortierung ist fehlerfrei.')


Laufzeit =  11.940583944320679
Die Sortierung ist fehlerfrei.
