# 1 Einführung und einfache Algorithmen
Algorithmen sind etwas, das wir ständig verwenden. Ob im täglichen Leben oder in speziellen Situationen wie z.B. beim Lösen konkreter Probleme.

Simple Beispiele für Algorithmen sind 
* Wie man zwei Zahlen miteinander multipliziert
* Wie man eine Tasse Tee trinkt
* wie Sie sich in unserem Online-Raum (BigBlueButton in Moodle) einfinden
* Wie Sie Ihr Studium beenden können/werden

Was alle Algorithmen gemeinsam haben, sind folgende Eigenschaften:
* Eine konkrete Abfolge von endlich vielen Schritten
* Eine Definition über mehr oder weniger formale Beschreibung, z.B. Pseudocode oder Flowcharts
* Eigenschaften, die beim Einteilen in Kategorien helfen
* Z.B. einen bestimmten Grad an Komplexität

Im Folgenden werden wir uns ein paar sehr einfache Beispiele ansehen (und gleichzeitig noch ein bisschen Python wiederholen). Sie sollen dabei ein Gefühl dafür bekommen, was mit dem Begriff "Algorithmus" gemeint ist und wie er mit einem Computerprogramm zusammenhängt.



## 1.1 Einfaches Beispiel: Addieren aller natürlichen Zahlen bis zu einer bestimmten Zahl _N_
Zum Addieren aller natürlichen Zahlen bis zu einer bestimmten Zahl _N_ kann man eine vorberechnete Formel verwenden. Das ist zwar auch ein Algorithmus (multipliziere _N_ mit ihrem Nachfolger _N+1_ und dividiere durch 2), wir wollen das hier allerdings nicht tun. Wir werden stattdessen einen iterativen Algorithmus verwenden, den wir zuerst mit einer FOR und dann nocheinmal, aber mit einer WHILE Schleife, umsetzen werden.

In [None]:
# Addiere alle natürlichen Zahlen bis zu N

# Importiere die Package NumPy
import numpy as np

# setze die Zahl fest, bis zu der summiert werden soll
N = 10

# initialisiere den Wert der Summe
thesum_1 = 0

# starte for-Loop von 1 bis N. Achtung: In Python endet eine range 
# bereits bei der Zahl vor dem zweiten Argument. Daher müssen wir N+1 schreiben
for summand in np.arange(1, N+1, 1):
    
    # Ausgabe zur Illustration
    print("Addiere ", summand)
    
    # Addiere den aktuellen Summanden
    thesum_1 += summand   # das ist kurz-Schreibweise für thesum_1 = thesum_1 + summand 
    

# Ausgabe des Resultats mit Loop 1
print("Resultat mit for-Loop: ", thesum_1, "\n")


# Initialisiere den Wert der zweiten Summe
thesum_2 = 0

# Setze Summand auf den Anfangswert
summand = 1

# Starte den while-Loop
while summand <= 10:
    
    # Ausgabe zur Illustration
    print("Addiere ", summand)
    
    # Addiere den aktuellen Summanden
    thesum_2 += summand
    
    # Erhöhe den Wert des Summanden um 1
    summand += 1
    

# Ausgabe des Resultats mit Loop 2
print("Resultat mit while-Loop: ", thesum_2, "\n")

    

Schreiben wir das nun nochmals als Algorithmus auf, und zwar anhand der Variante für den FOR-Loop:

__Ziel__: Finden der Summe aller natürlichen Zahlen bis zu einer bestimmten Zahl _N_

__Input__: Diejenige Zahl _N_, bis zu der man die natürlichen Zahlen aufaddieren möchte

__Output__: Die Summe aller natürlichen Zahlen bis _N_

__Implementierung__: Iterativ

__Variablen und Startwerte__: _Summe_ = 0, _Summand_ = 1

__Iterationsvorschrift__: Nimm den nächsten Wert von _Summand_ und addiere diesen zu _Summe_ 

__Abbruchbedingung__: Der Wert von _Summand_ erreicht _N_

__Resultat__: Der Output ist der Wert von _Summe_ nach Eintreten der Abbruchbedingung

Das erscheint vielleicht etwas übertrieben, aber im Wesentlichen ist diese Beschreibung nötig, um zu wissen, was man bzw. der Algorithmus tun soll. 

Diese Notwendigkeit wird vor allem dann deutlich, wenn man versucht, selbst ein Computerprogramm zu schreiben, das die entsprechende Aufgabe erledigen soll. Im Prinzip musste ich diese Dinge bereits wissen oder mir denken, damit ich das obige Programm schreiben konnte.

Wenn es Ihnen also einmal schwer fällt, ein Python- (oder sonstiges Computer-)Programm für einen bestimmten Zweck zu schreiben, dann machen Sie sich bewusst, was den gerade angegebenen Schritten bzw. der Information für Ihr konkretes Problem entspricht.

### 1.2 Einfaches Beispiel: Berechnen der ersten _N_ Primzahlen
Dieses Problem war bereits am Ende von Einheit 0 unser Thema. Hier wollen wir es nochmal aufrollen, inklusive einer etwas genaueren Beschreibung als Algorithmus. Außerdem wollen wir uns anhand dieses Beispiels bereits einen Aspekt ansehen, der für computergestützte Algorithmen wichtig sein kann: Die Optimierung des Algorithmus.

Wir werden daher zunächst eine Version beschreiben und ausprobieren, welche die Aufgabe löst, aber nicht unbedingt optimiert ist. Danach werden wir uns ansehen, was man tun kann, um den Algorithmus und damit auch die entprechende Problemlösung besser und schneller zu machen.

Die Aufgabenstellung lautet: Berechne die ersten 1000 Primzahlen (allgemein: berechne die ersten _N_ Primzahlen).

Dazu muss man der Reihe nach alle natürlichen Zahlen untersuchen und feststellen, ob sie durch eine kleinere Zahl außer 1 teilbar sind.

Um dies zu berechnen, werden wir zwei Loops brauchen: 
* Einen WHILE-Loop, mit dem wir eine natürliche Zahl nach der anderen untersuchen
* Einen FOR-Loop, mit dem wir für jede natürliche Zahl alle kleineren Zahlen als mögliche Teiler testen

Zahlen, die keine Teiler haben, kommen in die Primzahl-Liste. Hier ist also die direkte, einfache Version dieses Programms:

In [None]:
%%time    
# lasse einen Timer mitlaufen, umd einen Vergleichswert zu haben

# außerdem importieren wir noch eine time-Package, für die spätere Nutzung
import time

# definiere diese Ausführung als Funktion, um sie später besser nutzen zu können
def get_primes(upto_n):
    
    # speichere die Beginnzeit für später
    start_time = time.time()

    # erstelle eine leere Liste, in die die Primzahlen kommen sollen
    list_of_primes = []

    # definiere den ersten Kandidaten (wir fangen bei 2 an)
    candidate = 2

    # starte den while-Loop. Er läuft, bis die Länge der Primzahlliste N erreicht hat
    while len(list_of_primes) < upto_n:

        # setze den Status als Primzahl vorerst auf True. 
        # Wenn wir einen Teiler finden, setzen wir ihn auf False
        is_prime = True

        # starte den for-Loop. Er läuft von 2 bis zum momentanen Kandidaten minus 1
        # denn eine Primzahl ist nur durch 1 und sich selbst teilbar
        for a_number in range(2, candidate, 1):

            # check, ob der momentane Kandidat durch die Versuchszahl teilbar ist
            if (candidate % a_number == 0):
                
                # ja, ist teilbar, setze den Status auf False
                is_prime = False

        # wenn alle Zahlen kleiner der Kandidatenzahl durchprobiert sind, checken wir den Status
        if is_prime:
            
            # ja, ist noch auf True. Hänge den Kandidaten an die Primzahlliste an
            list_of_primes.append(candidate)

        # gehe zur nächsten natürlichen Zahl weiter
        candidate += 1 
    
    # Bestimme die Zeit, zu der die Berechnung zu Ende war
    end_time = time.time()
    
    # Berechne die Dauer der Primzahl-Berechnung
    run_time = end_time - start_time

    # Zurückgeben der Liste
    return list_of_primes, run_time


# Rufe die Funktion auf
result_list, the_time = get_primes(1000)

# gib die Liste aus
print(result_list)

# und checke die Länge der Liste
print("Anzahl der Primzahlen in dieser Liste: ", len(result_list))

# gib auch die Runtime aus
print("Runtime der Funktion: ", the_time)

Nach dieser ersten Variante, die zwar den Zweck erfüllt, aber verbesserungsfähig ist, kommen wir nun zu ein paar Schritten der Optimierung.

Die Grundidee dabei ist, anstatt aller Zahlen, die kleiner als der momentane Primzahlkandidat _n_ sind, als mögliche Teiler anzusehen, eine Liste mit Primzahlen nach und nach zu erstellen, und diese auch für die Berechnung weiterer Primzahlen zu benutzen. Dabei kann man folgende Punkte beachten und verwenden:
* Alle Primzahlen bis auf die erste, 2, sind ungerade.
* Als mögliche Teiler weiterer Primzahlkandidaten muss man nur bisherige Primzahlen in Betracht ziehen, denn wenn ein Kandidat durch eine kleinere Zahl teilbar ist, dann ist er auch durch alle Primfaktoren jener kleineren Zahl teilbar, und diese Faktoren kommen beim Check vorher dran. 
* Für einen bestimmten Kandidaten _n_ braucht man nur mögliche Teiler bis zur Quadradwurzel aus _n_ zu testen, denn es kann keinen größeren Teiler geben, ohne dass es auch einen kleineren Teiler gibt, den man dann bereits gefunden haben müsste.

In [None]:
%%time
# lasse einen Timer mitlaufen, umd einen Vergleichswert zu haben

# definiere diese Ausführung als Funktion, um sie später besser nutzen zu können
def get_primes_faster(upto_n):

    # speichere die Beginnzeit für später
    start_time = time.time()

    # starte mit der bereits mit 2 vorbefüllten Liste
    list_of_primes = [2]

    # definiere die Länge der Liste als Variable
    total_number = len(list_of_primes)

    # setze den ersten Kandidaten auf 3
    candidate = 3

    # starte den while-Loop bis N
    while total_number < upto_n:

        # setze den Prime-Status auf True
        is_prime = True

        # starte den for-Loop, diesmal nur über die bisher gefundenen Primzahlen als mögliche Teiler
        for a_prime in list_of_primes:

            # check, ob wir schon bei der Quadradwurzel aus der Kandidatenzahl angelangt sind
            if a_prime > np.sqrt(candidate):

                # wenn ja, brich den for-Loop ab
                break

            # check der Teilbarkeit durch den Test-Primzahl-Teiler
            if (candidate % a_prime == 0):

                # ja, ist teilbar, setze den Status auf False
                is_prime = False

                # und brich den for-Loop ab
                break

        # checke den Status
        if is_prime:

            # ist eine Primzahl, wird an die Liste angehängt
            list_of_primes.append(candidate)

        # erzeuge die neue Länge der Primzahlliste
        total_number = len(list_of_primes) 

        # erhöhe die Kandidaten-Zahl um 2 (nur ungerade Zahlen werden als Kandidaten zugelassen)
        candidate += 2

    # bestimme die End-Zeit der Berechnung
    end_time = time.time()
    
    # Berechne die Dauer
    run_time = end_time - start_time

    # Zurückgeben der Liste
    return list_of_primes, run_time


# Rufe die Funktion auf
result_list, the_time = get_primes_faster(1000)

# gib die Liste aus
print(result_list)

# und checke die Länge der Liste
print("Anzahl der Primzahlen in dieser Liste: ", len(result_list))     

# gib auch die Runtime aus
print("Runtime der Funktion: ", the_time)

Wie man anhand der Timings sehen kann, ist die zweite Variante wesentlich effizienter.

Der hier verwendete Zugang wird auch in der Praxis oft angewandt. Zunächst schreibt man ein Programm, von dem man einmal eine Antwort bekommt - egal wie langsam - , und danach versucht man, es zu optimieren. 


## 1.3 Zeit-Komplexität

Ein Aspekt, der hier interessant ist, bezieht sich auf die Zeit, die ein Algorithmus für die Ausführung seiner Aufgabe braucht. Normalerweise wird das als Funktion der relevanten Input-Variablen betrachtet. In unserem Fall wäre das z.B. für die Primzahlen die gewünschte Anzahl _N_ von Primzahlen. 

Der Begriff der Zeit-Komplexität selbst ist recht komplex. Z.B. hängt die Laufzeit eines Programms von der Hardware ab, von der Last, die bereits auf dieser Hardware läuft, von Details der Implementierung, diversen Faktoren in der Programmierung, etc. Wir können und werden das hier daher nicht im Detail diskutieren, sondern werden uns diesem Begriff einfach ganz intuitiv nähern, und zwar auf eine Art und Weise, die von solchen Details weitgehend unabhängig ist. 

Um das zu tun, werden wir die beiden Implementierungen von oben vergleichen, und zwar, was ihr Skalierungsverhalten mit _N_ betrifft. Damit ist folgendes gemeint: Wir werden beide Implementierungen für verschiedene _N_ laufen lassen, die gebrauchten Zeiten messen und diese als Funktion von _N_ erst einmal grafisch darstellen.

Beginnen wir mit der einfacheren aber langsameren der beiden Varianten:

In [None]:
%matplotlib inline

# importiere Matplotlib
import matplotlib.pyplot as plt


# Erzeuge eine Liste mit den gewünschten N Werten
# n_list_slower = np.arange(10, 500, 50)

# Eine umfangreichere Möglichkeit:
n_list_slower = np.append(np.arange(10, 100, 10), [200, 300, 500, 1000, 3000])

# Erzeuge leere Liste für die Timings
time_list_slower = []

# Loop über alle N in der Liste
for an_n in n_list_slower:
    
    # Rufe die Funktion auf und erhalte das Ergebnis samt Timing
    result_list, the_time = get_primes(an_n)
    
    # Schreibe das Timing in die Zeiten-Liste dazu
    time_list_slower.append(the_time)
    

# Grafische Darstellung der Ergebnisse
fig = plt.figure()

# plot-Befehl
plt.plot(n_list_slower, time_list_slower, "x-")

# Achsenbeschriftungen und Titel
plt.xlabel("N")
plt.ylabel("Zeit [s]")
plt.title("Skalierungsverhalten für Primzahlenberechnung")

# Skalierungen der Achsen von linear auf logarithmisch setzen
plt.xscale("log")  # auskommentieren, um eine lineare Darstellung in x zu erhalten
plt.yscale("log")  # auskommentieren, um eine lineare Darstellung in y zu erhalten

# Grafik anzeigen
plt.show()


Hier sieht man schon ganz gut, dass sich ein bestimmtes Verhalten abzeichnet. Je nach Skalierung der x- und y-Achse (log oder linear) kann man die Kurve betrachten und sich überlegen, um welche funktionelle Abhängigkeit es sich dabei handeln könnte.

Konkret sieht man bei einer log-log Darstellung (also x-Achse und y-Achse beide mit logarithmischer Skala) ein halbwegs lineares Verhalten. So etwas entspricht einem Polynomialen verhalten. Die größte Potenz im Polynom kann man im Prinzip sogar direkt aus dem Plot über die Steigung der Kurve (bzw. idealerweise der Geraden) bestimmen.

Wir werden uns jetzt der zweiten Implementierung zuwenden, dabei aber gleich auch ein paar solche Möglichkeiten als Vergleichskurven mit in den Plot einbauen.

In [None]:
# Erzeuge eine Liste mit den gewünschten N Werten
n_list = np.arange(10, 5000, 100)
# n_list = np.array([10, 100, 1000, 10000]) # Alternative für direkte Eingabe

# Eine Liste für den Skalierungsvergleich, mit N Sqrt(N)
comp_list = np.sqrt(n_list) * n_list / 1000000

# Eine Liste für den Skalierungsvergleich, mit N**2
comp_list_slow = n_list**2 / 400000

# Eine Liste für den Skalierungsvergleich, mit N**2
#comp_list_slow_1 = np.sqrt(n_list) * n_list / 4000    # Aktivieren, um den Vergleich mit dem anderen Scaling zu sehen

# Erzeuge leere Liste für die Timings
time_list = []

# Loop über alle N in der Liste
for an_n in n_list:
    
    # Rufe die Funktion auf und erhalte das Ergebnis samt Timing
    result_list, the_time = get_primes_faster(an_n)
    
    # Schreibe das Timing in die Zeiten-Liste dazu
    time_list.append(the_time)
    

# Grafische Darstellung der Ergebnisse
fig = plt.figure()

# Daten der schnelleren Variante
plt.plot(n_list, time_list, "g", label="Data")

# Vergleichs-Skalierung
plt.plot(n_list, comp_list, "r", label=r"$\mathcal{O}(N\sqrt{N})$")

# Daten der langsameren Variante
plt.plot(n_list_slower, time_list_slower, "b", label="Slower Data")

# Vergleichs-Skalierung
plt.plot(n_list, comp_list_slow, "r--", label=r"$\mathcal{O}(N^2)$")
# plt.plot(n_list, comp_list_slow_1, "r.", label=r"$\mathcal{O}(N\sqrt{N})$")  # Aktivieren, um den Vergleich mit dem anderen Scaling zu sehen

# Achsenbeschriftung und Titel
plt.xlabel("N")
plt.ylabel("Zeit [s]")
plt.title("Skalierungsverhalten für Primzahlenberechnung")

# Log-Skala für y und Platzierung der Legende
plt.yscale("log")
plt.legend(loc=4)

plt.show()

Was sich hier zeigt, sind folgende Punkte:

* Das Verhalten der Berechnung nach den beiden Implementationen des Algorithmus lässt sich gut grafisch darstellen
* Mit Vorüberlegungen bezüglich der zu erwartenden Skalierung kann man auch Vergleichskurven plotten
* Die erste, langsamere Implementierung beinhaltet zwei Loops, die beide im wesentlichen bis $N$ gehen. Die Berechnung skaliert daher von der Erwartung her wie $N^2$.
* Die zweite, effizientere Implementierung beinhaltet einen Loop bis $N$, der andere geht nur bis zur Quadratwurzel aus $N$, woher man sich die veränderte Skalierung überlegen kann.
* Wenn man versucht, die Skalierung der zweiten Variante über die Daten der ersten zu legen, hat man Schwierigkeiten, eine gute Übereinstimmung zu erreichen.

Skalierungen, wie wir sie hier gesehen haben, nennt man _polynomial_, d.h., wie ein Polynom (von grundsätzlich beliebigem Grad) in $N$. Andere Skalierungen, die interessant sind, sind z.B.:
* $1$ : Das bedeutet konstante Zeit als Funktion von $N$ (z.B. Berechnung von $(-1)^N$)
* $N$ : Das bedeutet lineare Abhängigkeit von $N$ (z.B. finden des Maximums eines unsortierten Arrays)
* $\log(N)$ : Das bedeutet logarithmische Abhängigkeit von $N$ (z.B. Binäre Suche - finden der Position eines bestimmten Werts in einem sortierten Array)
* $2^{poly(N)}$ : Das bedeutet exponentielle Abhängigkeit von $N$ (z.B. brute-force Analyse der Matrix-Ketten-Multiplikation)

Sie sollen sich nicht unbedingt die einzelnen Fälle merken, aber sehr wohl die verschiedenen Kategorien. Beachten Sie, dass ein und dasselbe Problem je nach Lösungsmethode in verschiedene Klassen gehören kann. Sie sollten in erster Linie wissen, dass man beim algorithmischen Lösen von Problemen in zeitliche Limits laufen kann. Das gilt übrigens auch für andere Faktoren wie z.B. Arbeitsspeicher (Platzkomplexität).

## 1.4 Übungsaufgabe: Implementieren Sie eine einfache Version des Newton-Raphson Verfahrens zum Finden einer Nullstelle einer Funktion
Zur Vorbereitung dieser Aufgabe finden Sie im Folgenden die nötigen Details der Netwon-Raphson-Methode.

Die Newton-Raphson-Methode (oder kurz das Newton-Verfahren) basiert darauf, dass man für eine gegebene Funktion eine Nullstelle in der Nähe eines Anfangswertes sucht, indem man am Anfangswert für $x$ die Tangente an die Kurve von $f(x)$ konstruiert und diese mit der $x$-Achse schneidet. Dieser Schnittpunkt wird zum nächsten Näherungswert für die Nullstelle. Dort konstruiert man wieder die Tangente an die Kurve, schneidet diese mit der $x$-Achse, und so weiter. Das macht man so lange, bis sich die Näherungswerte von einem Schritt zum nächsten nicht um mehr unterscheiden als eine vorgegebene Genauigkeit (am besten relativ).

Soweit, so gut. Konkret implementiert man das folgende iterativen Verfahren:
* Bestimmen Sie einen Anfangswert $x_0$. Dieser liegt idealerweise bereits in der Nähe der Lösung, die man sucht. Das muss zwar nicht zwingend der Fall sein, es ist aber möglich, dass das Verfahren für bestimmte Bereiche von Anfangswerten nicht konvergiert. Solche Probleme hängen von der untersuchten Funktion ab.
* Schreiben Sie die Funktion als $f(x)$ und deren erste Ableitung nach $x$ als $f'(x)$ explizit an. (Sollte das nicht möglich sein, dann kann man auch numerische Berechnungsverfahren für die Ableitungen verwenden.
* Implementieren Sie die folgende Iterationsformel: $x_{i+1} = x_i - f(x_i) / f'(x_i)$. (Wenn Sie möchten und Zeit dafür haben, können Sie sich auch davon überzeugen, dass diese Vorschrift tatsächlich die Nullstelle der Tangente von $f(x)$, an der Stelle $x_i$ an $f$ angelegt, liefert.
* Definieren Sie einen geeigneten Faktor für eine relative Genauigkeit für das Näherungsergebnis
* Implementieren Sie einen Loop, der die Iterationsformel so lange ausführt, bis die gewünschte Genauigkeit erreicht ist.
* Begrenzen Sie den Loop zusätzlich mit einer maximalen Anzahl von Schritten, sodass es bei Divergenz des Verfahrens zu keinen Problemen kommt

Diese Schritte sollten sich relativ direkt in Python implementieren lassen. Als einfaches Beispiel einer Funktion für diese Aufgabe schlage ich Ihnen vor, $f(x) = x^2 - 2$ zu verwenden. Wie Sie sich recht einfach selbst überzeugen können, liegt eine Nullstelle dieser Funktion bei der Quadratwurzel aus $2$. Dieses Ergebnis lässt sich also recht gut überprüfen. Sie können aber natürlich gerne auch andere Funktionen untersuchen und deren Nullstellen finden.

__Zusatzaufgabe (optional)__:
Wenn Sie ein erfolgreiches Beispiel durchexerziert haben, können Sie sich auch überlegen, welche Situation eigentlich zur Divergenz des Verfahrens führt. Offensichtlich ist aus der Interationsbedingung, dass man Extremwerte nicht in der Folge der $x_i$ haben darf (denn sonst dividiert man durch $0$). Aber was mit Divergenz hauptsächlich gemeint ist, ist eine Situation, in der die $x_i$ nicht immer näher an die Nullstelle heranrücken, sondern immer weiter weg wandern. Wie kann man so etwas erreichen?

In [None]:
# Beispiellösung:

# Setze Anfangswert für x_0
x0 = 1.

# Setze x_0 auch als vergangenen Wert für die Iteration an
x_prev = x0

# Setze relative Zielgenauigkeit
eps = 1.e-6

# Setze Maximalwert für Iterationen im while-Loop
nmax = 1000

def f(x):
    # definiere Funktion, von der wir Nullstellen finden wollen
    return x**2 - 2.

def fprime(x):
    # definiere Ableitung dieser Funktion
    return 2*x


# Setze Counter zum Verfolgen der Iterationsschritte
icount = 1

# Setze Schrittvergleich auf etwas großes
the_change = 1.

# starte while-Loop
while icount < nmax and the_change > eps:
    
    # Berechne relative Änderung
    the_change = np.abs(f(x_prev)/fprime(x_prev)/x_prev)
    
    # Iterationsvorschrift
    x_next = x_prev - f(x_prev)/fprime(x_prev)
    
    # Ausgabe der Werte für diesen Schritt in der Iteration
    print("Schritt ", icount)
    print("Relative Änderung: ", the_change)
    print("Neuer Näherungswert: ", x_next)
    
    # Übergeben des Neuen Wertes in den nächsten Durchlauf der Schleife
    x_prev = x_next
    
    # Erhöhe den Schritt-Counter
    icount += 1
    
    
# Schluss-Output nach Beendigung des While-Loops
print("Das Ergebnis ist ", x_next)
print("Check: ", np.sqrt(2.))
    
