# Crashkurs: Jupyter Notebooks und Python

In diesem Notebook erklären wir, wie Sie das `jupyter`-Notebook als Hauptinterface zum Schreiben und Ausführen von Code verwenden können. Bitte stellen Sie sicher, dass Sie die `python`-Umgebung und das `jupyter`-Notebook auf Ihrem Computer installiert haben, wie in den [Vorlesungsunterlagen](https://mitric-lab.github.io/python_for_chemists_ss24/00-preface/02-getting_started.html) erklärt. Zudem soll Ihnen dieser kurze Crashkurs anhand von Beispielen die wichtigsten Punkte von Python näherbringen. In jedem Abschnitt ist außerdem ein Verweis zu ausführlicheren Erklärungen angegeben.

## Nutzung von jupyter Notebooks

Nun, da alle Pakete installiert sind, sollten Sie in der Lage sein, einen `jupyter`-Server auf Ihrem Rechner zu starten, also einen Prozess, der Codeabschnitte in einem `python`-Kernel ausführen und das Ergebnis zurückgeben kann. Die einfachste, aber nicht die einzige Möglichkeit, mit solchen `Kernels` zu interagieren, ist über den browserbasierten Dienst `jupyter notebook`.

Jedes Notebook besteht aus mehreren Eingabe- und Ausgabezellen, wobei die Eingabe den auszuführenden Code enthält, während die benachbarte Ausgabezelle das Ergebnis der Berechnung anzeigt. Wichtig ist, dass diese Zellen Code in mehreren Sprachen wie `julia`, `python` oder `R` (beachten Sie den Namen: `jupyter`), aber auch in Markdown-formatiertem Text, HTML-Blöcken oder sogar LaTeX-Gleichungen enthalten können. Dies macht `jupyter`-Notebooks zu einem großartigen Werkzeug, um interaktive Dokumente zu erstellen, die direkt in HTML oder LaTex/PDF-Berichte exportiert werden können.

Um einen `jupyter`-Server zu starten, navigieren Sie einfach in das Verzeichnis Ihres Dateisystems, in welchem Sie ein `jupyter`-Notebook erstellen oder öffnen möchten (d.h. die entsprechende `.ipynb`-Datei), und führen Sie den folgenden Befehl in Ihrem Terminal aus:

```
> jupyter notebook
```

Ein Browser wird gestartet und Sie sollten die `.ipynb`-Datei in Ihrem Browserfenster sehen. Klicken Sie darauf (Doppelklick), um das interaktive Dokument zu öffnen. Ebenso können Sie ein neues Notebook erstellen. Durch Doppelklicken einer Eingabezelle in diesem Notebook können Sie den zugrunde liegenden Text oder Code bearbeiten. Durch Drücken von Shift+Enter wird der Code ausgeführt und entweder der formatierte Text oder das Ergebnis des zugrunde liegenden Codes angezeigt.

Probieren wir dies in der folgenden Eingabezelle aus, die `python`-Code enthält, und eine einfache Ausgabe generiert:

In [None]:
x = 2 * 21
print(x)

Sie können eine neue Eingabezelle unter dem aktuellen Cursor entweder durch Klicken auf die Schaltfläche `+` im oberen linken Menü oder durch Drücken von `b` auf der Tastatur erstellen. Wenn Sie eine Zelle bearbeiten, können Sie `Esc` drücken, um in den Befehlsmodus zu wechseln, in dem Sie eine Zelle hinzufügen, bearbeiten oder löschen können. Um eine Zelle zu löschen, drücken Sie `D` zweimal im Befehlsmodus. Um den Zellentyp von `python` in `markdown` zu ändern, drücken Sie im Befehlsmodus `m`. Drücken Sie `y`, um ihn wieder in `python`-Code zu ändern. Probieren wir dies mit der folgenden Markdown-Zelle aus, die eine LaTeX-Formel sowie einen HTML-Code enthält:

Der `python` Code wird von dem zugrunde liegenden `python`-Kernel ausgeführt, dessen aktueller Status in der Statusleiste des Notebook-Fensters angezeigt wird. Sie können dies sehen, wenn Sie die folgende Zelle ausführen (drücken Sie Shift+Enter):

In [None]:
s = 0
for i in range(100_000_000):
    if i % 2 == 1:
        s += i

Zudem ist es wichtig zu beachten, dass der `python`-Kernel ein einzelner Prozess ist, der den Code in den Zellen des Notebooks nacheinander ausführt. Dies impliziert, dass die Reihenfolge Ihrer Ausführung den aktuellen Zustand des Kernels bestimmt, d.h. welche Variablen existieren und welche Werte diese Variablen haben. Insbesondere wird der Zustand über mehrere Zellen hinweg beibehalten, wie Sie im folgenden Beispiel sehen können:

In [None]:
x = 42

In [None]:
print(x)

Falls Sie diese beiden Zellen in umgekehrter Reihenfolge ausführen, wird ein Fehler generiert. Dies scheint zunächst trivial zu sein, aber bei komplexen Notebooks, in denen Sie Zellen hin und her ausführen, kann es schwierig werden, den aktuellen Zustand zu verstehen. Sie können den aktuellen Zustand immer löschen, indem Sie den aktuellen Kernel beenden und einen neuen Interpreterprozess starten. Sie können dies tun, indem Sie "Kernel neu starten" im Kernel-Menü oben auswählen. Probieren Sie es aus und führen Sie dann die folgende Zelle aus, die einen Fehler zurückgibt, da eine Variable mit dem Namen `x` im neuen Kernel nicht definiert wurde.

In [None]:
print(x)

## Struktur eines Python-Programms ([ausführlich](https://www.python-kurs.eu/python3_bloecke.php))

Generell besteht Pythoncode aus einer Anzahl aneinandergereihter Anweisungen/Statements. Verschiedene Anweisungen/Statements können verschiedene Verhalten bewirken: zum Beispiel die Auswertung eines mathematischen Ausdrucks, die Ausgabe von berechneten Werten oder das Einlesen von bestimmten Parametern. Um dem Computer zu vermitteln, welche Aktion er als nächstes ausführen soll, benötigt es einer fest definierten Codestruktur. <br>
Das geschriebene Programm wird immer Zeile für Zeile vom Interpreter (Computer) ausgeführt. Mit einem Zeilenumbruch im Code beginnt eine neue Anweisung. Im folgenden Beispiel wird in der ersten Zeile die Aktion `print` ausgeführt. Diese Aktion ist mit dem Zeilenumbruch beendet. Nun folgt in der zweiten Zeile ebenfalls ein `print` Befehl der unabhängig von dem Vorherigen ausgeführt wird.  

In [None]:
print("Guten Tag beim Python Crashkurs")
print("Viel Spaß beim Programmieren.")

Einschub: Es gibt einige Sondersymbole in der Pythonsprache. Eines ist zum Beispiel `#` . Wird dieses in einer Skriptzeile gesetzt, wird der danach kommende Ausdruck nicht mehr als Code interpretiert und nicht ausgeführt. Es dient lediglich als Kommentar und erscheint auch nicht in der Ausgabe. Sie sollten Umlaute in Variablennamen und Kommentaren vermeiden, da diese (ohne Angabe dieser Codierung) eine Fehlermeldung hervorrufen.

In [None]:
print("Der danach kommende Ausdruck wird nicht ausgeführt")  # Das ist ein Kommentar, der nicht ausgefuehrt wird

So können Sie beliebig viele Anweisungen mit einem Zeilenumbruch nacheinander ablaufen lassen. Wie Sie später genauer sehen werden, gibt es in Python viele verschiedene Konstrukte/Verzweigungen, die noch eine weitere Sturktureinheit benötigen. Man spricht von sogenannten Blöcken, die durch bestimmte Einrückungen (i.d.R Tabulator oder 4 Leerzeichen) der jeweiligen Codezeile des Programms entstehen.<br>


In [None]:
print("Erster Block") # keine Einrueckung
for i in range(3):
    print("Zweiter Block") # ab hier um 1 tab eingerueckt
    if i < 2:
        print("Dritter Block") # ab hier um 2 tab eingerueckt
    print("Jetzt wieder zweiter Block")
print("Jetzt wieder erster Block")

Wie genau das obige Beispiel funktioniert, ist im Moment noch nicht von Bedeutung. Wichtig ist nur, dass Sie sich merken, dass es unterschiedliche Blöcke mit verschiedenen Einrückungen gibt. Die Zugehörigkeit der jeweiligen Code-Zeile zu einem Block wird durch die Zahl der Tabs festgelegt.

## Variablen und elementare Datentypen ([ausführlich](https://www.python-kurs.eu/python3_variablen.php))
Variablen sind die Namen, unter denen Werte gespeichert oder abgerufen werden können. Mit dem Operator `=` kann einer Variable ein Wert zugewiesen werden. Der Name der Variable darf keine Sonderzeichen enthalten und muss mit einem Buchstaben beginnen, Unterstriche sind auch erlaubt. Beispiele für gültige Variablen sind:

In [None]:
x = 10
city = "Hannover"
longVariable_Name = 3.14
favorite_number_2 = 2.718
complex_number = 1 + 2j

'x' steht jetzt für den Wert 10 und kann in anderen Ausdrücken verwendet werden.

In [None]:
x

In [None]:
x * x

Um den Wert einer Variable auszuschreiben, können wir auch die Funktion `print(...)` verwenden:

In [None]:
print(x)
print(x*x)
print("The value of x is: ", x, " and the value of x*x is : ", x*x)

Variablen müssen zuerst definiert werden, bevor sie verwendet werden können. 
Andernfalls bekommt man eine Fehlermeldung.

In [None]:
bla

Variablen können unterschiedliche Datentypen enthalten. 
Elementare Datentypen sind z.B.:<br>
     - Ganzzahlen: `int`<br>
     - Fließkommazahlen: `float`<br>
     - Zeichenketten: `str`<br>
     - Komplexe Zahlen: `complex` (Beachten Sie, dass bei komplexen Zahlen der Buchstabe j für den Imaginärteil verwendet wird).<br>
Um welchen Datentyp es sich handelt, kann man mit der Funktion `type(variable_name)` herausfinden:

In [None]:
type(x)

In [None]:
type(city)

In [None]:
type(longVariable_Name)

In [None]:
type(complex_number)

Ein weiterer Datentyp ist `bool`. Boolesche Variablen können nur zwei Werte haben, `True` oder `False`.

In [None]:
condition = True
type(condition)

Variablen vom Type `bool` sind häufig das Ergebnis von Vergleichsoperationen:                 
(Wenn die Variable x den Wert 10 besitzt, gibt die Konsole ein bool mit dem Wert True zurück)

In [None]:
x == 10

__Beachten Sie, dass zum Vergleichen der Operator `==` verwendet wird. `x = 10` würde der Variable `x` den Wert 10 zuweisen.__

In [None]:
x <= 100

In [None]:
x > 100

Einige Vergleichsoperatoren auf einen Blick:

        x == 1          Testet, ob die Variable x gleich dem Wert eins ist.
        x >  1          Testet, ob x größer als der Wert eins ist.
        x >= 1          Testet, ob x größer oder gleich dem Wert eins ist.
        x <  1          Testet, ob x kleiner als der Wert eins ist.
        x <= 1          Testet, ob x kleiner oder gleich dem Wert eins ist.
        x != 1          Testet, ob x ungleich dem Wert eins ist.

Wenn eine Variable zwar definiert ist, aber keinen bestimmten Wert haben soll, kann man ihr den speziellen Datentype `None` geben:

In [None]:
someVariable = None
type(someVariable)

## Operatoren ([ausführlich](https://www.python-kurs.eu/python3_operatoren.php))
Zwischen numerischen Datentypen sind die üblichen mathematischen Operatoren erlaubt. Gegebenenfalls müssen Klammern verwendet  werden:

In [None]:
(1+5.0)*3.0/5.0

Dabei wertet Python immer zuerst den gesamten rechts stehenden Ausdruck aus, bevor es den Wert der Variablen zuweist. Somit wird im nachfolgendem Beispiel zuerst `2 + (3-5)/3` nach der bekannten mathematischen Abfolge ausgewertet und dann der Variablen `math_value` zugewiesen.

In [None]:
math_value = 2.0 + (3.0 - 5.0)/3.0
print(math_value)

Boolesche Werte können durch logische Operationen (`and`, `or`, `not`) verknüpft werden: 

In [None]:
True or False

In [None]:
not True

In [None]:
number = 7
(number < 10) and (number > 5)

## Listen (`list`, [ausführlich](https://www.python-kurs.eu/python3_sequentielle_datentypen.php))
Der Datentyp `list` dient dazu, größere Mengen von Daten geordnet zu speichern.
Eine Liste wird durch eckige Klammern `[...]` erzeugt:

In [None]:
students = ['Hans', 'Klara', 'Lisa', 'Mark']

Auf die Elemente einer Liste kann durch einen Index in eckigen Klammern direkt hinter der Variablen, der die Position des Elements in der Liste angibt, zugegriffen werden. 
__Die erste Position hat den Index `0` (nicht `1`)__

In [None]:
print(students[0])
print(students[2])

Statt von vorne zu zählen, kann man die Position auch von hinten angeben. Das letzte Element der Liste hat den Index -1, das vorletzte -2 usw.

In [None]:
print(students[-1])

Eine Liste kann erweitert werden, indem man neue Element ans Ende anfügt:

In [None]:
students.append('neuer Student')
print(students)

Die Funktion `append(element)` ist hier eine vordefinierte _Methode_ des Datentyps `list`. Weitere Methode ist `insert(position, element)`, die ein Element vor einer beliebigen Position einfügt, oder `sort()`, welche die Elemente der Liste sortiert. (z.B: Anfangsbuchstaben der Namen)

In [None]:
students.insert(0, 'Gisela')
students.sort()
print(students)

Wenn Sie die Zelle mehrmals ausführen, werden Sie merken, dass immer mehr Giselas hinzukommen. Das liegt daran, dass die Variable `students` im Notebook gespeichert ist. Um alle Definitionen zu entfernen und einen sauberen Arbeitsspeicher zu erhalten, können Sie in der Menüleiste auf `Kernel->Restart & Clear Output` klicken. 

Listen können durch den `+` Operator verkettet werden. Die Elemente einer Liste müssen nicht alle den gleichen Datentyp haben, obwohl das üblicherweise so ist.

In [None]:
[1, 2, 3, 4] + ["Lisa", 'Karl', 3]

Die Länge einer Liste erhält man mit der Methode `len(liste)`:

In [None]:
len(students)

Eine Übersicht aller Methoden, die von einem Datentyp (besser gesagt einem [Objekt](https://www.python-kurs.eu/python3_klassen.php)) zur Verfügung gestellt werden, erhalten Sie mit der Funktion `help(object)`:

Hinweis: Wenn Sie ein bisschen nach unten scrollen, finden Sie die oben verwendeten Methoden `append(element)` und `insert(position, element)` wieder.

In [None]:
help(students)

__Weitere Datentypen in Python sind `dictionaries`, `tuples` und `sets`, welche wir zu einem späteren Zeitpunkt besprechen werden.__

## Steuerkonstrukte: Verzweigungen und Schleifen
Die Programme, die wir bis jetzt gesehen haben, waren alle linearer Struktur. Das bedeutet, es wurde jede Zeile von oben nach unten nacheinander nur einmal ausgeführt. Um diese Struktur zu durchbrechen, gibt es in Python die Möglichkeiten Codesegmente nur ausführen zu lassen, falls gewisse Bedingungen erfüllt sind. Dabei gibt es die Möglichkeit des einmaligen Ausführens (`if`- Bedingungen), bzw. für wiederholte Ausführungen, solange bis die Bedingung nicht mehr erfüllt ist (`while`-Schleife). Außerdem bietet Python mit dem Konstrukt der `for`-Schleife die Möglichkeit, ein Statment für eine vorbestimmte Zahl von Iterationen ablaufen zu lassen. Für alle drei wird der Anweisungsblock allein durch die Einrückung des Codes festgelegt.

### If - Anweisung ([ausführlich)](https://www.python-kurs.eu/python3_bedingte_anweisungen.php)
Werden verwendet, wenn eine gewisser Codeblock nur unter ganz bestimmten Voraussetzungen ausgeführt werden soll. 

Synthax Aufbau:

`if Bedingung:
    Anweisungen`
        
Wenn die Bedingung wahr ist (`bool` Wert: `True`) wird die eingerückte Anweisung ausgeführt  

In [None]:
a = 5
if a == 5:
    print(a)
print("If-Verzweigung wird ausgefuehrt: 5 == 5 (True)")

Machen Sie sich hierbei den Unterschied zwischen dem Zuweisungsoperator `=` und dem Vergleichsoperator `==` deutlich. In der ersten Zeile wird der Variablen `a` der `int` Wert `5` zugewiesen. In der zweiten Zeile wird eine `if`
 Verzweigung aufgerufen, die nur ausgeführt wird, wenn die Bedingung `a==5` den bool Wert `True` zurückgibt. (Da `5 == 5` eine wahre Aussage darstellt, ist die Bedingung erfüllt und die Anweisung der Verzweigung wird ausgeführt. 

In [None]:
a = 5
if a == 4:
    print(a)
print("If-Verzweigung wird nicht ausgefuehrt: 5 == 4 (False)")

Es könen auch mehrere Teilbedingungen über die logischen Operatoren `and` und `or` zu einer Gesamtbedingung verknüpft werden.<br>
`if a == 4 and b == 5:
    print ("Zwei Teilbedingungen, die beide True ergeben müssen")
 if a == 4 or b == 5:
    print ("Nur eine der zwei Teilbedingungen muss True ergeben")`

### elif, else - Anweisungen ([ausführlich](https://www.tutorialspoint.com/python3/python_if_else.htm))
Wenn nicht nur eine Bedingung, sondern weitere verschiedene Bedingungen überprüft werden sollen, kann die `if`-Anweisung mit `elif`-Anweisungen (kurz für: "else if") erweitert werden. Soll, wenn keine Bedingung bei der Überprüfung den bool Wert `True` zurückgibt, eine gewisser Code folgen, kann dies mit der `else`-Anweisung geschehen. Diese wird nur ausgeführt, wenn alle `if` bzw. `elif`-Anweisungen den bool Wert `false` besitzen.

In [None]:
value = 8 # der Variablen value wird der Wert 8 zugewiesen

if value == 4:     # value == 4 -> False (8 == 4) 
    print("Die Variable hat den Wert vier")
elif value == 5:   # value == 4 -> False (8 == 5)  
    print("Die Variable hat den Wert fünf")
else:              # Beide Bedingungen sind False, somit wird die else Anweisung ausgefuehrt
    print("Die Variable value ist weder vier noch fünf")

### For-Schleifen ([ausführlich](https://www.python-kurs.eu/python3_for-schleife.php))
Ein weiteres Konstrukt für die wiederholte Ausführung von Anweisungen bildet die `for`-Schleife. Dabei ähnelt die Synthax der einer `while`-Schleife. Im Unterschied dazu werden die Anweisungen nicht so lange wiederholt bis die Bedingung `False` erzeugt, sondern es wird so oft wiederholt wie ein iterierbares Objekt Elemente besitzt. Iterierbare Objekte sind Listen, Tupel, Arrays, etc. Die Variable nimmt dabei den Wert des jeweiligen Elements der Sequenz an (siehe Beispiele).
Besitzt die Sequenz keine Elemente mehr, über die iteriert werden kann, wird die else-Anweisung ausgeführt.

`for Variable in Sequenz:
	Anweisung_1
	Anweisung_2
	...
	Anweisung_n
else:
	Else-Anweisung_1
    ...`


In [None]:
for value in [1, 2, 3]:  # Iteration ueber eine Liste mit den Elementen [1,2,3].
      print(value)       # Somit wird die Schleife 3 mal aufgerufen. Das erste Mal nimmt
                         # value den Wert 1 an, dann den Wert 2, dann den Wert 3. 
                         # Damit endet die for-Schleife und der darunter stehende Code wird weiter ausgeführt.

In [None]:
for i in range(0, 5):  # die range Funktion erzeugt ein iterierbares Objekt mit den Elementen 0,1,2,3,4
    print(i)           # Die Schleife wird für jedes dieser Elemente ausgeführt (somit 5 mal). Dabei nimmt
                       # die Variable i zuerst den Wert 0, dann 1, dann 2... an.

In [None]:
for i in "String":   # Hier ist das iterierbare Objekt ein String mit 6 Elementen.
    print(i)

Oft ist es besser, nicht direkt über das Listenobjekt zu iterieren. Sondern über Indizes des iterierbaren Objekts, die man von der `range()` Funktion erzeugen lässt. Die Länge von Objekten kann man mit der `len(...)` Funktion abfragen lassen. In der `for`-Schleife selber kann man dann wieder über den Index (`[ ]`) auf das Listenobjekt zugreifen. 

In [None]:
a = [1, 8, 4]             # Liste a mit [1,8,4]
length = len(a)           # Der Variablen length wird der Wert 3 zugewiesen. Länge der Liste a.
for i in range(length):   # das mit range erzeugte Objekt enthält die Werte 0,1,2. (da range(3))  
    print("Der Wert der Liste a an der Stelle", i,"lautet", a[i]) # nun kann über [ ] auf das i_te Element zugegriffen werden

### Verschachtelte Schleifen und Verzweigungen
Natürlich können die oben genannten Schleifen und Verzweigungen nach Belieben kombiniert werden.

In [None]:
a = [1, 2, 3]
for i in a:
    if i % 2 == 0:        # % Operator ist der modulus Operator
        print(i, "ist gerade")
    else:
        print(i, "ist ungerade")

## Error Meldungen ([ausführlich](https://py-tutorial-de.readthedocs.io/de/latest/errors.html))
Wir sind im Laufe dieses Crashkurses schon auf einige Fehlermeldungen gestoßen: 

 - `NameError`: Variable mit dem Namen ist nicht definiert
 - `KeyError`: im Wörterbuch gibt es keinen passenden Schlüssel
 
Im Folgenden soll ein kurzer Überblick auf weitere häufige Fehlermeldungen gegeben werden. 

Der wahrscheinlich häufigste Fehler in einem Programm ist der sogennante `SyntaxError`. Er wird von der Konsole ausgegeben, wenn der Pythoninterpreter den Code nicht versteht, weil die Syntax falsch ist. Bedeutet: In dem geschriebenen Code wurde zum Beispiel das `:` bei einer `for`-Schleife vergessen. Je nach Editor werden solche Fehler auch ohne Ausführen sofort unterringelt. Wie oben schon erwähnt, sagt uns die Fehlermeldung auch, wo sich der Fehler befindet. (Hier in `line 1`) 

In [None]:
for i in range(5)   #hier fehlt der : am Ende einer for-Schleife
    print(i)

Neben den Syntaxfehlern gibt es weitere Ausnahmen (exceptions). Wenn Sie ihr Programm ausführen und es fehlerhaft ist, gibt Ihnen der Interpreter eine Fehlermeldung auf der Konsole aus. Ein Beispiel hierfür wäre, dass in dem geschriebenen Skript (zum Beispiel bei einer Schleife) an einer Stelle durch 0 geteilt wird. Dabei wird auf die Konsole beim Ausführen des Programms ein `ZeroDivisionError` ausgegeben.

In [None]:
for i in range(3,-1,-1):  #erzeugt Iterationsobjekt [3,2,1,0]
    print(5/i)

Desweiteren gibt es `TypeError`, wenn eine Funktion einen falschen Datentyp als Argument übergeben bekommt. Zum Beispiel erwartet die `range` Funktion drei Integer. Startwert, Endwert und Schrittgröße. Wenn man dieser Funktion statt eines Integers an einer Stelle eine `float` übergibt (z.B: 0.1), kann die `range` Funktion nicht ausgeführt werden und ein Fehler wird in der Konsole ausgegeben.

In [None]:
for i in range(1, 3, 0.1):
    print(i)

Zuletzt soll noch auf den `IndentationError` hingewiesen werden. So muss der auszuführende Codeblock immer in der gleichen Einrückungsebene liegen.

In [None]:
for i in range(1,5):
    i += 1
     print(i)                            # der auszufuehrende Codeblock der for-Schleife muss 
    print("Das ist der letzte Fehler")  # einheitlich in einer Einrueckungsebene liegen

__Liste von weiteren [Ausnahmen (exceptions)](https://www.tutorialspoint.com/python/python_exceptions.htm)__