# Python Einführung - Jupyter Notebooks

## Grundlagen der Cognitive Science

### Seminar - 22.11.2021

Diese Einführung dient als Beispiel wie ein Notebook aussehen könnte. Im Folgenden werden bestimmte Eigenschaften von Jupyter Notebooks sowie ein paar allgemeine Regeln, die für das Programmieren wichtig sind, erklärt und an Beispielen gezeigt.

### Cells

Die Notebooks sind in Zellen/Abschnitte (cells) eingeteilt. Diese können entweder mit Code oder Text gefüllt werden. Je nachdem ob in einer Cell programmiert oder nur geschrieben werden soll, muss die Zellart u.U. umgestellt werden. Soll programmiert werden muss die Zelle vom Typ "Code" sein. Soll Text in einer Zelle stehen, muss der Typ "Markdown" ausgewählt werden. Um Zellen zu bearbeiten müssen diese mit einem Doppelklick ausgewählt werden und können dann verändert werden. Danach sollten Zellen ausgeführt werden. Um dies zu tun, muss `ctrl-Enter` oder `shift-Enter` gedrückt werden (alternativ kann man natürlich auch in der Menüleiste unter Cell -> Run Cells auswählen). Diese Art von Shortcuts sind ziemlich praktisch und [hier](https://shortcutworld.com/Jupyter-Notebook/win/Jupyter-Notebook_Shortcuts) kann man eine ganze Liste finden (ist für Windows ausgeschrieben, aber die meisten funktionieren auch genauso für Linux oder Mac User).

Das Bearbeiten und ausführen einer cell wird im Folgenden mehrfach verlangt, um sich mit den Zellenarten und deren Funktionen vertraut zu machen.

#### Text Cell
Text cells wie diese (und auch die darüber), können **schön** formatierten Text darstellen. In diesen können auch HTML und $\LaTeX$ Befehle und Formeln enthalten sein. Dies kann viele Vorteile haben. Muss zum Beispiel eine mathematische Formel dargestellt werden, kann diese auf diese Weise dargestellt werden:

$$
\sum_{i=1}^{𝑛} i = \frac{𝑛(𝑛+1)}{2}
$$

In Text cells können auch weitere hilfreiche Darstellung aufgeschrieben werden, wie beispielsweise Tabellen.

|First Header| Second Header|
|---|---|
|Content Cell| Content Cell|
|Content Cell| Content Cell|

Wie es dazu kommt, dass die Formel, Tabelle und der Text in dieser Weise angezeigt wird, wird im Bearbeitungsmodus deutlich.

Hier findet ihr eine der wichtigsten Funktionen und Befehle aufgelistet. Weitere Hilfe und Information gibt es außerdem unter Help -> Markdown in der Menüleiste oben, sowie auf [dieser Seite](https://github.com/adam-p/markdown-here/wiki/Markdown-Here-Cheatsheet).

* Mit # kann eine Überschrift erstellt werden
* Mit mehreren # Zeichen können Unterüberschriften erstellt werden - desto mehr # Zeichen, desto kleiner wird die Überschrift
* Soll Text fett sein, muss er mit ** umschlossen werden
* Soll Text kursiv sein muss er mit * oder _ umschlossen werden
* Mathematische Audrücke und Formeln müssen von \\$ umschlossen sein - wenn \\$$ genutzt wird erscheint die Formel zentriert in der Zelle
* Die wichtigsten mathematischen Ausdrücke können hier entnommen werden: [LINK](https://de.wikipedia.org/wiki/Hilfe:TeX)
* Links können mit [ ] oder \[Bezeichnung\](URL) eingefügt werden
* Tabellen können mit - und | gebaut werden

#### Code Cell
Im Folgenden findet ihr eine Code Zelle. Diese soll ausgeführt werden (sehe oben: mit `Ctrl-Enter` oder `Shift-Enter`).

In [1]:
# import the numpy package.
import numpy as np;

# generate a random number that is stored in rand_num
rand_num = np.random.rand();

# print the random number to an output line
print("this is a random number:", rand_num);

this is a random number: 0.830089703049962


Ist die Zelle einmal ausgeführt, soll getestet werden, was passiert, wenn eine Zelle vom Typ Code in eine Markdown Zelle umgewandelt wird. Dies kann durch Auswahl der Zelle und anschließendem Umstellen in der Menüleiste erreicht werden.

So wird beim Ausführen der Zelle nicht mehr der Code ausgeführt sondern dieser nur als Text dargestellt. Ändert man die Zelle wieder in Code (über die Menüleiste) um, wird der Code wieder ausgeführt.

### State
Der State wird über Zellen hinweg beibehalten. An der Seite jeder Code cell kann in eckigen Klammern eine Zahl gesehen werden - diese verweist auf die Ausführungsreihenfolge und gibt Aufschluss über den Zustand. Wenn eine Zelle nach der anderen ausgeführt wird und z.B. eine Variable der vorherigen Zelle in der nächsten genutzt wird, hat diese die entsprechenden Informationen über die Variable.

Im obigen Bespiel heißt das folgendes: führt man zunächst die obere Code cell aus, wird eine beliebige Zahl generiert. Wird danach die untere Code cell ausgeführt, zeigt diese den Wert der oben bereits generierten Zahl. Möchte man also in der unteren Zelle eine neue beliebige Zahl anzeigen, muss hierfür die obere Zelle erneut ausgeführt werden und danach nochmal die untere. Wird die untere nicht nochmal ausgeführt, steht in ihrer Ausgabe noch der alte Wert der Variable.

**Das heißt, dass die Reihenfolge in der die Cells ausgeführt werden entscheidend ist - und nicht deren Reihenfolge im Notebook!**

In [2]:
print("this is a random number:", rand_num);

this is a random number: 0.830089703049962


### Kernel
Der Kernel ist das, was den Code im Notebook ausführt. Beim Öffnen des Notebooks wird der Python Kernel gestartet. Dieser bearbeitet den geschriebenen Python Code und gibt die daraus folgenden Outputs zurück. So kann der Code in den Zellen ausgeführt werden. Es gibt drei Zustände die hierbei wichtig sind, die meist am Kreis rechts oben in der Ecke der Menüleiste abgelesen werden können:

* Kernel ist bereit. Ist der Kreis leer, kann das Notebook/eine Zelle ausgeführt werden
* Kernel ist beschäftigt. Bei Code und Methoden, die länger brauchen, kann der Kernel beschäftigt sein im Hintergrund ohne, dass man davon zunächst etwas mitbekommt. Dies erkennt man daran, dass der Kreis oben grau gefüllt ist. Hier muss gewartet werden. Hierzu noch ein Hinweis: sollte man (ungewollt) eine Endlosschleife geschrieben haben, die niemals zum Ende kommt, kann das auch dadurch deutlich werden, dass der Kernel sehr lange beschäftigt ist.
* Kernel ist unterbrochen. Sollte es passieren, dass der Kernel beschäftigt ist, weil zum Beispiel eine solche Endlosschleife vorliegt oder ein Programm (aus welchen Gründen auch immer - da kann es einige geben) hängen bleibt, kann der Kernel unterbrochen werden. Dies kann über die Menüleiste über Kernel -> Interrupt erreicht werden. Dann kann er (nach entsprechenden Änderungen z.B. Entfernen der fehlerhaften Schleife) wieder gestartet werden über Restart (& Clear Output - wenn das gewollt ist).

### Dokumentation

Ein sehr wichtiger Aspekt beim Programmieren, ist eine sinnvolle Dokumentation des Codes. Gerade hier eignen sich Jupyter Notebooks auch wieder sehr gut: ihr könnt ganze Textblöcke und Text cells einfügen, in den auch z.B. in denen im Code genutzte Formeln etc. beschrieben werden können. Außerdem könnt ihr in den code cells Kommentare einfügen (siehe unten). Solche in-code Kommentare werden vor allem dann wichtig wenn mann später mal volstandinge scripts schreibt die man im ganzen auf einmal komplet aktivieren möchtte, oder wenn man Code schreibt ausserhalb eine Jupyter umgebung wo man nicht diese Mischung aus Text und Code cells hat (das werden wir aber in diesen Kurs noch nicht machen). 

Dokumentation ist wichtig für alle die selbst Code schreiben, um ihren Code für sich und andere besser verständlich zu machen. Aber auch um den Code (libraries etc.) von anderen gut und sinnvoll nutzen zu können. 

Im folgenden gibt es ein weiteres Beispiel für eine Methode. In der code cell sind Kommentare eingefügt, die nicht nur erklären was an der entsprechenden Stelle passiert, sondern auch ein paar Hinweise und Tipps geben, an die ihr euch beim Programmieren halten solltet (sehe oben für ein weiteres Beispiel). Solche Kommentare können nützlich sein wenn mann spater noch Mal durch die eigene Code gehen möchtte um nochmal die Schritte nach zu gehen vor allem wenn ein Code vielleicht schon etwas complex wird.

In [4]:
# über das Einfügen von # können in code cells Kommentare eingefügt werden
# diese Kommentare werden bei der Ausführung des Codes ignoriert und haben daher keinen Einfluss 
# auf die Funktionalität und können entsprechend an allen (gewünschten) Stellen eingefügt werden

# list of numbers
numbers = [17,2,3,66,8,11,35,-2,1,57,9,28,45,14,91,62,3,34,90]

### Interaktive Dokumentation
Wie oben bereits erwähnt ist aber auch Dokumentation von anderen wichtig für euch. Ein hilfreiches und praktisches Feature in Jupyter (besonders für den Anfang) ist, dass man auch direkt auf die Dokumentation von Funktionen, Libraries und Methoden zugreifen kann. In einer Code cell können über verschiedene Aufrufe und Befehle so die wichtigsten Informationen eingeholt werden, die z.B. kurz beschreiben, was eine bereitgestellte Methode macht. Die folgenden Befehle können in der folgenden Code cell getestet werden:

* np.*TAB(+option)* Hier wird eine Liste angezeigt, welche die Submodule und enthaltenen Funktionen des Numpy Pakets zeigt

* np.random.rand? Wird dieser Befehl mit dem Fragezeichen ausgeführt (run cell) dann wird die Funktion rand(), die im Numpy Paket enthalten ist kurz erklärt. So erfährt man kurz was diese Funktion tut.

* np.random.rand(*shift-TAB*. Dieser Befehl mit eine Klammer zeigt welche Argumente an diese Funktion übergeben werden müssen. Drückt man danach (mehrfach) shift-TAB wird der gesamte Docstring () angezeigt.

In [None]:
rand_num = np.

In [20]:
rand_num = np.random.rand?

In [22]:
rand_num = np.random.rand(

### Debugging
Ein Rechner macht genau was ihm ihn sagt, auch wenn was man sagt nicht genau das war was man eigentlich wollte was der Rechner machen soll (i.e. den Code enthält einen sogenannten Bug). Manchmal gibt es dan einfach komische Werte und mann muss dan heraussuchen woher das kommt, aber wenn der Code wirklich fehlerhaft ist und der Rechner ein Commando nicht ausfuhren kann, kriegt man ein error message. Wenn man Code schreibt ist mann also oft auch am "debuggen". Dabei ist es wichtig the Fehlermeldung richtig zu lesen und auch das braucht Übung also keine Angst wenn man am Anfang sich damit noch nicht auskennt. Hierunten aber ein Beispiel.


In [5]:
# let's try to add the value 2 to all elements in the list numbers above and print it to an output line.
# you will see that this won't work and will get an error message 
print( numbers + 2 )

TypeError: can only concatenate list (not "int") to list

Was lief da schief? In Python heist +2 nicht einfach alle Elemente mit 2 aufstocken aber versucht stattdessen die Nummer 2 am Ende der Liste hinzuzufugen (das ist was `Concatenate` heisst). Es gibt hier einen hinweis das wir vielleicht nicht die richtige Datenstruktur haben (über Datenstrukturen im Nächsten Seminar mehr). Die richtige Lösung folgt hierunten mit Benutzung des Numpy pakets.

In [6]:
# convertiere die Liste in einen numpy array
numbers_array = np.array(numbers)
print( numbers_array + 2 )

[19  4  5 68 10 13 37  0  3 59 11 30 47 16 93 64  5 36 92]


#### Tipps und Hinweise zum Programmieren

*Tipp 1: Schreibt sauberen und übersichtlichen Code!* Das bedeutet, die gesamte Struktur und der Aufbau sowie die genutzten Elemente sinnvoll genutzt werden. Insgesamt sollte auf gute Übersichtlichkeit geachtet werden. Wenn ihr Python in Jupyter Notebooks nutzt, spielt auch die richtige Einrückung eine wichtige Rolle! Nicht nur für die Übersichtlichkeit, sondern dafür, dass euer Code läuft - und zwar wie geplant. Also achtet immer streng auf die Einrückung!

*Tipp 2: Nutzt sinnvolle und aussagekräftige Variablennamen.* Der Name der Variable sollte nicht einfach nur 'a' sein sondern sollte zeigen, was in ihr gespeichert wird, z.B. rand_num (für random number)

*Tipp 3: Genau das Gleiche gilt für Methodennamen.*

*Tipp 4: (Unnötige) Code Doppelungen sollten vermieden werden.* Merkt ihr, dass ihr das ihr Code aus einer Zelle in die nächste kopieren möchtet, solltet ihr euch Gedanken machen, ob es nicht eine bessere Lösung für das Problem gibt. Dies kommt mit der Zeit und Übung.

*Tipp 5: Dokumentiert euren Code immer gut!* Auch wenn ihr sowieso darauf achtet, klaren Code zu schreiben, ist es dennoch wichtig Kommentare sinnvoll einzusetzen. Das macht nicht nur alles einfacher für andere (wie uns), die euren Code lesen, nachvollziehen und verstehen müssen, sondern auch für euch. Wenn ihr kommentiert, was und wieso ihr etwas in eurem Code so gemacht habt, könnt auch ihr, wenn ihr später wieder darauf schaut, auch alles besser nachvollziehen.

In [6]:
# Methodenname sagt schon direkt etwas über dessen Funktion aus 'search' sagt mir, dass etwas gesucht wird
# 'max' kann mir einen Hinweis darauf geben, dass es hier um ein Maximum/maximaler Wert geht.
# Über den Argumentsnamen 'input_numbers' weiß ich auch, dass hier mehrere Zahlen in die Methode gegeben werden
def searchMax(input_numbers):
    
    # initialisiere max_value mit den Ersten Zahl aus der Liste (angezeigt mit index 0).
    # Variablenname auch entsprechend gewählt
    max_value = input_numbers[0]
    
    # eine Schleife um durch die Liste zu gehen
    for i in range(len(input_numbers)):
        # wenn ein größeren wert gefunden wird ersetze max_value
        if max_value < input_numbers[i]:
            max_value = input_numbers[i]
            
    # sorge das die Methode der größte Zahl auch ausspukt/zurück gebt         
    return max_value

In [7]:
print('Die größte Zahl ist = ', searchMax(numbers))

Die größte Zahl ist =  91


### Erste Beispielaufgabe

Schreibt eine Methode, die statt die größte, die kleinste Zahl zurückgibt. Orientiert euch an der obigen Methode. Achtet dabei auf sinnvolle Variablen- und Methodennamen und zeigt die Methodenausgaben sinnvoll an. 

In [None]:
# Methodenname sagt schon direkt etwas über dessen Funktion aus 'search' sagt mir, dass etwas gesucht wird
# 'max' kann mir einen Hinweis darauf geben, dass es hier um ein Maximum/maximaler Wert geht.
# Über den Argumentsnamen 'input_numbers' weiß ich auch, dass hier mehrere Zahlen in die Methode gegeben werden
def searchMin(input_numbers):
    
    # initialisiere max_value mit den Ersten Zahl aus der Liste (angezeigt mit index 0).
    # Variablenname auch entsprechend gewählt
    max_value = input_numbers[0]
    
    # eine Schleife um durch die Liste zu gehen
    for i in range(len(input_numbers)):
        # wenn ein größeren wert gefunden wird ersetze max_value
        if max_value < input_numbers[i]:
            max_value = input_numbers[i]
            
    # sorge das die Methode der größte Zahl auch ausspukt/zurück gebt         
    return max_value