# Python Einführung - Jupyter Notebook
## Grundlagen der Cognitive Science
### Seminar - 29.11.2020

Dieses Notebook enthält allgemeine Programmierkonzepte und -prinzipien. Diese werden kurz erklärt und anhand von entsprechendem Code und Beispielen demonstriert und implementiert. Anschließend sollen sie in verschiedenen Übungsaufgaben selbst angewandt werden.

### 1. Imports
Imports sind Einbindungen von Libraries und Packages, die danach genutzt gewerden können. Diese Einbindung dient dazu Zugriff auf die enthaltenen und "vorimplementierten" Methoden zu haben. Dies macht vieles einfacher und hilft dabei bestimmte Probleme besser lösen zu können. Numpy z.B. bietet Datenstrukturen und numerische Methoden, die häufig im Umgang mit Matrizen etc. hilfreich sind.

Hier werden genutzte Importe über `import` eingeführt und können durch den Befehl `as` und die dann angefügte Abkürzung in diesem Fall `np` einfacher nutzbar gemacht werden. Es ist Konvention alle imports, die man im Notebook nutzt an den Anfang zu setzen, damit so alles direkt zu Beginn geladen werden kann. In Jupyter Notebooks setzt man am besten die imports auch in ihre eigene cell.

In [1]:
import numpy as np

### 2. Dokumentation und Kommentare

Zur Erinnerung: um innerhalb des Codes bestimme Stellen zuerläutern, können/sollten Kommentare eingefügt werden. Diese können über # eingefügt werden und können im Folgenden gesehen werden - was im Code in Kommentaren steht wird nicht ausgeführt.

### 3. Variablen
Python hat verschiedene Arten von Variablen.

* Zahlen: Ganzzahlen, lange Ganzzahlen, Fließkommazahlen (komplexe Zahlen - hier erstmal nicht relevant). Die Typen der Zahlen (int, float, etc.) müssen in Python nicht explizit deklariert werden bei der Erstellung von Variablen. Dies wird implizit gemacht und kann auch implizit wechseln. Beispiel: wenn `i = 10` (int) ist und dann wird `i = i + 0.1` gerechnet, dann wird diese direkt zu einer float. All dies muss aber nicht explizit festgeschrieben werden, sondern wird automatisch geändert.
* Strings: sind text-variablen worin eine oder mehrere Textzeichen gespeichert sind, zum Biespiel einen ganzen Satz. In manche Fälle werden auch Zahlen als Strings ausgedruckt: `"1"` deutet zum Beispiel auf ein String `1` an und nicht die Zahl `1`. Das wechseln zwischen Strings und Zahlen geht aber nicht automatisch. Wichtig ist auch zu wissen das Zahlen und Strings sich beim gleichen Kommandos sich verschieden verhalten (zum Biespiel bei das `+` Kommando). In Python sind Strings immutable also nicht mehr veränderbar. Das heisst zum Beispiel das wenn ein String einmal definiert ist, mann nicht so einfach einzelen Zeichen innerhalbs des Strings durch ein anderes Zeichen ersetzen kann.
* Datenstrukturen: Datastrukturen konnen mehr als nur einen Zahl oder String enthalten. Es gibt in Python verschiedene varianten (darüber unten mehr...). Natürlich werden auch die im kommenden beschriebenen Datenstrukturen mithilfe von Variablen benannt und gespeichert.

Weitere Informationen zu den verschiedene Typen von Variablen in Python gibt es zum Beispiel [hier](https://www.python-kurs.eu/variablen.php).

* Character: ist eine einzige text-buchstabe/Zeichen.  In Python ist ein Character eigentlich nicht wirklich ein separates Variabletype sondern ein String mit Lenge eins (nur ein einziges Zeichen im String). Das ist aber nicht in jede Programmiersprache so deswegen hier kurz die separate Erwähnung.

### 4. Datenstrukturen

Datenstrukturen sind bestimmte Darstellungs-, Organisations- und Speicherarten für Elemente. Datenstrukturen (meist die selben wie z.B. Arrays oder Listen) gibt es in verschiedensten Programmiersprachen. Für Python sind vor allem die folgenden Datenstrukturen wichtig.

#### 4.1. Listen

Sammlung von Elementen, die erweitert werden kann durch Anfügen und Ersetzen/Ändern von Elementen. Hier können Duplikate enthalten sein und Listen können aneinander gehängt werden. Des Weiteren können Listen verschachtelt werden (also "ineinandergehängt" werden). Wichtigste Methoden sind:

- append( ): erwartet ein Element und hängt dieses weitere Elemente (hinten) an die Liste
- sort( ): sortiert die Liste
- pop( ): erwartet eine Angabe zur Position in der Liste und entfernt das Element an der entsprechenden Stelle
- remove( ): erwartet einen Wert und entfernt den angegebenen Wert aus der Liste

Definierung erfolgt mit `[]` klammern.

Weitere Eigenschaften und [Methoden](https://www.w3schools.com/python/python_lists_methods.asp) von Listen können z.B. [hier](https://www.w3schools.com/python/python_lists.asp) entnommen werden.


#### 4.2. Dictionaries

In Dictionaries können über "keys" bestimmte Werte, die dem key zugeordnet sind, gespeichert und entnommen werden. Elemente können eingefügt und entfernt werden. Dictionaries können ebenfalls verschachtelt werden, also Dictionaries können weitere Dictionaries oder Listen enthalten. Wichtige Methoden der Dictionaries sind z.B.:

- get( ): erwartet einen key und holt den Wert des entsprechenden keys
- pop( ): erwartet einen key und entfernt den Eintrag des entsprechenden keys

Definierung erfolgt mit `{}` klammern und `key: value` combinationen: `{key: value}`.

Weitere Eigenschaften und [Methoden](https://www.w3schools.com/python/python_dictionaries_methods.asp) von Dictionaries können z.B. [hier](https://www.w3schools.com/python/python_dictionaries.asp) entnommen werden.


#### 4.3. Tuple

Tuple sind ähnlich zur Liste und enthalten Werte. Anders als die Liste kann dem Tuple kein Element mehr hinzugefügt werden, da es unveränderbar ist. Außerdem können die in ihr enthaltenen Elemente nicht mehr verändert werden. Tuples haben nur die folgenden zwei Methoden:

- count( ): zeigt wie viele Werte im entsprechenden Tuple enthalten sind
- index( ): erwartet einen Wert und sucht die Stelle im Tuple raus an der dieser steht

Definierung erfolgt mit `()` klammern

Weitere Informationen zu Tuples können z.B. [hier](https://www.w3schools.com/python/python_tuples.asp) entnommen werden.

#### 4.4. Set

Sets sind ungeordnete Sammlungen an Werten, die *keine* Indizes haben. Zwar können im Set bereits enthaltene Werte nicht geändert werden, allerdings können neue, weitere Elemente hinzugefügt werden und auch wieder Elemente entfernt werden. Auch können Sets zusammengefügt werden. Sets können aber keine Duplikat Elemente enthalten. Wichtige Methoden sind z.B.:

- add( ): erwartet ein Element und fügt dieses ins Set ein
- update( ): erwartet ein Set oder Liste und combiniert dies mit den schon existierende Set
- remove( ): erwartet ein Element und dieses wird aus den Set entfernt 
- intersection( ): gibt ein Set zurück, das die gemeinsamen Elemente zweier Sets enthält
- issubset( ): zeigt, ob das Set ein Subset eines anderen ist 
- issuperset( ): zeigt, ob das Set ein Superset eines anderen ist

Definierung erfolgt mit `{}` klammern.

Weitere Eigenschaften und [Methoden](https://www.w3schools.com/python/python_sets_methods.asp) von Sets können z.B. [hier](https://www.w3schools.com/python/python_sets.asp) entnommen werden.


Im Folgenden werden alle Datenstrukturen und eine kurze Erklärung der darin enthaltenen Elemente gezeigt.

(Weitere Datenstrukturen wie beispielsweise (mehrdimensionale) Arrays, die in Sprachen wie Java beispielsweise direkt enthalten sind, werden in Python nur durch die Einbindung von Packages wie Numpy (siehe oben im import) möglich. Obwohl man mit Python-Listen auch alle Aufgaben eines Arrays übernehmen/ausführen kann und sie damit nicht absolut notwendig sind, kann es explizite Vorteile haben, weitere Datenstrukturen durch Packages einzubinden. Mehr dazu im nächsten Notebook.)

In [2]:
#Beispiel für eine Liste
numbers = [3,17,2,66,8,11,35,-2,1,57,9,28,45,14,91,62,3,34,90]

In [None]:
#Beispiel für ein Dictionary

#Einnahmen in mio. und Länge in min angegeben
movies = { 

    "The Dark Knight": [["Jahr", 2008], ["Einnahmen", 533.32],["Länge", 152], 
                        ["Genre", ("Action", "Crime","Drama")], ["Rating", 9.0]],
    "Inception": [["Jahr", 2010], ["Einnahmen", 292.57],["Länge", 148], 
                        ["Genre", ("Action", "Adventure","Sci-Fi")], ["Rating", 8.8]],
    "Dangal": [["Jahr", 2016], ["Einnahmen", 11.15],["Länge", 161], 
                        ["Genre", ("Action", "Biography","Drama")], ["Rating", 8.8]],
    "Interstellar": [["Jahr", 2014], ["Einnahmen", 187.99],["Länge", 169], 
                        ["Genre", ("Drama", "Adventure","Sci-Fi")], ["Rating", 8.6]],
    "Kimi no na wa": [["Jahr", 2016], ["Einnahmen", 4.68],["Länge", 106], 
                        ["Genre", ("Animation", "Drama","Fantasy")], ["Rating", 8.6]],
    "The Intouchables": [["Jahr", 2011], ["Einnahmen", 13.18],["Länge", 112], 
                        ["Genre", ("Biography", "Comedy","Drama")], ["Rating", 8.6]],
    "The Prestige": [["Jahr", 2006], ["Einnahmen", 53.08],["Länge", 130], 
                        ["Genre", ("Drama", "Mystery","Sci-Fi")], ["Rating", 8.5]],
    "The Departed": [["Jahr", 2006], ["Einnahmen", 132.37],["Länge", 151], 
                        ["Genre", ("Crime", "Drama","Thriller")], ["Rating", 8.5]],
    "The Dark Knight Rises": [["Jahr", 2012], ["Einnahmen", 448.13],["Länge", 164], 
                        ["Genre", ("Action", "Thriller")], ["Rating", 8.5]],
    "Whiplash": [["Jahr", 2014], ["Einnahmen", 13.09],["Länge", 107], 
                        ["Genre", ("Drama", "Music")], ["Rating", 8.5]]

}

In [None]:
# Beispiel um mit get() die Information einer bestimmte Film heraus zu hohlen
# get the info on a particular movie using get()
movies.get("Whiplash")

### 5. Funktionen

Funktionen gruppieren (zusammengehörige) Anweisungen, damit man sie sinnhaft abtrennt, mehrmals im Programm verwenden kann und leicht austauschbar macht. Funktionen können (fast) beliebig viele Parameter haben, also Elemente mit denen sie aufgerufen werden. Es können null Parameter von einer Funktion erwartet werden, oder verschieden viele von denen auch alle oder einige optional sein können. Sind optionale Parameter vorhanden, werden diese, sollten keine expliziten Werte hierfür beim Aufruf der Funktion übergeben werden, default Werte genutzt, die in der Funktion definiert sein müssen. 

In Python werden Funktionen über `def` gefolgt vom Funktionsnamen sowie entsprechenden Parametern in Klammern kenntlich gemacht. Ein Beispiel hierfür kann unten entnommen werden. Meistens (nicht immer) hat eine Funktion außerdem ein Rückgabewert, der nach den Operationen in der Methode zurückgegeben wird.

#### 5.1. Funktionsvariationen 

Im Folgenden werden verschiedene Variationen von Funktionen sowie die Syntax mit der man sie aufstellt anhand von Beispielfunktionen präsentiert. Diese zeigen außerdem welche Parameter erwartet und übergeben werden. 

In [3]:
#Methodenname = statement
#Parameter = keine
def statement():
    print("Printing a statement.")
#hier gibt es keinen return

In [4]:
statement()

Printing a statement.


In [None]:
#Methodenname = add
#Parameter = x und y (beide müssen übergeben werden)
def add(x, y):
    
    #Rückgabewert = Summe der übergebenen Werte
    return x + y

In [None]:
print(add(2, 9))

In [None]:
#Methodenname = subtract
#Parameter = x und y (y ist optional)
#wird kein Wert für y angegeben wird hier z.B. by default 5 abgezogen von der übergebenen Zahl
def subtract(x, y=5):

    #Rückgabewert = Differenz der übergebenen Werte
    return x - y

In [None]:
print("First result = ", subtract(10,9))
print("Second result = ", subtract(10))

#### 5.2. Built-in Functions

Bei Built-in Functions handelt es sich um Funktionen, die schon vorimplementiert sind und direkt in Python ausgeführt werden können. Diese Methoden erfüllen ganz bestimmte Aufgaben und benötigen entsprechende Parameter. Im folgenden werden einige der (sehr) nützlichen und oft verwendeten Build-in Functions mit ihren jeweiligen Aufgaben gelistet. Für zusätzliche Informationen zu den Funktionen können wie immer die interaktive Dokumentation aufgerufen werden oder [hier](https://docs.python.org/3/library/functions.html) entnommen werden. 


- print( ): Zeigt übergebenen Wert an. Sollen Strings angezeigt werden müssen " oder ' um die entsprechenden Zeichen gesetzt werden; ansonsten können beispielsweise auch Variablenwerte oder Rückgaben von Funktionen ausgegeben und angezeigt werden.

- len( ): Gibt die Länge des übergebenen Elements zurück. Kann also z.B. die Länge einer Liste anzeigen.

- shape( ): Gibt die Form des übergebenen Elements zurück. Kann also z.B. die Dimensionen eines Arrays anzeigen.

- range(start, **stop**, [step]): generiert quasi eine Liste an Zahlen, die bis zum angebenenen stop-Wert geht. Diese Liste wird am häufigsten genutzt um die Schritte in einer `for` Schleife durchzuiterieren. Der **fette** Wert `stop` ist ein Parameter der übergeben werden *muss*; die anderen wie der Startwert und die Schrittgröße steps sind optional. Wird für `start` kein Wert übergeben wird der default Wert 0 genutzt um die Zahlenliste zu beginnen; wird für `step` kein Wert übergeben, wird die jeweilige Zahl um 1 erhöht. Will man das die Zahlenliste anders beginnt oder in anderen Schrittgrößen hochgezählt wird, kann man dies über diese beiden Parameter anpassen. Ansonsten führt der Aufruf `range(5)` z.B. zu der folgenden Liste: [0,1,2,3,4] und kann genutzt werden um z.B. eine `for` Schleife 5 mal zu durchlaufen. ***Anmerkung:*** wird `range( )` mit z.B. eine 5 als Stopwert übergeben, ist die 5 selbst *nicht* enthalten!

In [None]:
# gibt die Lenge des oben definierte Liste numbers
print(len(numbers))

### 6. Bedingungen

Bedingungen können bestimmte Fälle abfangen und Methoden(teile) unter bestimmte Umständen ausführen. So können z.B. logische Bedingungen abgefragt werden wie auch Verhältnisse oder Gleichheit. Dies kann über `if` und über das erweiterte `elif`, `else` Konstrukt erreicht werden. Mit `if` alleine kann man beispielsweise prüfen, ob eine Zahl größer als eine andere ist und dann die entsprechenden Anweisungen dazu ausführen. wird noch `else` hinzugefügt, wird der gegenteilige Fall ebenfalls mit einer anderen Anweisung abgefangen. Soll noch eine oder mehrere weitere Bedingungen abgefragt werden, können über diese über `elif` eingefügt werden. 

***Anmerkung:*** Die Werte boolscher Aussagenvariablen, die häufig für Bedingungen benötigt werden, müssen in Python groß geschrieben werden, also entweder `True` oder `False`.

In [None]:
def isbigger(x,y):
    
    if x > y:
        return True
    else: 
        return False

In [None]:
print("10 is bigger than 11? This is: ", isbigger(10,11))
print("10 is bigger than 7? This is: ", isbigger(10,7))

### 7. Schleifen

Um Operationen mehrfach auszuführen, sind Schleifen nötig. In Python gibt es zwei Typen von Schleifen. Eine ist die `for` Schleife und die `while` Schleife.
Im Folgenden werden diese Variationen von Schleifen sowie die Syntax mit der man sie aufstellt anhand von Beispielen gezeigt.

**7.1. for - Schleifen**

`for` Schleifen in Python benötigen die Angabe einer Variable, die innerhalb eines Werte Bereichs (`range`) ist und in einer gewissen Schrittgröße voran schreiten kann. `for` Schleifen kann man nutzen um durch alle/bestimmte Elemente eines Arrays, einer Liste, usw. zu iterieren und die einzelnen Elemente zu nutzen um Befehle auf diesen auszuführen.

In [None]:
#Beispiel für eine Liste
numbers = [3,17,2,66,8,11,35,-2,1,57,9,28,45,14,91,62,3,34,90]
print(numbers)

In [None]:
def squared(list_numbers):
    
    #start = 0, stop = 19 (hier Länge list_numbers bekannt; alternativ und besser len(list_numbers)), stepsize = 2
    #stepsize 2 bedeutet das nur jedes zweite Element quadriert wird
    #ist keine stepsize definiert wird der default Wert immer auf 1 gesetzt
    for i in range(0,19,2):
        list_numbers[i] = list_numbers[i]*list_numbers[i]
        
    return list_numbers

In [None]:
print(squared(numbers))

In [None]:
print(numbers)

**7.2. while - Schleifen**

`while` hingegen führt die in ihr enthaltenen Befehle aus solange eine bestimmte Bedingung erfüllt ist. Ist die geprüfte Bedingung nach einer bestimmten Anzahl an Schritten nicht mehr `True`, so wird die Schleife beendet.
Diese Art von Schleife kann genutzt werden, wenn z.B. nicht klar ist, wie viele Schritte benötigt werden bis das Ziel erreicht ist.

In [None]:
def biggerList(list_numbers):
    
    while len(list_numbers) <= 25:
        list_numbers.append(np.random.randint(3,10))

In [None]:
biggerList(numbers)
print(numbers)
print(len(numbers))

### Beispiel 

Im Beispiel aus dem letzten Notebook, sind die oben genannten Aspekte und Konzepte enthalten. Es ist hier nochmal gezeigt und kommentiert.

In [None]:
def searchMax(input_numbers):
    
    #lokale Variable (kann nicht außerhalb der Methode aufgerufen werden - siehe nächste Zelle)
    max_value = input_numbers[0]
    
    #for Schleife die mit 0 beginnt und bis Länge von input_numbers durch die Elemente in input_numbers iteriert
    for i in range(len(input_numbers)):
        
        #Bedingung vergleicht ob das aktuelle Element in input_numbers größer ist als der bisherige Maximalwert
        if max_value < input_numbers[i]:
            #wenn das der Fall ist wird der Maximalwert nun auf diese neue Zahl gesetzt 
            max_value = input_numbers[i]
            
        #das if Statement braucht hier kein elif oder else Statement
            
    return max_value

In [None]:
print(searchMax(numbers))

### Aufgabe 1

Schreibt eine Funktion, die eine gegebene Einheit und die entsprechende Gradzahl in eine andere Einheit umwandelt. Hier geht es spezifisch um eine Umrechnung von Celsius zu Fahrenheit und andersherum. 
Die Umrechnungsregeln, die genutzt werden, sind die folgenden:


$$ °C = \frac{(°F − 32)}{1.8} $$

$$ °F = °C * 1.8 + 32 $$

### Aufgabe 2

Schreibt eine Funktion, welche die Fakultät einer übergebenen Zahl berechnet. 

### Aufgabe 3

Im Dictionary `movies` sind die 10 Filme mit den höchsten Ratings auf imdb aus den Jahren 2006 bis 2016 enthalten (Stand: 2017). Jeder Titel ist als Key zufinden und zu jedem Film sind weitere zusätzliche Informationen in diesem Dictionary enthalten. Die folgenden Teilaufgaben beziehen sich auf die Informationen in diesem Dictionary.

**3.1. Erscheinungsjahre**

Schreibt eine Methode, welche die Filme nach Erscheinungsjahren aufsteigend sortiert (ältester Film zu erst, neuester Film zuletzt) und gibt den Filmtitel sowie das Erscheinungsjahr aus. 

**3.2. Sortierung**

Erweitert die obere Methode so, dass ihr auch aufsteigend nach Einnahmen und Ratings sortieren könnt.

**3.3. Genres**

Schreibt eine Methode, welche ausgibt welche Genres enthalten sind und wie häufig diese vorkommen. Diese sollen nach Häufigkeit sortiert und mit der jeweiligen Häufigkeit zurückgegeben werden.

**3.4. Ratings**

Schreibt eine Methode, welche das Durchschnittsrating aller im Dictionary enthaltenen Filme zurückgibt.

**3.5. Aufteilung**

Schreibt eine Methode, die in zwei Listen alle Filme, die vor 2010 erschienen sind zeigt und eine, die die restlichen Filme beinhaltet. 