# Python Grundlagen 2

## Lernziele
* Bedingungen verwenden, um den Programmverlauf zu beeinflussen.
* Funktionen einsetzen und definieren.
* Mit expliziten Rückgabewerten und Default Parametern von Funktionen arbeiten können.
* Docstrings verwenden, um die Funktionsweise von Funktionen zu erklären bzw. erklärt zu bekommen.

## Bedingungen

Im Programmablauf müssen oft abhängig von bestimmten Zuständen (also z.B. dem aktuellen Wert einer Variablen) Abzweigungen genommenen werden. Dies wird über *Bedingungen* realisiert.

Das Programm prüft vor eine solchen "Abzweigung" ob eine Bedingung wahr oder falsch ist, und nimmt dann entweder den einen Weg oder den anderen.


![Bedingung](https://drive.google.com/uc?id=1bdvEvkfNEb2QdoWe3cCfLteAPcGWoLJ5)

Stellen wir uns vor, wir programmieren einen Bankomaten:

~~~
# Dieses Beispiel verwendet Pseudocode

abzuhebender_betrag = input('Wieviel wollen Sie abheben? ')

WENN kontostand - abzuhebender_betrag > ueberziehungsrahmen:
    Geld auszahlen   
SONST
    Fehlermeldung: Ihr Kontostand reicht nicht aus
~~~

Die allgemeine Form einer Bedingung in Python (und den meisten höheren Programmiersprachen) sieht so aus:

~~~
if BEDINGUNG == True:
    tue das eine
else:  # BEDINGUNG war nicht True
    tue etwas anderes
~~~

Wobei `else` weggelassen werden kann.

In [None]:
# Hier erstellen wir uns einen "Datensatz" - eine Liste von 100 Namen
# Einfacher wäre es, diesen Datensatz aus einer Datei einzulesen. Wie das geht,
# wird im nächsten Kapitel erklärt.
namen = [
    "Astrid", "Ines", "Christoph", "Markus", "Çınar", "Đželila", "Niklas",
    "Anna", "Stefanie", "Raphael", "Anna-Lena", "Silvia", "Julian", "Simon",
    "Katharina", "Michael", "Dominik", "Maria", "Kevin", "Bianca", "Thomas",
    "Nora", "Manuel", "Selina", "Gabriel", "Daniel", "Thomas", "Nina", "Michael",
    "Fabio", "Theresa", "Manuel", "Carina", "Philipp", "Lukas", "Wolfgang",
    "Anna", "Doris", "Thomas", "Muhammed", "Christoph", "Lisa-Marie", "Jessica",
    "Maria", "Thomas", "Florian", "Martin", "Anna", "Oliver", "Gregor", "Helmut",
    "Florian", "Matteo", "David", "Marlene", "Vanessa", "Lea", "Jan", "Béla",
    "Verena", "Manuel", "Björn", "Tobias", "Denise", "Emma", "Lukas", "Sarah",
    "Oliver", "Janine", "Manuel", "Georg", "Lorenz", "Verena", "Caroline",
    "Laura", "Felix", "Simon", "Lea", "Peter", "Sandra", "Julia", "Sophie",
    "Jacqueline", "Nina", "Sebastian", "David", "Matthias", "Patrick", "Selina",
    "Fabian", "Daniel", "Sabine", "Josef", "Lisa", "Carina", "Florian", "Fabian",
    "Viktoria", "Christoph", "Emilia"
]

### if

Ermitteln wir nun als Beispiel alle Namen aus unserer Liste mit Namen, die länger als 8 Zeichen sind:



In [None]:
# Hinweis: die len() Funktion gibt die Anzahl der Zeichen in einem Namen zurück
for name in namen:
    if len(name) > 8:
        print(name)

Christoph
Anna-Lena
Katharina
Christoph
Lisa-Marie
Jacqueline
Sebastian
Christoph


### if ... else

Mit `else` können wir alle Fälle behandeln, die nicht die bei if gestellte Bedingung erfüllen. Im folgenden `else`-Abschnitt wollen wir zählen, wie viele Namen kürzer oder gleich 8 Zeichen sind:

In [None]:
# wir definieren zwei Variablen, in denen wir jeweils die Anzahl der kurzen
# und langen Namen speichern
anzahl_kurze_namen = 0
anzahl_lange_namen = 0

# wir iterieren durch alle Namen in der Liste und erhöhen die in der jeweiligen
# Variablen gespeicherten Anzahl um 1, wenn wir einen Namen finden, der der
# entsprechende Bedingung entspricht.
for name in namen:
    if len(name) > 8:
        anzahl_lange_namen = anzahl_lange_namen + 1
    else:
        anzahl_kurze_namen = anzahl_kurze_namen + 1

# am Ende geben wir einmal die Anzahl der kurzen und Langen Namen aus
print(f"{anzahl_kurze_namen} kurze Namen und {anzahl_lange_namen} lange Namen")

92 kurze Namen und 8 lange Namen


### Unterbedingungen

If-Bedingungen können verschachtelt werden:

In [None]:
anzahl_kurze_namen = 0
anzahl_mittlere_namen = 0
anzahl_lange_namen = 0

for name in namen:
    # Name ist länger als 8 Zeichen
    if len(name) > 8:
        anzahl_lange_namen = anzahl_lange_namen + 1
    # Name ist kürzer als 9 Zeichen
    else:
        if len(name) < 5:
            anzahl_kurze_namen = anzahl_kurze_namen + 1
        # hier zählen wir Namen mit Länge >= 5 (wegen dem zweiten "if")
        # und Länge <= 8 (wegen dem ersten "if")
        else:
            anzahl_mittlere_namen = anzahl_mittlere_namen + 1
print(f'{anzahl_kurze_namen} kurze Namen, {anzahl_mittlere_namen} mittellange und {anzahl_lange_namen} lange Namen')

13 kurze Namen, 79 mittellange und 8 lange Namen


### if ... elif ... else

In Python können solche verschachtelten Bedingungen oft vermieden werden, indem man `elif` verwendet. Python geht so lange durch die Abfolge an Bedingungen, bis die erste als `True` evaluiert wird. Alle darunter stehenden `elifs` und das `else` werden dann ignoriert:

In [None]:
anzahl_kurze_namen = 0
anzahl_mittlere_namen = 0
anzahl_lange_namen = 0

for name in namen:
    if len(name) > 8:
        anzahl_lange_namen = anzahl_lange_namen + 1
    elif len(name) < 5:
        anzahl_kurze_namen = anzahl_kurze_namen + 1
    else:
        anzahl_mittlere_namen = anzahl_mittlere_namen + 1

print(f'{anzahl_lange_namen} kurze Namen, {anzahl_kurze_namen} mittellange und {anzahl_mittlere_namen} lange Namen')

8 kurze Namen, 13 mittellange und 79 lange Namen


<font color='blue'><b>Übung Bedingungen - 1</b></font>  
<font color='blue'>Gehen Sie im Kopf Schritt für Schritt durch, was im oben stehenden Code passiert. Verwenden Sie dazu diese Namen:</font>
<pre>
    ['Christopher', 'Anna', 'Elena']
</pre>



Bei der Verwendung von elif ist zu beachten, dass Python, sobald es auf die erste `wahr` erkannte Bedingung stößt, keine weitere Bedingungen mehr prüft. Man muss hier also auf die korrekte Reihenfolge der `if` und `elif` statements achten:

In [None]:
zahl = 40
if zahl < 100:
    print('zahl ist kleiner als 100')
elif zahl < 50:
  print('zahl ist kleiner als 50')


Obwohl die Bedingung beim `elif` `True` liefert, wird der entsprechende Text nicht ausgegeben, weil zuvor bereits eine andere Bedingung wahr war. Das zu übersehen, ist ein häufiger Fehler.

### Der in-Operator
In der Liste `namen` kommen manche Namen mehrfach vor. Je nach Fragestellung kann das erwünscht sein oder auch nicht. Versuchen wir einmal, doppelt vorkommende Namen zu verhindern. Dazu müssen wir einen neuen Operator einführen,
der testet, ob ein Wert in einer Sequenz vorhanden ist: `in`.

In [None]:
'a' in 'Anakonda'

True

`in` funktioniert mit allen Sequenztypen. Da Listen zu den Sequenztypen gehören, funktioniert der 'in'-Operator auch mit Listen. Hier prüfen wir, ob der Integer `42` in einer Liste vorkommt:

In [None]:
42 in [1, 55, 44, 32, 71, 41]

False

Im nächsten Beispiel verwenden wir den `in` Operator, um zu prüfen, ob der Name bereits in einer Liste einzigartiger Namen erscheint:

In [None]:
einzigartige_namen = []

for name in namen:
    if name in einzigartige_namen:
        pass  # tue nichts  # tue nichts
    else:
        einzigartige_namen.append(name)
print(f'Liste namen: {len(namen)} Einträgen, Liste einzigartige_namen: {len(einzigartige_namen)} Einträge')

Liste namen: 100 Einträgen, Liste einzigartige_namen: 75 Einträge


Das `pass` in der vierten Zeile dieses Beispiels ist eine Besonderheit von Python. Nach einem Doppelpunkt (``if name in einzigartige_namen:``) muss mindestens eine Anweisung stehen. Im konkreten Fall unseres Beispiels ist nichts zu tun, wenn der Name bereits in `einzigartige_namen` vorhanden ist. Wegen des Doppelpunktes in der Zeile davor muss hier aber etwas stehen. Genau aus diesem Grund gibt es in Python die `pass`-Anweisung. Sie ist das Equivalent zu einem Paar geschwungener Klammern ohne Inhalt in anderen Programmiersprachen:

~~~
if(Bedingung) {
}
~~~

<font color='blue'><b>Übung Bedingungen - 2</b></font>  
<font color='blue'>Verändern Sie das obenstehende Programm so, dass es überprüft, ob der Buchstabe "j" in einem Namen vorkommt und alle Namen mit dem Buchstaben "j" in einer Liste speichert.</font>

Wenn wir statt `in` die umgekehrte Bedingung `not in` verwenden, können wir im Beispiel oben auf das `else` verzichten:

In [None]:
einzigartige_namen = []
for name in namen:
    if name not in einzigartige_namen:
        einzigartige_namen.append(name)
print(f'Liste namen: {len(namen)} Einträgen, Liste einzigartige_namen: {len(einzigartige_namen)} Einträge')

## Funktionen

Funktionen sind "Unterprogramme", die aus dem Hauptprogramm heraus aufgerufen werden. Die Vorteile der Verwendung von Funktionen sind:

* Funktionen gliedern den Code und machen ihn so besser verständlich.
* Funktionen sind wiederverwendbar: Eine einmal geschriebene Funktion kann in einem Programm mehrfach an unterschiedlichen Stellen aufgerufen werden. Grundsätzlich kann man eine einmal geschrieben Funktion auch in anderen Programmen "recyclen".
* Funktionen verhindern Redundanz: Jede Funktionalität steht nur einmal im Programm. Das Programm wird dadurch leichter wartbar und die Fehleranfälligkeit wird reduziert.

Eine Funktion erkennen wir an ihrem Namen, gefolgt von runden Klammern. Üblicherweise wird die Funktion *auf ein Objekt angewandt*. Den Namen des Objektes geben wir in den Klammern an. Dies wird auch das *Argument* der Funktion genannt.

In [None]:
# hier wenden wir die Funktion "len()" auf das Objekt "liste" an.
liste = [1, 2, 3, 4]
len(liste)

4


Wir haben im Verlauf des Kurses schon einige Funktionen kennen gelernt.
* `print()` – gibt einen String aus
* `type()` – gibt den Typ eines Objektes zurück
* `len()` – gibt die Länge eines Objektes zurück


Dabei wird jeweils eine Funktion aufgerufen, die freundlicherweise bereits jemand anderes für uns geschrieben hat, und die in jeder Python-Installation zur Verfügung steht. Wir können aber auch selbst neue Funktionen definieren.

### Eine Funktion schreiben

Eine Funktionsdefinition beginnt in Python mit dem Schlüsselwort `def` (Viele andere Sprachen verwenden statt dessen `function`). Nach dem `def` folgt der Name der Funktion. Dieser sollte idealerweise ein Verb sein, da eine Funktion immer etwas tut. Der Name der Funktion wird durch ein Paar runde Klammern und einen Doppelpunkt abgeschlossen. Danach folgt eingerückt der eigentliche *Funktionskörper*, in dem festgelegt ist, was die Funktion tut.

In [None]:
def sag_hallo():
    print('Hallo!')

Damit haben wir eine Funktion mit dem Namen `sag_hallo` geschrieben. Die Funktion wurde bei Ausführung zwar erzeugt – unser Notebook weiß jetzt, dass sie existiert – sie tut aber noch nichts, da wir sie noch nicht aufgerufen haben. Der Aufruf der Funktion sieht so aus:

In [None]:
sag_hallo()

### Funktionsparameter

Die gerade geschriebene Funktion `sag_hallo()` stellt nur die Minimalversion einer Funktion dar: Sie tut immer dasselbe. Wir können die Funktion flexibler machen, indem wir ihr bei der Definition **Parameter** zuweisen:

In [None]:
def sag_hallo(name):
    print(f'Hallo {name}!')

Hier legt die Definition der Funktion fest, dass der Funktion beim Aufruf ein *Parameter*, also ein Wert übergeben werden muss, der dann innerhalb der Funktion als  Variable `name` verfügbar ist. Wir können diesen Wert beim Aufruf der Funktion als *Argument* übergeben:

In [None]:
sag_hallo('Otto')

Hallo Otto!


In [None]:
sag_hallo('Anna')

Hallo Anna!


### Rückgabewerte

Jede Funktion gibt beim Aufruf einen Wert zurück. Dieser zurückgegeben Wert ersetzt quasi den Funktionsaufruf.

Der Rückgabewert wird mit der ``return``  Anweisung festgelegt und sollte immer am Ende des *Funktionskörpers* stehen.

In [6]:
# definiere eine Funktion, die eine Zahl als Parameter nimmt und
# das Quadrat der Zahl ausgibt.
def quadrieren(zahl):
    return zahl * zahl

In [None]:
quadrieren(2) + quadrieren(3)  # 4 + 9

13

Wird keine ``return``-Wert explizit festgelegt, ist der Rückgabewert immer ``None``, also der "nicht"-Wert. Hier ein Beispiel, das diesen nicht explizit angegebenen Rückgabewert verdeutlicht:

In [None]:
def sag_hallo(name):
    print(f'Hallo {name}!')

In [None]:
rueckgabewert = sag_hallo('Otto')  # speichert den Rückgabewert in einer Variablen
print(f'Rückgabewert: {rueckgabewert}')

<font color='blue'><b>Übung Funktionen - 1</b></font>  
<font color='blue'>Verändern Sie die Funktion <tt>sag_hallo()</tt> so, dass sie die Variable <tt>name</tt> nicht nur ausgibt sondern auch zurückgibt.</font>

### Explizite Rückgabewerte


Explizite Rückgabewerte sind immer dann sinnvoll, wenn eine Funktion z.B. etwas berechnet und das Resultat der Berechnung im Hauptprogramm verwendet werden soll.

Die folgende Funktion transformatiert den übergebenen String so, dass nur das erste und letzte Zeichen zurückgegeben werden. Zwischen diesen beiden Zeichen steht der Zahl der ausgelassenen Zeichen. `abcd` wird also zu `a2d`.

In [None]:
def kuerzen(langer_string):
    # nur hilfreich für Strings mit > 2 Buchstaben
    if len(langer_string) > 2:

        # gib den ersten (langer_string[0]) und letzten Buchstaben
        # (langer_string[-1]) zurück und dazwischen die
        # Anzahl ( len(langer_string) - 2 ) der gekürzten Buchstaben
        rueckgabewert = f"{langer_string[0]}{len(langer_string) - 2}{langer_string[-1]}"

    # ist der String ohnehin kurz, geben wir einfach den string selbst zurück
    else:
        rueckgabewert = langer_string
    return rueckgabewert

In [None]:
kuerzen("Christopher")

'C9r'

**Hinweis**: hier haben wir auf einzelne Elemente im String zugegriffen, mit Hilfe der Index-Notation mit eckigen Klammern <tt>[index]</tt> die wir im [letzten Kurs](https://colab.research.google.com/drive/16jp0vxpbKs_0KXr9NUd8MLdnNdUWLocp?usp=sharing#scrollTo=T3WGxNFwv1Ok) im Kapitel "Listen" &rarr; "Einzelne Elemente addressieren" besprochen haben.

<font color='blue'><b>Übung Funktionen - 2</b></font>  
<font color='blue'>Schreiben Sie eine Funktion, die eine Liste mit Zahlen als ein einzelnes Argument erhält und die Summe der Quadrate der Zahlen zurückgibt. Testen Sie die Funktion mit verschiedenen Listen, die Zahlen enthalten.</font>



### Funktionen mit mehreren Parametern

Grundsätzlich kann eine Funktion beliebig viele Parameter haben. In der Praxis sollte man sich, außer man hat sehr gute Gründe, auf maximal 3 oder 4 Parameter beschränken, weil das die Verwendbarkeit (sprich: Verständlichkeit) erleichtert.

Im folgenen Beispiel berechnen wir das Volumen von einem Quader:

In [None]:
def berechne_volumen(laenge, breite, hoehe):
  """Berechnet das Volumen in einem Quader.

  Argumente
    laenge:   laenge in m
    breite:   breite in m
    hoehe:    hoehe in m

  Returns
    vol:      volumen in m³
  """

  vol = laenge * breite * hoehe
  return vol

In [None]:
berechne_volumen(0.8, 0.4, 0.4)

0.12800000000000003

### Docstrings
In der Definition der Funktion oben haben wir zum ersten Mal einen sogenannten "Docstring" gesehen. Damit wird üblicherweise die Funktionsweise von Funktionen detailliert beschrieben. Was die Funktion tut, welche Datentypen sie als Eingabeparameter erwartet und was sie ausgibt.

Ein Docstring ist ein String, der sich über mehrere Zeilen erstreckt. Er wird mit drei Anführungszeichen <tt>"""</tt> eingeleitet und beendet.  

Wir können uns die Docstrings von Funktionen mit der Hilfe-Funktion anzeigen lassen:

In [None]:
?berechne_volumen

### Default Parameter

Normalerweise muss die Reihenfolge der Argumente beim Aufruf der Funktion der Reihenfolge der Parameter in der Funktionsdeklaration entsprechen und es müssen auch alle Argumente mitgegeben werden:

~~~
def set_userdata(username, age):
    ...
    
set_userdata('otto', 20)    
~~~

Werden beim Funktionsaufruf nicht alle Parameter belegt, führt das zu einem Fehler:

In [None]:
def setze_nutzerdaten(name, alter):
    return name, alter

In [None]:
setze_nutzerdaten('Hans')

Falls wir einen Parameter nicht zwingend erwarten, können wir für diesen einen Defaultwert festlegen:

In [None]:
def setze_nutzerdaten(name, alter=None):
    return name, alter

**Hinweis**: In den meisten Programmiersprachen können Funktionen nur einen Wert zurückliefern. In Python können aber (wie in der Funktion oben) direkt zwei oder mehr Werte zurückgeliefert werden.

In [None]:
print(setze_nutzerdaten('otto', 20))
print(setze_nutzerdaten('anna'))

Wenn der Wert mitgegeben wird, wird er in der Funktion verwendet, andernfalls wird der Defaultwert verwendet. Solche vorbelegten Parameter müssen **nach** allen anderen Parametern stehen, weshalb der folgende Code nicht funktioniert.

In [None]:
def setze_nutzerdaten(alter=None, name):
    return name, alter

Wenn mehr als ein Default Parameter definiert wird, können beim Aufruf der Funktion einzelne Argumente mit ihren Namen addressieren ("keyword arguments"), wodurch wir uns nicht mehr an die gegebene Reihenfolge halten müssen:

In [None]:
def setze_nutzerdaten(name, alter=None, gewicht=None, groesse=None):
    return name, alter, gewicht, groesse

In [None]:
print(setze_nutzerdaten('Otto', groesse=181))
print(setze_nutzerdaten('Otto', groesse=181, alter=25))

Das ist ein Muster, das wir noch sehr oft sehen werden: beim maschinellen Lernen werden wir oft Funktionen verwenden, die schon vordefiniert sind und die sehr viele Parameter besitzen. Sehr oft ändern wir davon nur ein paar wenige und lassen die anderen Parameter auf ihren Default Werten, die meist ohnehin schon sinnvoll festgelegt sind.

## Weiterführende Materialien

* **Bedingungen**: [Notebook zu Bedingungen](https://github.com/gvasold/gdp/blob/main/01-grundlagen/08-bedingungen.ipynb) aus dem Kurs "Grundlagen der Programmierung".
* **Funktionen - Basics**: [Notebook zu Funktionen](https://github.com/gvasold/gdp/blob/main/02-funktionen-module-venvs/01-funktionen_basics.ipynb) aus dem Kurs "Grundlagen der Programmierung".
* **Funktionen - Scopes**: [Notebook zum Gültigkeitsbereich von Variablennamen](http://localhost:8888/lab/tree/modul_B/gdp-main/02-funktionen-module-venvs/02-funktionen_scopes.ipynb) aus dem Kurs "Grundlagen der Programmierung".

## Quelle und Lizenz

Das vorliegende Notebook besteht zu weiten Teilen aus inhalten des Kurses [Grundlagen der Programmierung](https://github.com/gvasold/gdp/tree/main) von [Gunter Vasold](https://online.uni-graz.at/kfu_online/visitenkarte.show_vcard?pPersonenGruppe=3&pPersonenId=036149BE966ADC08). Modifikationen wurden von Jana Lasser vorgenommen.

Das Notebook kann unter den Bedingungen der Lizenz [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0) verwendet, modifiziert und weiterverbreitet werden.

