<style>
body {
    font-size: 1.7em;
} 

.rendered_html h1 {
  font-size: 3.8em;
}

.rendered_html h2 {
  font-size: 2.2em;
}

.rendered_html h3 {
  font-size: 1.8em;
}

.rendered_html h4 {
  font-size: 1.4em;
}

div.slides {
width: 1920px;
height: 1080px;
}

.rendered_html table, .rendered_html th, .rendered_html tr, .rendered_html td {
     font-size: 100%;
}

</style>

# <font color="#BD1550">Analytics</font>
## Python Funktionen (& Methoden), Dictionaries, Module

-------
### Prof. Dr. Helena Mihaljević
#### WS 2019/20



# Funktionen




- Strukturierungselement, um Anweisungen zu gruppieren, damit man sie mehrmals im Programm verwenden kann
- reduziert Fehleranfälligkeit, erhöht Lesbarkeit

```python
def funktionsname(parameterliste):
      Anweisung(en)
```

In [1]:
def say_hello(name):
    return "Hello " + name

In [2]:
greeting = say_hello("Helena")
print(greeting)

Hello Helena


- `name` ist ein **Parameter** der Funktion `say_hello()`
- mehrere Parameter werden durch Kommata getrennt
- beim Aufruf werden Parameter als **Argumente** bezeichnet (hier: "Helena")
- der Funktionskörper (function body) wird **eingerückt** 

## optionale Parameter

- Parameter können **obligatorisch** und **optional** sein. In der Definition folgen optionale den obligatorischen
- optionale Parameter müssen beim Aufruf der Funktionen nicht gesetzt werden 
- wenn beim Aufruf nicht verwendet, wird ein default-Wert eingesetzt

In [3]:
def say_hello(name, surname=None):
    if surname is not None:
        return "Hello " + name + ' ' + surname
    else:
        return "Hello " + name

In [4]:
say_hello('Helena', 'Mihaljević')

'Hello Helena Mihaljević'

In [5]:
say_hello('Helena')

'Hello Helena'

## Keyword-Parameter (= Schlüsselwort Parameter; named parameters)

- ermöglicht, nur einen Teil der optionalen Parameter zu überschreiben

In [6]:
def sumsub(a, b, c=0, d=0):
    return a - b + c - d

In [7]:
print(sumsub(12,4))

8


In [8]:
print(sumsub(42,15,d=10))

17


In [9]:
# ohne Angabe des Schlüsselwort-Parameters
print(sumsub(42,15,0,10))

17


In [10]:
# folgendes geht nicht!!!
print(sumsub(d=10, 42,15))

SyntaxError: positional argument follows keyword argument (<ipython-input-10-8a56727e11b7>, line 2)

In [11]:
# Reihenfolge bei der Übergabe von Parametern egal, wenn alle als Schlüsselwort-parameter angegeben werden
print(sumsub(d=10,a=42,b=15))

17


## Rückgabewerte

- Der Funktionskörper kann keine, eine oder mehrere `return`-Anweisungen an beliebiger Stelle enthalten 
- Eine `return`-Anweisung beendet den Funktionsaufruf, und das Ergebnis des Ausdrucks, der hinter der `return`-Anweisung steht, wird an die aufrufende Stelle zurückgeliefert 
- Eine Funktion gibt **maximal ein Objekt** zurück
- Falls kein Ausdruck dem `return` folgt, wird `None` zurückgegeben 
- Falls der Funktionsaufruf das Ende des Funktionskörpers erreicht, ohne auf eine `return`-Anweisung gestoßen zu sein, endet der Funktionsaufruf und es wird `None` zurückgegeben

In [12]:
def my_special_sum(x, y):
    z = x + y + 5
    return z

In [13]:
res = my_special_sum(1,2)
print(res)

8


Das Rückgabe-Objekt kann aber **beliebig** sein, d.h. auch eine Liste oder ein Tupel.

Dadurch können wir auch **mehrere Werte** zurückgeben. 

In [14]:
def find_min_max(coll_of_orderables):
    min_item = coll_of_orderables[0]
    max_item = coll_of_orderables[0]
    
    for elem in coll_of_orderables:
        if elem > max_item:
            max_item = elem
        if elem < min_item:
            min_item = elem
            
    return [min_item, max_item]

In [15]:
find_min_max([3, -1, 5.56, 485, -100])

[-100, 485]

In [16]:
def find_min_max(coll_of_orderables):
    min_item = coll_of_orderables[0]
    max_item = coll_of_orderables[0]
    
    for elem in coll_of_orderables:
        if elem > max_item:
            max_item = elem
        if elem < min_item:
            min_item = elem
            
    return min_item, max_item

In [17]:
find_min_max([3, -1, 5.56, 485, -100])

(-100, 485)

In [18]:
type(find_min_max([3, -1, 5.56, 485, -100]))

tuple

## Docstring

- beschreibt, was die Funktion tut
- ist üblicherweise die erste Zeile im Funktionskörper, gesetzt in 3-fache Anführungszeichen
- bei einfachen Funktionen reicht ein Satz
- bei komplexeren sollten auch die Parameter und der Rückgabe-Wert beschrieben werden
- PEP-Standard: https://www.python.org/dev/peps/pep-0257/

In [19]:
def say_hello(name, surname=None):
    """Begrüßt eine Person mit Vor- und Nachnamen"""
    if surname is not None:
        return "Hello " + name + ' ' + surname
    else:
        return "Hello " + name

In [20]:
# Zugriff auf docstring
print(say_hello.__doc__)

Begrüßt eine Person mit Vor- und Nachnamen


## Exkurs: Funktion `print()` 

- Die Dokumentation der `print()` Funktion finden wir unter: https://docs.python.org/3/library/functions.html#print
- Die Funktion `print()` hat folgende Argumente:
    
```
print(value1, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
```

- kann **beliebig viele Parameter** annhemen und entsprechend beliebig viele Werte ausgeben: `("value1, value2, ...")` (lernen später, wie man solche eine Funktion definiert)
- Wir können konfigurieren, wie die Werte getrennt werden (`sep`) werden, wohin sie geschrieben werden (`file`) etc.

## Übung

(a) Schreiben SIe eine Funktion, welche eine Liste von Strings als Parameter erwartet und die Verknüpfung der Strings zu einem String als Rückgabewert hat, z.B. für das Argument `["hello", "world"]` würde die Funktion `"helloworld"` zurückgeben.

(b) Verändern Sie die Funktion nun so, dass zwischen den einzelnen Strings ein Leerzeichen eingesetzt wird. Für das obige Beispiel würden wir also `"hello world ` erhalten. (Zusatz: versuchen Sie, das letzte Leerzeichen loszuwerden).

(c) Verändern Sie nun die Signatur der Funktion so, dass der Verknüpfungsstring `' '` nun als Parameter gesetzt werden kann aber nicht muss. Das Leerzeichen soll der default-Wert bei diesem optionalen Parameter sein.


# Funktion vs. Methode

- Funktionen in Python können "frei" aufgerufen werden; sie bekommen Argumente übergeben und verarbeiten diese  (hoffentlich) 
- Methoden sind an **Klassen** gebunden
- Eine Methode wird innerhalb einer Klasse definiert
- Sie wird immer an einem Objekt dieser Klasse aufgerufen
- Eine Methode kann ein Objekt verändern; Funktionen sollten dies am besten nicht tun (stattdessen z.B. ein neues Objekt zurückgeben)
- Wir betrachten Objekt-Orientierte Programmierung (OOP) später; fürs erste reicht uns die Unterscheidung bei der Anwendung


## Beispiel: Funktionen und Methoden auf Listen

In [21]:
li = [1, -13, 23, 45, 7.5, -2]

In [22]:
# Funktion zum Sortieren
sorted_li = sorted(li)
sorted_li

[-13, -2, 1, 7.5, 23, 45]

In [23]:
li

[1, -13, 23, 45, 7.5, -2]

In [24]:
# List-Methode zum Sortieren
li.sort()
li

[-13, -2, 1, 7.5, 23, 45]

# Dictionary

- Konzept wird in anderen Sprachen auch als `Map`, `Hash` oder `Assoziatives Feld` implementiert
- Ein Dictionary besteht aus **ungeordneten Schlüssel-Objekt-Paaren** (=key-value pairs)
- Zu einem bestimmten Schlüssel gehört immer genau ein Objekt &#8594; **Schlüssel eindeutig**, Objekt nicht notwendigerweise
- Dictionaries können wie Listen leicht verändert werden
- Dictionaries sind sehr häufig in Python-Programmen

In [25]:
country_to_capital = {"Afghanistan": "Kabul", 
                      "Argentina": "Buenos Aires", 
                      "Belarus": "Minsk", 
                      "China": "Beijing", 
                      "Luxembourg": "Luxembourg"}

In [26]:
print(country_to_capital)

{'Afghanistan': 'Kabul', 'Argentina': 'Buenos Aires', 'Belarus': 'Minsk', 'China': 'Beijing', 'Luxembourg': 'Luxembourg'}


In [27]:
# Zugriff auf einen bestimmten Schlüsselwert mit eckigen Klammern
print(country_to_capital["Argentina"])

Buenos Aires


In [28]:
# füge ein neues Schlüssel-Objekt-Paar
country_to_capital["Germany"] = "Bonn"

In [29]:
print(country_to_capital)

{'Afghanistan': 'Kabul', 'Argentina': 'Buenos Aires', 'Belarus': 'Minsk', 'China': 'Beijing', 'Luxembourg': 'Luxembourg', 'Germany': 'Bonn'}


In [30]:
# ersetze ein Objekt durch ein anderes
country_to_capital["Germany"] = "Berlin"

In [31]:
print(country_to_capital)

{'Afghanistan': 'Kabul', 'Argentina': 'Buenos Aires', 'Belarus': 'Minsk', 'China': 'Beijing', 'Luxembourg': 'Luxembourg', 'Germany': 'Berlin'}


In [32]:
# Zugriff über einen nicht existierenden Schlüssel führt zu einem KeyError
print(country_to_capital["Denmark"])

KeyError: 'Denmark'

- **Schlüssel dürfen nur unveränderliche Datentypen sein (immutable)**
- insbesondere keine Listen und keine Dictionaries
- Tupel sind möglich, wenn die Elemente des Tupels ebenfalls unveränderlich sind

In [33]:
country_to_capital[["USA", "US", "United States"]] = "Washington, D.C."

TypeError: unhashable type: 'list'

## Methoden auf dictionaries

### `keys()`, `values()`, `items()`

In [34]:
country_to_capital.keys()

dict_keys(['Afghanistan', 'Argentina', 'Belarus', 'China', 'Luxembourg', 'Germany'])

In [35]:
country_to_capital.values()

dict_values(['Kabul', 'Buenos Aires', 'Minsk', 'Beijing', 'Luxembourg', 'Berlin'])

In [36]:
country_to_capital.items()

dict_items([('Afghanistan', 'Kabul'), ('Argentina', 'Buenos Aires'), ('Belarus', 'Minsk'), ('China', 'Beijing'), ('Luxembourg', 'Luxembourg'), ('Germany', 'Berlin')])

In [37]:
# konvertiere die items eines dictionaries in eine Liste von Tupeln
list(country_to_capital.items())

[('Afghanistan', 'Kabul'),
 ('Argentina', 'Buenos Aires'),
 ('Belarus', 'Minsk'),
 ('China', 'Beijing'),
 ('Luxembourg', 'Luxembourg'),
 ('Germany', 'Berlin')]

In [38]:
"Denmark" in country_to_capital.keys()

False

In [39]:
"Denmark" in country_to_capital

False

In [40]:
"Kabul" in country_to_capital.values()

True

### `get(k[,d])`

`dic.get(k)` liefert `dic[k]` zurück, falls `k` ein Schlüssel von `dic` und sonst `None` (default-Wert für optionalen Parameter `d`)

In [41]:
print(country_to_capital.get("Denmark"))

None


In [42]:
print(country_to_capital.get("Afghanistan"))

Kabul


In [43]:
print(country_to_capital.get("Denmark", "unknown"))

unknown


# Module

## Modulares Design

- zerlege ein komplexes Programm in logische Teilblöcke = Module
- Bibliotheken (= libraries): stellen Datentypen oder Funktionen für alle Python-Programme bereit
    - Standardbibliothek (built-in functions, types, constants, ...; sehr umfangreich; https://docs.python.org/3/library/) 
    - eigene Module
    - Module von Drittanbietern
- lokale Module: nur für ein lokales Programm verfügbar
- Module werden allgemein häufig als Bibliotheken (libraries) bezeichnet 

## Module einbinden

- Modul/Bibliothek muss installiert sein; wenn nicht, dann `pip install <module_name>` )oder über einen anderen Weg)
- Achtung: Installation innerhalb der virtuellen Umgebung 
- Danach kann man das Modul importieren und verwenden

## Aufgabe 1

#### Funktionen und Schleifen

(a) Schreiben Sie eine Funktion, welche eine Liste und eine Zahl als Inputparameter hat. Die Funktion gibt als Boolschen Wert zurück, ob die Zahl in der Liste enthalten ist. 

(b) Implementieren Sie die Funktion nun als binäre Suche, wobei der erste Inputparameter als geordnete Liste von Zahlen (von klein nach groß) vorausgesetzt wird.

(c) Fügen Sie der Funktionen einen Docstring hinzu.

## Aufgabe 2

#### Funktionen, Verzweigungen und Schleifen

(a) Schreiben Sie eine Funktion, welche drei Zahlen als Inputparameter erhält und die größte von ihnen zurückgibt.

(b) Schreiben Sie eine Funktion, welche eine Liste von Zahlen bekommt und die Summe der Elemente zurückgibt.

(c) Erweitern Sie die Funktion in (b), indem Sie beliebige Listen so verarbeiten, dass bei der Summenbildung nur die  Zahlen unter den Listenelementen berücksichtigt werden.
