# Funktionale Programmierung
Dan Bader  
https://realpython.com/lessons/functional-programming-course-overview/  

Funktionale Programmierung ist ein Programmierparadigma, der Nebenwirkungen vermeidet, indem Berechnungen mit der Bewertung von Funktionen durchgeführt werden und sich stark auf unveränderliche Datenstrukturen stützt.  
Mit diesem Programmierstil können Sie die Wahrscheinlichkeit von Fehlern reduzieren und sicherstellen, dass Ihre Programme einfacher zu warten sind.

Hauptsächlich werden unveränderliche Datenstrukturen verwendet und es wird versucht, Nebenwirkungen zu vermeiden, indem  alle unsere Berechnungen unter Verwendung der Bewertung mathematischer Funktionen durchgeführt werden.

**Lernziele**
- Gute Vorstellung davon haben, wie die Funktionen `filter()`, `map()`, und `reduce()` in Python verwendet werden können
- Den Bezug zu einem funktionalen Programmierstil erkennen
- Eine bessere Vorstellung der Funktionsweise von List Comprehensions und Generatorausdrücken und wie sie die genannten Funktionen ersetzen können


## Unveränderliche Datenstrukturen

**Beispieldatensatz Wissenschaftler**

| Name            | Field      | Born | Nobel Prize? |
|-----------------|------------|------|--------------|
| Ada Lovelace    | math       | 1815 | no           |
| Emmy Noether    | math       | 1882 | no           |
| Marie Curie     | physics    | 1867 | yes          |
| Tu Youyou       | physics    | 1930 | yes          |
| Ada Yonath      | chemistry  | 1939 | yes          |
| Vera Rubin      | astronomy  | 1928 | no           |
| Sally Ride      | physics    | 1951 | no           |

### Veränderliche Datenstrukturen: Listen und Dictionaries

In [None]:
# Dictionary
scientists = [
    {"name":"Ada Lovelace", "field":"math", "born":1815, "nobel": False},
    {"name":"Emmy Nöter", "field":"math", "born":1882, "nobel": False},
    ]
print(scientists)

In [None]:
scientists[0]["name"]="Ed Lovelace"
print(scientists)

### Unveränderliche Datenstruktur: namedtuple

Veränderliche Datenstrukture wie bspw. Listen haben die Eigenschaft, dass sie beliebig erweitert werden können, selbst ohne eine bestimmte inhaltliche Struktur zu wahren.   
Anstatt der Dictionary Datenstruktur wird das Collections-Modul importiert. Im nächsten Schritt wird ein Scientist-Objekt - es ist eine Klasse - mit der Funktion ```collection.namedtuple()``` erstellt.

In [None]:
import collections
Scientist = collections.namedtuple("Scientist",[
    "name",
    "field",
    "born",
    "nobel",
])
Scientist

In [None]:
Scientist(name="Ada Lovelace", field="math", born=1815, nobel=False) # Übergabe der Schlüsselwert-Argumente an den Konstruktor.

In [None]:
ada = Scientist(name="Ada Lovelace", field="math", born=1815, nobel = False)
ada.name # Zugriff auf das Attribut mit dem Punktoperator

In [None]:
# Fehler AttributError: can't set attribute
# Ein unveränderlicher Datensatz, wie hier in Form eines Tupels, kann nachträglich nicht geändert werden.
ada.field
ada.name = "Ed Lovelace"

### Gefahrenbereich: Vermischung von veränderlichen und unveränderlichen Datenstrukturen

In dieser Lektion werden Sie feststellen, dass die Verwendung einer Kombination aus veränderlichen und unveränderlichen Datenstrukturen immer noch zu Problemen führen kann.
Selbst wenn Sie eine unveränderliche Datenstruktur wie `namedtuple` verwenden, besteht weiterhin die Gefahr, dass Sie Ihren Datensatz ändern, wenn Sie Ihre unveränderlichen Datenstrukturen in mutierten Datenstrukturen wie Listen speichern.

In [None]:
# Liste von Wissenschaftlerinnen erstellen
scientists = [
 Scientist(name="Ada Lovelace", field="math", born=1815, nobel=False),
 Scientist(name="Emmy Nöter", field="math", born=1882, nobel=False)]    

**Pretty Print**

In [None]:
from pprint import pprint # pprint ist ein pretty-print Modul 
pprint(scientists)

In [None]:
# Fehler AttributError: can't set attribute
# Grund: Ein unveränderlicher Datensatz, wie hier in Form eines Tupels, kann nachträglich nicht geändert werden.
# Obwohl er in einem veränderlichen Datensatz, der Liste von Liste von Wissenschaftlerinnen, gespeichert ist.
scientists[0].name = "Ed Lovalace"

In [None]:
del scientists[0]
scientists


### Unveränderliche Datenstruktur: Tupel

In der vorherigen Lektion haben Sie Ihre unveränderlichen Datenstrukturen `namedtuple` in einer veränderlichen `list`gespeichert. Jetzt sehen Sie, wie Sie diese Liste durch ein Tupel ersetzen können, das wie eine Liste ist, aber unveränderlich:

In [None]:
scientists = (
    Scientist(name='Ada Lovelace', field='math', born=1815, nobel=False),
    Scientist(name='Emmy Noether', field='math', born=1882, nobel=False),
    Scientist(name='Marie Curie', field='physics', born=1867, nobel=True),
    Scientist(name='Tu Youyou', field='pharmaceutical chemist', born=1930, nobel=True),
    Scientist(name='Ada Yonath', field='chemistry', born=1939, nobel=True),
    Scientist(name='Vera Rubin', field='chemistry', born=1928, nobel=False),
    Scientist(name='Sally Ride', field='physics', born=1951, nobel=False),
)

In [None]:
pprint(scientists)

In [None]:
# Fehler: TypeError: 'tuple' object doesn't support item deletion
# Durch die gegebene Datenstruktur ist ein Löschen über den Index nicht mehr möglich
del scientists[0]

In [None]:
# Datenzugriff über Index ist möglich
scientists[0].name

Sie möchten mit einer soliden Datenstruktur beginnen, die im Idealfall unveränderlich ist. Es wäre möglich, veränderliche Dictionaries oder Listen zu verwendenönnten. Jedoch, so der Autor, sei es ein großer Vorteil, darüber nachzudenken, wie Sie Ihre Datenstrukturen unveränderlich halten können, wenn Sie versuchen, mit einem funktionalen Programmierstil zu arbeiten.

Durch die gezeigten Beispiele sollte der Nutzen deutlich gemacht werden. Es wird offensichtlicher, wenn wir die folgenden Beispiele durcharbeiten und die Grundlagen der Funktionalen Programmierung mit der `filter()`-Funktionm, der `map()`-Funktion und der `reduce()`-Funktion kennenlernen und wie diese einigen anderen Dingen entsprechen, die tatsächlich in Python integriert sind, wie z. B. List Comprehensions, vgl. https://docs.python.org/3/tutorial/datastructures.html?list-comprehensions#list-comprehensions

## Die `filter()`-Funktion

### Übersicht
**Verwendung: Transformieren von Datenstrukturen**

Die `filter()`-Funktion ist integriert in Python und verfügt möglicherweise über ein etwas kompliziertes Docstring.

Die Funktion gibt einen Iterator zurückgibt, der diejenigen Elemente enthält, für die `function(item)` wahr ist. Wenn diese Funktion ohne Objekt ist, also None, dann gibt der Filter die Elemente zurück, die wahr sind.

In [None]:
help() # filter

### Anwendungsbeispiel

Wir wollen eine `filter()`-Funktion schreiben, die alle Wissenschaftler in der verwendeten Liste ausgibt oder tatsächlich eine neue Liste von Wissenschaftlern ausgibt, die den Nobelpreis gewonnen haben.

In [None]:
filter(lambda x: x.nobel is True, scientists)

In [None]:
fs = filter(lambda x: x.nobel is True, scientists)

In [None]:
next(fs)

### Gefilterte Daten in ein Tupel speichern

In [None]:
tuple(filter(lambda x: x.nobel is True, scientists))

In [None]:
fs = tuple(filter(lambda x: x.nobel is True, scientists))

In [None]:
pprint(fs)

In [None]:
# Allgemeine Definition einer Filter-Funktion
pprint(tuple(filter(lambda x: True, scientists)))

In [None]:
# Strengere Filter
pprint(tuple(filter(lambda x: x.field == "physics", scientists)))

In [None]:
pprint(tuple(filter(lambda x: x.field == "physics" and x.nobel, scientists)))

### Nutzen der `filter()`-Funktion

**Alternative zur `filter()`-Funktion**

In [None]:
for x in scientists:
    if x.nobel is True:
        print(x)

Die `for`-Schleife liefert das gleiche Ergebnis wie die `filter()`-Funktion.  
Vorteil der `filter`-Funktion ist, dass eine einfache Verkettung von weiteren Filter-Kriterien möglich ist und diese Transformationen auf rein funktionale Weise angewendet werden kann.  

Wir iterieren über eine Liste, wir haben diese Nebenwirkungen, wir geben Werte aus.

Betrachten wir diese Anweisung:  

```python
pprint(tuple(filter(lambda x: x.field == "physics" and x.nobel, scientists)))
```

Hier werden schlicht einige Funktionen aufgerufen.  
In gewisser Weise erscheint diese komplizierter zu sein, als einfache Schleife zu verwenden, aber wirklich schöne daran ist ihre deklarative Eigenschaft.

**Erläuterung der `filter`-Anweisung**  
- Wir nehmen die Liste von
```python
scientists
```
- wenden die `filter`-Funktion an
```python
lambda x: x.field == "physics" and x.nobel
```
- stellen sicher, dass wir am Ende eine Liste haben. In diesem Fall die Datenstruktur Tupel
```python
tuple()
```
- und geben diese aus.
```python
pprint()
```

Diese lange Kette von Funktionsaufrufen ermöglicht es uns, diese Transformation hier in einer einzigen Zeile durchzuführen.  Und das sind alles kleine Bausteine, die  einfach in verschiedenen Kontexten wiederverwendet werden können.

**Weiteres Beispiel: Separate Funktion `nobel_filter()`**

In [None]:
def nobel_filter(x):
    return x.nobel is True

pprint(tuple(filter(nobel_filter, scientists)))

Die separate Funktion ersetzt die Verwendung von `lambda` in der Anweisung.  

**Vorteile:**
- Wiederverwendbarkeit von Code
- Weitere Filter können passend zum Kontext erstellt und von anderen Programmen genutzt werden.
- Nützlich im Kontext von Parallelverarbeitung. *Kein Thema dieser Lehrveranstaltung*.

### Filtern von List Comprehensions

Die pythonische Version der `filter()`-Anweisung.

**List Comprehension**  
Dies wird von der Python-Entwickler-Community empfohlen, anstatt die `filter()`-Funktion zu verwenden.
Vgl. https://docs.python.org/3/tutorial/datastructures.html?list-comprehensions#list-comprehensions

In [None]:
[x for x in scientists if x.nobel is True]

In [None]:
pprint([x for x in scientists if x.nobel is True])

Die Anweisung nun mit Tupel-Datenstruktur:

In [None]:
pprint(tuple([x for x in scientists if x.nobel is True]))

Die Ausgabe aus dieser List Comprehension und aus der Filter-Anweisung sind jetzt tatsächlich völlig gleichwertig.  
Aber es geht auch ohne List Comprehension, wenn die Anweisung in einen Gerator-Ausdruck vergewandelt wird. Das Ergebnis ist gleich. Es wird jedoch kein Listen-Objekt als Zwischenprodukt erstellt.

In [None]:
pprint(tuple(x for x in scientists if x.nobel is True))

**Erläuterung:**  
Es kann ein Objekt, wie diese List Comprehension direkt an die Tupel-Funktion oder jede andere Funktion weitergegeben werden, wenn die eckigen Klammern weggelassen werden.  

Dann wird daraus ein Generatorausdruck, der einen Ad-hoc-Iterator definiert, der die erwarteten Werte erzeugt, ohne zuerst eine Liste zu erstellen und dann ein Tupel aus dieser Liste zu erstellen und die Liste wieder zu zerstören.

**Vorteil:**  
Diese Anweisung ist speichereffizienter.

## Die `map()`-Funktion

### Übersicht
**Verwendung: Transformieren von Datenstrukturen**

Die `map()`-Funktion ist integriert in Python.

Sie gibt einen Iterator zurück, der die von uns übergebene Funktion berechnet, die als Argumente jedes der angegeben iterierbaren Objekte (`iterables`) verwendet.

Die Funktion `map()` wendet die angegebene Funktion auf jeder der iterierbaren Objekt an, z. B. eine Liste, und erzeugt einen Ausgabe-Iterator, der die Ergebnisse jedes Funktionstionsaufrufs beinhaltet.

In [None]:
help() # map

### Anwendungsbeispiel

Wir haben den Beispiel-Datensatz von Wissenschaftlern, die alle namedtuple Objekte sind, also unveränderlich. Das Ganze wird in einem Tupel gespeichert, so dass die gesamte Struktur unveränderlich ist. Deshalb wird in diesem Beispiel keine einfache Liste verwendet.

**Wiederholung:**
Unveränderlich bedeutet, dass diese Objekte nicht modifiziert werden können. Wenn wir sie ändern möchten, müssen wir eine Kopie erstellen. Auf diese Weise können wir diese Änderungen verfolgen und sicherstellen, dass diese Liste immer gleich ist.

Grundsätzlich macht die `map()`-Funktion folgendes: Sie benötigt eine Liste von Dingen, wendet eine Funktion auf jedes Element der Liste an und basierend darauf wird eine neue Liste zusammengestellt.

In [None]:
pprint(scientists)

**Neue Liste von Wissenschaftler mit Ihren Namen und deren Alter**

In [None]:
names_and_ages = tuple(map(
    lambda x: {"name": x.name, "age":2022 - x.born},
    scientists
))
pprint(names_and_ages)

*Besser: namedtuple*  
*Ideal: namedtuple und datetime Modul*

**Exkurs: datetime Modul**  
Vgl. https://docs.python.org/3/library/datetime.html#datetime.datetime.now

In [None]:
import datetime
x = datetime.datetime.now()
year = x.year # Jahr
print(year) 
print(x.strftime("%A")) # Wochentag

### Vergleich der `map()`-Funktion gegenüber des Generatorausdrucks

**List Comprehension**

In [None]:
[{"name": x.name, "age": year - x.born}
    for x in scientists]

**Angleichen an die Anweisung mit der `map()`-Funktion**

In [None]:
tuple({"name": x.name, "age": year - x.born} for x in scientists)

In [None]:
pprint(tuple({"name": x.name, "age": year - x.born} for x in scientists))

**Generator-Ausdruck:**
```python
{"name": x.name, "age": year - x.born}
```

### Nutzen der `map()`-Funktion

Einige geeignete Anwendungsfälle:  
- Ergänzen/Anreichern von Datenstätzen um eine Menge an berechneten Eigenschaften
- String-Operatoren auf Attribute anwenden wie bspw. `upper()`

**Vorteil:**  
Erstellung von beliebigen Arbeitsschritten auf Basis von unabhängigen Funktionen



In [None]:
pprint(tuple({"name": x.name.upper(), "age": year - x.born} for x in scientists))

## Die `reduce()`-Funktion

### Übersicht
**Verwendung: Transformieren von Datenstrukturen**

Die `reduce()`-Funktion muss importiert werden.

In [None]:
from functools import reduce

In [None]:
help() # reduce

Die Funktion `reduce()` verwendet eine Funktion  und dann eine Folge von Dingen. Für die Funktion `map()` und für die Funktion `filter()` wurden diese als Iterable bezeichnet, daher könnte die Benennung hier ein wenig inkonsistent sein.

Grundsätzlich verwendet die Funktion `reduce()` eine Funktion, eine Sequenz und dann einen Initialwert, der optional ist, und reduziert die Sequenz bis zu einem einzelnen Ausgabewert durch wiederholtes Anwenden dieser Funktion auf die Elemente in dieser Sequenz.

### Anwendungsbeispiel

Wir haben den Beispiel-Datensatz von Wissenschaftlern, die alle namedtuple Objekte sind, also unveränderlich. Das Ganze wird in einem Tupel gespeichert, so dass die gesamte Struktur unveränderlich ist. Deshalb wird in diesem Beispiel keine einfache Liste verwendet.

In [None]:
pprint(scientists)

**Berechnung der Lebensjahre aller Wissenschaftler**

In [None]:
total_age = reduce(
    lambda acc, val: acc + val["age"],
    names_and_ages,
    0)

In [None]:
pprint(total_age)

**Erläuterung der `reduce`-Anweisung**  
- Wir verwenden zwei lambda-Ausdrücke. Der erste ist der Akkumulator `acc`, der zweite ist der Wert `val`.

```python
lambda acc, val
```
Diese Lambda-Funktion wird also wiederholt auf alle Elemente in dieser Liste angewendet. `val` wird immer das neueste Element sein, das wir betrachten, und der Akkumulator `acc` wird eine Art laufende Variable sein, die wiederholt aktualisiert wird. Der Rückgabewert dieser Funktion ist der neue Wert des Akkumulators.

**Die Anweisung macht Folgendes:**  
Reduziere die Werte der Variable `names_and_ages` mit dieser Regel hier auf einen einzelnen Wert dieses Lambdas. Der Anfangswert von `acc` ist in diesem Beispiel 0.

**Generator-Ausdruck:**
```python
sum(x["age"] for x in names_and_ages)
```

In [None]:
sum(x["age"] for x in names_and_ages)

### Nutzen der `reduce()`-Funktion

**Wissenschaftler nach Arbeitsgebiet gruppieren.**

In [None]:
pprint(scientists)

1. Datenstruktur für Arbeitsgebiete erstellen

In [None]:
{"math": [], "physics": [], "pharmaceutical chemist": [], "chemistry": [], "astronomy": []}

In [None]:
def reducer(acc, val):
    acc[val.field].append(val.name)
    return acc

scientists_by_field = reduce(
    reducer,
    scientists,
    {"math": [], "physics": [], "pharmaceutical chemist": [], "chemistry": [], "astronomy": []}
)

pprint(scientists_by_field)

**Erläuterung:**  
Wie korrespondieren die Variablen `acc` und `val` mit den den tatsächlichen Werten und welche Werte hat der Akkumulator, wenn er aktualisiert wird?


Hier wird Geduld und Nachdenkzeit benötigt. Es ist sinnvoll, dies mehrfach zu durchdenken und durchzuspielen. Vielleicht sogar auf einem Stück Papier oder sicherlich hier in der Übung.

**Nachteil:**
Eine Sache, die an dieser Lösung wirklich stört, ist, dass im Voraus eine Liste von Kategorien existieren muss, die dann ausgefüllt wird. Das ist ungeschickt, denn wenn bspw. ein Tippfehler in der Anweisung vorhanden sein sollte, dann fliegt und die Anweisung um die Ohren.  

Es gibt jedoch einen besseren Weg, und das ist die Verwendung der `defaultdict`-Klasse im `collections`-Modul.

In [None]:
import collections
scientists_by_field = reduce(
    reducer,
    scientists,
    collections.defaultdict(list)
)

In [None]:
pprint(scientists_by_field)

Das Ergebnis erstaunt.  
`collections.defaultlist()` bzw. `defaultdict()` erscheint magisch.

In [None]:
dd = collections.defaultdict(list)
dd

**Erläuterung:**  
Zum besseren Verständnis erstellen wir uns eine Instanz dieser Klasse, sodass dies ein `defaultdict` ist. Jedes Mal, wenn auf einen Schlüssel zugegriffen wird, der nicht vorhanden ist, wird dieser erstellt und mit allem gefüllt, was Sie hier eingeben, unabhängig von der factory-Funktion, die Sie hier übergeben.

Zu Testzwecken werden wir unsinnige Objekte in das dictionary speichern.

In [None]:
dd["existiert nicht"]
dd

In [None]:
dd["misteriös"]
dd

In [None]:
dd["xyz"].append(1)
dd
dd["xyz"].append(2)
dd
dd["xyz"].append(3)
dd

**Anmerkung:**  
Das Gezeigte ist also ein kleiner Trick, mit dem Sie das manuelle definieren des Akkumulators umgehen können. Selbstverständlich kann dieser Funktionsaufruf noch komplizierter werden. Es kann eine Weile dauern, bis der Code von anderen Programmierern verstanden wird. Deshalb sollte dies nicht in produktivem  Code verwendet werden.

### Gruppieren von Daten mit `itertools.groupby()`

Mit dem Fokus auf Verständlichkeit verbesserte Version der Anweisung, um Wissenschaftler nach Arbeitsgebiet zu gruppieren.

In [None]:
import itertools

scientists_by_field2 = {
    item[0]: list(item[1])
    for item in itertools.groupby(scientists, lambda x: x.field)
}
pprint(scientists_by_field2)

### Extra: functools

> Warnung: Komplizierter Code. Sollte vermieden werden.

Das gleiche Ergebnis, allerdings unter Verwendung einer Lambda-Funktion anstelle einer separat definierten `reducer()`- Funktion. Es wird auch die Dictionary Zusammenführungssyntax `**` verwendet.

In [None]:
import functools
scientists_by_field = reduce(
    lambda acc, val: {**acc, **{val.field: acc[val.field] + [val.name]}},
    scientists,
    {"math": [], "physics": [], "pharmaceutical chemist": [], "chemistry": [], "astronomy": []}
)
pprint(scientists_by_field)

**Fazit:**  
Verwenden Sie `filter()`, `map()`, und `reduce()` auf unterschiedliche Weise, indem Sie sie beispielsweise durch List Comprehensions oder Generatorausdrücke ersetzen.

**Weiterführendes Material:**  
https://docs.python.org/3/howto/functional.html