## Python für Fortgeschrittene
# Funktionales Programmieren II

### Wiederholung

* Funktionen als Objekte erster Klasse
* Funktionen als mathematische Funktionen, ohne Nebeneffekte
* Iteratoren / Iterables
* »Daten fließen durch Ketten von Funktionen«

#### List Comprehensions

In [8]:
import re
source="Ich bin ein Test. Ich bin klein. Zerleg mich trotzdem!"

[s.strip() 
    for s in re.split(r'(.*?[.+?]\s*)', source)
    if  s != ""]

['Ich bin ein Test.', 'Ich bin klein.', 'Zerleg mich trotzdem!']

#### Dictionary- und Set Comprehensions

In [10]:
# Set Comprehensions
unterschiedliche_zeichen = { letter for letter in source }

In [12]:
# Dictionary Comprehensions
{ word : len(word) for word in source.split() }

{'Ich': 3,
 'Test.': 5,
 'Zerleg': 6,
 'bin': 3,
 'ein': 3,
 'klein.': 6,
 'mich': 4,
 'trotzdem!': 9}

#### Generator Comprehensions

Wie List comprehensions, materialisieren aber nicht die Liste, sondern erzeugen einen _Generator_

In [13]:
(s.strip() 
    for s in re.split(r'(.*?[.+?]\s*)', source)
    if  s != "")

<generator object <genexpr> at 0x7f4428531258>

#### Generatoren

Generatoren bieten den Weg von imperativem Code hin in die funktionale Welt. Sie erzeugen automatisch ein Iterable, das Schlüsselwort `yield` erzeugt das nächste Element:

In [19]:
def nl(lines):
    i = 0
    for line in lines:
        i += 1
        yield "{:>5} {}".format(i, line)

In [22]:
with open("goethe.txt") as f:
    for line in nl(f):
        print(line)

    1 Johann Wolfgang von Goethe (* 28. August 1749 in Frankfurt am Main; † 22. März 1832 in Weimar), geadelt 1782, gilt als einer der bedeutendsten Repräsentanten deutschsprachiger Dichtung.

    2 

    3 Goethes literarische Produktion umfasst Lyrik, Dramen, erzählende Werke (in Vers und Prosa), autobiografische, kunst- und literaturtheoretische sowie naturwissenschaftliche Schriften. Daneben ist sein umfangreicher Briefwechsel von literarischer Bedeutung. Goethe war Vorbereiter und wichtigster Vertreter des Sturm und Drang. Sein Roman Die Leiden des jungen Werthers machte ihn in Europa berühmt. Gemeinsam mit Schiller, Herder und Wieland verkörpert er die Weimarer Klassik. Im Alter wurde er auch im Ausland als Repräsentant des geistigen Deutschlands angesehen.

    4 

    5 Am Hof von Weimar bekleidete er als Freund und Minister des Herzogs Carl August politische und administrative Ämter und leitete ein Vierteljahrhundert das Hoftheater.

    6 

    7 Im Deutschen Kaiserreich wurd

Ruft man die Generatorfunktion `nl` auf, so bekommt man einen Generator zurück (ein Iterable). Mit jeder Iteration über den Generator läuft die Funktion nur bis zum nächsten `yield` und wird dann eingefroren bis zum nächsten `next()`-Aufruf an dem Generator.

### map() und filter()

Comprehensions implementieren Funktionalität, die auch über die Funktionen `map` und `filter` zur Verfügung steht. map und filter (und reduce, s.u.) sind Klassiker der funktionalen Programmierung:

In [25]:
print(map.__doc__)

map(func, *iterables) --> map object

Make an iterator that computes the function using arguments from
each of the iterables.  Stops when the shortest iterable is exhausted.


In [31]:
words = ["Ich", "bin", "ein", "Test."]
list(map(len, words))

[3, 3, 3, 5]

In [37]:
[len(word) for word in words]

[3, 3, 3, 5]

In [38]:
"; ".join(range(10))

TypeError: sequence item 0: expected str instance, int found

In [39]:
"; ".join(map(str, range(10)))

'0; 1; 2; 3; 4; 5; 6; 7; 8; 9'

__filter__ nimmt ein _Prädikat_, d.h. eine Funktion, die ein `bool` zurückgibt:

In [42]:
satz = "35 Studierende lösen je 4 Aufgaben".split()
list(filter(str.isnumeric, satz))

['35', '4']

In [43]:
list(map(int, filter(str.isnumeric, satz)))

[35, 4]

In [44]:
[int(zahl) for zahl in satz if zahl.isnumeric()]

[35, 4]

#### Lambda-Ausdrücke

Lambda-Ausdrücke dienen dazu, kleine anonyme Funktionen (die nur aus einem Ausdruck bestehen) zu schreiben.

In [3]:
lambda x: x**2

<function __main__.<lambda>>

der oben stehen de Ausdruck ist equivalent zu:

In [None]:
def square(x):
    return x**2

In [49]:
list(map(lambda x: x**2, range(10)))

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

* Kombinationen aus map/filter und lambda-Ausdrücken sind häufig als Comprehensions lesbarer
* komplexe Lambda-Ausdrücke sind häufig als kleine nicht-anonyme Funktionen lesbarer

#### Übungen

1. Sie erinnern sich noch an die Aufgabe _Liste von Wörtern → Liste von Vokalanzahlen_? Lösen Sie sie erneut, jedoch möglicht unter reichhaltiger Verwendung von map/filter & Konsorten.

In [18]:
satz = ['Das', 'ist', 'ein', 'Satz']

def countvowels(word):
     list(map(len,[ch for ch in word if ch in 'aeiouAEIOUüÜöÖäÄ']))
    
for item in satz:
    countvowels(item)
[ch for ch in 'Das' if ch in 'aeiouAEIOUüÜöÖäÄ']

NameError: name 'word' is not defined

#### functools.reduce

`reduce(function, iterable [, initial])` aus dem `functools`-Modul funktioniert ähnlich `map`, reduziert die Liste jedoch auf einen einzelnen Wert. Die Verwendung ist umstritten. Alternative fertige Reduktoren wie `sum` oder klassische `for`-Schleifen.

In [52]:
from functools import reduce
def add(x, y):
    print("add({}, {}) -> {}".format(x, y, x+y)) # aus didaktischen Gründen ...
    return x+y

In [53]:
reduce(add, range(5))

add(0, 1) -> 1
add(1, 2) -> 3
add(3, 3) -> 6
add(6, 4) -> 10


10

## Nützliche Funktionen & Generatoren in der Standard Library

#### Operatoren

Das Modul `operator` stellt für alles, was es so als Operator in Python gibt, Funktionen bereit, die z.B. `map`, `filter` und `reduce` verabreicht werden können.

In [63]:
import operator

def factorial(n):
    return reduce(operator.mul, range(1, n+1))
factorial(10)

3628800

Übungsaufgabe: Schauen Sie sich die Dokumentation zu `sorted` und `operator.itemgetter` an. Wie kann man damit die Keys eines Dictionaries nach den Values sortieren?

#### Reduktoren

Neben dem generischen `reduce` gibt es noch eine Reihe eingebauter spezieller 'Reduktoren' für häufige Anwendungsfälle:

* `all(it)` liefert `True` genau dann, wenn alle Items in `it` wahr sind
* `any(it)` liefert `True` genau dann, wenn mindestens ein Item in `it` wahr ist
* `max(it, key=func, default=wennsleerist)` liefert den größten Wert in `it`
* `min(it, key=func, default=wennsleerist)` liefert den kleinsten Wert in `it`
* `sum(it, start=0)` liefert die Summe aller Items in `it`

#### itertools 

Das Modul `itertools` bietet zahlreiche Funktionen zum Umgang mit Iteratoren und Iterables.

#### Iterables filtern

* `compress(it, selector_it)` konsumiert zwei Iteratoren parallel und gibt diejenigen Items aus `it` zurück, für die `selector_it` wahr ist.
* `takewhile(predicate, it)` liefert Elemente aus `it`, solange `predicate(item)` True liefert
* `dropwhile(predicate, it)` überspringt Elemente aus `it`, bis `predicate(item)` das erste mal `False` liefert, dann wird der Rest von `it` ohne weitere Checks zurückgeliefert
* `filter(predicate, it)` (nicht aus Itertools!) kennen wir schon
* `filterfalse(predicate, it)` == filter(lambda t: not(predicate(t)), it)
* `islice(it, stop)` oder `islice(it, start, stop, step=1)` Slicing auf Iteratoren


Übung: Lassen Sie sich Zufalls-n-gramme (Hausaufgabe) liefern, bis eines mit `a` beginnt

#### Mapping

* `accumulate(it, [func])` liefert akkumulierte Summen (oder akkumulierte Funktion func)

In [67]:
import itertools
list(itertools.accumulate(range(5)))

[0, 1, 3, 6, 10]

In [68]:
def prod(a, b):
    print(a, '*', b, '=', a*b)
    return a*b
list(itertools.accumulate(range(1,5), prod))

1 * 2 = 2
2 * 3 = 6
6 * 4 = 24


[1, 2, 6, 24]

* `enumerate(it, start=0)` (built-in!) liefert Tupel (count, item)
* `map` kennen wir schon
* `starmap(func, it)` ruft `func(*item)` auf jedem item in it auf:

In [70]:
pairs = [(1,3), (4,5), (2,3)]
list(itertools.starmap(operator.truediv, pairs))

[0.3333333333333333, 0.8, 0.6666666666666666]

#### Mehrere Iterables

* `chain(it1, ..., itN)` klebt die Iteratoren nahtlos zusammen
* `chain.from_iterable(it)` dasselbe, wenn `it` die Iteratoren liefert (z.B. Liste von Iteratoren)
* `product(it1, ..., itN,  repeat=1)` Kartesisches Produkt → Tupel:

In [74]:
list(itertools.product([1,2,3], 'AB'))

[(1, 'A'), (1, 'B'), (2, 'A'), (2, 'B'), (3, 'A'), (3, 'B')]

* `zip(it1, ..., itN)` (Builtin!) Verschränkt die Iteratoren → Tupel:

In [78]:
list(zip([1,2,3], 'AB'))

[(1, 'A'), (2, 'B')]

In [80]:
list(itertools.zip_longest([1,2,3], 'AB', fillvalue='_'))

[(1, 'A'), (2, 'B'), (3, '_')]

#### Jedes Eingabeitem → mehrere Ausgabeitems

* `combinations(it, out_len)` → alle `out_len`-lange Kombinationen aus `it`
* `combinations_with_replacement(it, out_len)` → ebenso, mit zurücklegen
* `permutations(it, out_len=len(list(it)))`: Permutationen der Länge out_len

In [84]:
list(itertools.combinations('ABC', 2))

[('A', 'B'), ('A', 'C'), ('B', 'C')]

In [85]:
list(itertools.combinations_with_replacement('ABC', 2))

[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'B'), ('B', 'C'), ('C', 'C')]

In [90]:
list(itertools.permutations('ABC', 3))

[('A', 'B', 'C'),
 ('A', 'C', 'B'),
 ('B', 'A', 'C'),
 ('B', 'C', 'A'),
 ('C', 'A', 'B'),
 ('C', 'B', 'A')]

#### Unendliche Sequenzen:

* `count(start=0, step=1)` wie `range`, aber ohne Ende
* `cycle(it)` unendlich viele Wiederholungen von `it`
* `repeat(item)` unendlich viele Wiederholungen von item

In [103]:
def ll(it, limit=10):
    """Limited list of limit items from iterator it"""
    return list(itertools.islice(it, limit))

In [104]:
ll(itertools.count())

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [105]:
ll(itertools.cycle('ABC'))

['A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C', 'A']

In [106]:
ll(itertools.repeat('A'))

['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A']

#### Re-Arrangement

* `reverse(it)` (Builtin!) dreht die Reihenfolge um
* `tee(it, n=2)` liefert ein Tupel aus n unabhängigen Iteratoren, die die Items aus `it` liefern
* `groupby(it, key=None) -> (key, group)` gruppiert nach Wert oder alternativ anhand der Zugriffsfunktion key

In [107]:
list(itertools.groupby('LLLLAAGGG'))

[('L', <itertools._grouper at 0x7f442852b6a0>),
 ('A', <itertools._grouper at 0x7f442852bcc0>),
 ('G', <itertools._grouper at 0x7f442852b7f0>)]

In [109]:
for char, group in itertools.groupby('LLLLAAGG'):
    print(char, '→', list(group))

L → ['L', 'L', 'L', 'L']
A → ['A', 'A']
G → ['G', 'G']


In [114]:
s = 'Ich bin ein komischer Beispielsatz'.split()
for l, words in itertools.groupby(s, key=len):
    print(l, '→', list(words))

3 → ['Ich', 'bin', 'ein']
9 → ['komischer']
12 → ['Beispielsatz']
