# Abstraktionen, Comprehensions

Comprehensions (auf dt. Abstraktionen) sind Erzeugungsvorschriften für die Erzeugung von Instanzen iterierbarer Objekte. Sie sind ein Werkzeug zur Erstellung, Filterung und Änderung iterierbarer Objekte und in der richtigen Verwendung gleichzeitig auch übersichtlicher und einfacher zu interpretieren als herkömmliche Lösungen mit Schleifen.

## List Comprehension

Die einfachste Form einer list comprehension ist in Python wie folgt aufgebaut: <br>
*values = [expression for item in iterable]* <br>
Der erste Ausdruck *expression* erzeugt Elemente in der Liste, gefolgt von einer for Schleife über eine Sammlung von Daten bzw. über jedes iterierbare Objekt, welches seine gespeicherten Elemente einzeln zurück geben kann. <br>
Des Weiteren können if/else Bedingungen zur Filterung oder Änderung der Elemente genutzt werden.

#### Beispiel 1 (konventionell)

In [None]:
quadratzahlen = []
for n in range(11):
    quadratzahlen.append(n*n)

print(quadratzahlen)

#### Beispiel 1 (mit List Comprehension)

In [None]:
quadratzahlen = [n*n for n in range(11)]

print(quadratzahlen)

Comprehension werden häufig auch im Zusammenhang mit Funktionsaufrufen genutzt, man kann sich so die Referenz auf das Objekt sparen: 

In [None]:
max([n*n for n in range(11)])

#### Beispiel 2 (konventionell)

In [None]:
kilometer = [30, 50, 60, 80, 100, 120]
meilen = []
for km in kilometer:
    meilen.append(km*0.621371)

print(meilen)

#### Beispiel 2 (mit List Comprehension)

In [None]:
kilometer = [30, 50, 60, 80, 100, 120]
meilen = [km*0.621371 for km in kilometer]

print(meilen)

## Set Comprehension

#### Konventionell:

In [None]:
menge = set()
for x in range(6):
    for y in range(6):
        menge.add(x*y)

print(menge)

#### mit Set Comprehension:

In [None]:
menge = {x*y for x in range(6) for y in range(6)}

print(menge)

## Dict Comprehension

In [None]:
namen = ["Gallati", "Meier", "Kurz", "Feldmann"]
mein_dict = {name:name.count('a') for name in namen}
mein_dict

## Bestehende Listen filtern

Beispiel: Nur Zahlen behalten, deren Werte positiv sind

In [None]:
zahlen = [3, -1.5, 7, -3.8, 9, -4, -2, 12]

#### Konventionell:

In [None]:
zahlen_neu = []
for zahl in zahlen:
    if zahl > 0:
        zahlen_neu.append(zahl)
print(zahlen_neu)

#### Mit List Comprehension:

Mit Hilfe einer **if Bedingung am Ende der Comprehension** können **Elemente aus der Liste gefiltert** werden. 

In [None]:
zahlen_neu = [zahl for zahl in zahlen if zahl > 0]

print(zahlen_neu)

## Bestehende Listen filtern und Elemente auf Grund einer Kondition ändern

Beispiel: Nur Zahlen behalten, deren Werte positiv sind, ansonsten 0 setzen (nicht heraus filtern)

In [None]:
zahlen = [3, -1.5, 7, -3.8, 9, -4, -2, 12]

#### Konventionell:

In [None]:
zahlen_neu = []
for zahl in zahlen:
    if zahl > 0:
        zahlen_neu.append(zahl)
    else: 
        zahlen_neu.append(0)
print(zahlen_neu)

#### Mit List Comprehension:

Mit Hilfe einer **if Bedingung vor der for Schleife** können **Elemente vor der Speicherung in der Liste auf Grund der gegebenen konditionalen Bedingung geändert** werden. <br>
Ein "unerwünschter" Wert wird hier also nicht einfach heraus gefiltert, sondern geändert und ebenfalls in der Liste gespeichert. 

In [None]:
zahlen_neu = [zahl if zahl > 0 else 0 for zahl in zahlen]

print(zahlen_neu)

Es können auch mehrere if/else Bedingungen verschachtelt werden:

In [None]:
zahlen_neu = [zahl if zahl > 0 else (10000 if zahl==-4 else 0) for zahl in zahlen]

print(zahlen_neu)

#### Readability counts!<br>

Mit Comprehensions können stark verschachtelte Schleifen abgebildet werden, die jedoch vielleicht überhaupt nicht mehr einfach zu lesen sind. In solchen Fällen sollte man eher auf die konventionelle Schreibweise zurück greifen. 

In [None]:
zahlen = [f'teilbar durch 2 und 5: {n:>2}' if n % 2 == 0 and n % 5 == 0 else f'teilbar durch 2: {n:>8}' if n % 2 == 0 else f'teilbar durch 5: {n:>8}' if n % 5 == 0 else f'Rest: {n:>19}' for n in range(100)]
for zahl in zahlen: 
    print(zahl)

In [None]:
zahlen = []
for n in range(100):
    if n % 2 == 0 and n % 5 == 0:
        zahlen.append(f'teilbar durch 2 und 5: {n:>2}')
    elif n % 2 == 0:
        zahlen.append(f'teilbar durch 2: {n:>8}')
    elif n % 5 == 0:
        zahlen.append(f'teilbar durch 5: {n:>8}')
    else:
        zahlen.append(f'Rest: {n:>19}')

for zahl in zahlen: 
    print(zahl)

**Comprehensions sollten nicht "missbraucht" werden.** <br>
Das Ziel im folgenden Beispiel ist nicht die Erstellung einer Liste mit den Zahlen 0 bis 5 sondern einfach die Ausgabe der Zahlen auf die Konsole. <br>
Es wird zwar eine Liste erzeugt, diese ist jedoch mit None gefüllt, wobei es sich um den jeweiligen Rückgabewert der print()-Funktion handelt. <br>
Wenn man als Programmierer eine Comprehension sieht, dann geht man davon aus, dass hier ein neues Iterable gebaut wird.

In [None]:
[print(n) for n in range(5)]

## Liste von Zahlen => formatierter String

#### Konventionell:

In [None]:
temp = []
for km, mi in zip(kilometer, meilen):
    temp.append('{:.0f}km={:.0f}mi'.format(km, mi))
s = ', '.join(temp)

print(s)

#### Mit List Comprehension:

In [None]:
s = ', '.join(['{:.0f}km={:.0f}mi'.format(km, mi) for km, mi in zip(kilometer, meilen)])

print(s)

## Liste der Schachbrett-Felder

In [None]:
buchstaben = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
zahlen = [1, 2, 3, 4, 5, 6, 7, 8]

#### Konventionell:

In [None]:
felder = []
for b in buchstaben:
    for z in zahlen:
        felder.append(b + str(z))

print(felder)

#### Mit List Comprehension: 

In [None]:
felder = [b + str(z) for b in buchstaben for z in zahlen]

print(felder)

## Vergleich konventionelle Lösung vs. Comprehension bezüglich Ausführungszeit

Bei **einfachen, nicht rechenintensiven Ausdrücken ist die Comprehension schneller als die konventionelle Lösung**. <br>
Dies liegt daran, weil bei den Comprehensions die "append"-Funktion (als Beispiel bei den Listen) nicht bei jeder Iteration geladen und als Funktion aufgerufen werden muss. <br>

Sobald der Ausdruck jedoch etwas rechenintensiver wird, wird die Zeit, welche man durch die Comprehension spart, verhältnismässig klein im Vergleich zur Rechenzeit, die für den Ausdruck alleine aufgewendet wird.
Das heisst bei Iterationen über bereits mässig rechenintensive Funktionen macht es keinen Sinn, sich darüber Gedanken zu machen, ob man eine Comprehension oder die konventionelle Lösung mit der for-Schleife verwenden soll, da die Laufzeit fast identisch ist. Man soll sich eher fragen, welche der beiden Möglichkeiten für das gegebene Problem bezüglich Verständlichkeit und Leserlichkeit sinnvoller ist. 

#### Beispiel 1 (nicht rechenintensiver Ausdruck)

In [None]:
import timeit

def example1():
    liste1 = []
    for k in range(100):
        liste1.append(k)   
    return liste1
        
def example2():
    return [k for k in range(100)]

print(f"Ausführungszeit konventionelle Lösung: {timeit.timeit(lambda: example1(), number=10000)*1000} ms")
print(f"Ausführungszeit Comprehension  Lösung: {timeit.timeit(lambda: example2(), number=10000)*1000} ms")

#### Beispiel 2 (rechenintensiver Ausdruck)

In [None]:
import timeit

def example1():
    liste1 = []
    for k in range(100):
        liste1.append(k**2 + k**3 + k**4)   
    return liste1
        
def example2():
    return [k**2 + k**3 + k**4 for k in range(100)]

print(f"Ausführungszeit konventionelle Lösung: {timeit.timeit(lambda: example1(), number=10000)*1000} ms")
print(f"Ausführungszeit Comprehension  Lösung: {timeit.timeit(lambda: example2(), number=10000)*1000} ms")