# Abstraktionen und Generatoren
<br><img width =300 src="Images/abstract.jpg" />

Python kennt wie viele andere Sprachen auch die Möglichkeit, eine anonyme Funktion zu erstellen, die in einer Zeile ausgeführt werden kann. Die Funktion hat keinen Namen, sie gibt ihren return-Wert direkt an der Stelle zurück, wo sie erstellt wurde. Die Syntax ist:<br><b> lambda argumentenliste: ausdruck</b><br>
Die Argumentenliste umfaßt die benötigten Argumente in kommaseparierter Form, die in der Funktion in Parameter umgewandelt werden. Danach kommt der "Funktionskörper", der meistens sehr einfach gehalten ist. Beispiele:<br>
Wir definieren im ersten Beispiel eine lambda-Funktion mit den Parametern x und y, die ```x**y``` zurückgibt. Diese wird in Zeile 2 aufgerufen mit den Argumenten. <br>
Das zweite Beispiel sortiert mit der key-Funktion ein Dict nach seinen Values. Wir sortieren das dict_items Objekt. Dieses enthält wie wir wissen Tupel mit key/value-Paaren. Die key-Funktion muß den Wert zurückgeben, nachdem intern sortiert werden soll, und die lambda-Funktion tut dies, indem sie den zweiten Teil der Tupel, also den Value anspricht.
<br> Im dritten Beispiel sortieren wir Listen mit 3 Elementen nach dem Element 2.<br>
Als letztes Beispiel machen wir eine anonyme Funktion, die eine Liste von Celsius-Werten in Fahrenheit umrechnet. Wir haben die lambda-Funktion definiert mit der Umrechnungsformel:$$ fahrenheit=9/5*celsius + 32.$$<br> Diese rufen wir dann in der Schleife mit einigen Celsius-Werten auf.

In [10]:
expo = lambda x,y: x**y
print(expo(3,4))
print(100*"-")
#sortieren eines Dicts nach value
mydict={"eins":1,"drei":3,"zwei":2}
new_dict=sorted(mydict.items(),key=lambda item: item[1])
print(new_dict)
print(100*"-")
#sortieren einer Liste mit 3 Unterlisten nach dem Wert des Elements mit Index 2 in den Unterlisten
mylist=[[1,2,3],[3,4,0],[8,5,1],[3,4,2]]
mylist.sort(key=lambda x: x[2])
print(mylist)
print(100*"-")
#Umrechnen von Celsius-Werten aus Liste in Fahrenheit
celsius = [37,100,0,65] 
for c in celsius:
    print(round((lambda x: float(9/5)*x + 32)(c),2),end="\t")


81
----------------------------------------------------------------------------------------------------
[('eins', 1), ('zwei', 2), ('drei', 3)]
----------------------------------------------------------------------------------------------------
[[3, 4, 0], [8, 5, 1], [3, 4, 2], [1, 2, 3]]
----------------------------------------------------------------------------------------------------
98.6	212.0	32.0	149.0	

Es gibt in Python andere Funktionen, die den Nutzen dieser Konstruktion erweitern. (s.Beispiel unten) In Python werden diese Funktionen (map,filter und reduce) immer seltener verwendet, da sie eigentlich nur als erzwungene Anhängsel integriert wurden, weil sie in anderen Sprachen oft gebraucht wurden, und weil die pythonische Lösung anfangs noch nicht implementiert war (reduce ist als erste dieser Funktionen aus Pythons Standardbibliothek bereits entfernt worden). map() wendet z.B. alle angegeben Parameter auf eine Funktion (hier die lambda-Funktion) an und gibt das Ergebnis als map-Objekt aus. Dieses können wir uns nach Verwandeln in eine Liste ausgeben lassen. Das zweite Beispiel zeigt, dass wir natürlich auch eine "ganz normale" Funktion mit map() verwenden können.

In [3]:
#map wendet die Funktion func auf die Sequenz seq an map(func,seq)
celsius = [37,100,0,65] 

print(map(lambda x: float(9/5)*x + 32,celsius)) #für map lambda.. erstes Argument (Funktion), celsius 2.Argument (Werte)
#map object nicht verwertbar, wir wandeln es in Liste um
print(list(map(lambda x: float(9/5)*x + 32,celsius)))

def celsius_to_fahrenheit (c):
    return float(9/5)*c + 32

result=map(celsius_to_fahrenheit,celsius) #für map lambda.. erstes Argument (Funktion), celsius 2.Argument (Werte)

print(list(result))

<map object at 0x0000016A63717F40>
[98.60000000000001, 212.0, 32.0, 149.0]
[98.60000000000001, 212.0, 32.0, 149.0]


Der Pythonische Weg ist anders, den wollen wir nun erläutern. Python erlaubt uns stattdessen sogenannte Abstraktionen zu verwenden, welche man sehr häufig in Python-Programmen findet, und die wir deshalb kennen und auch verwenden sollten, da sie sehr nützlich sind. Zunächst beschäftigen wir uns mit Listen-Abstraktionen (engl. list comprehensions), die, wie der Namen schon sagt, Listen erzeugen. Sie sind Kurzformen von Schleifen und if-Anweisungen in einer Zeile. Sie werden begrenzt durch ein [ ]-Paar. Nach der öffnenden Klammer folgt der Rückgabewert. Hier ist es zunächst nur x, in den weiteren Beispielen dann ein Tupel aus x und y. Dann folgt eine Schleife, in der verschiedene Werte für x (und im Beispiel 2 und 3 in eine weiteren für y) erzeugt werden. Diese Werte werden dann in die Ergebnisliste geschrieben. Bei mehreren Schleifen wird zuerst die äußere, dann eventuelle innere Schleifen formuliert. Das letzte Beispiel zeigt, daß hier der x Wert als Eingangswert für die range-Funktion der y-Schleife genommen werden kann.

In [29]:
print([x for x in range(10)])
print(100*"-")
print([(x,y) for x in range(5) for y in range(5)]) #y-Schleife ist innere Schleife
print(100*"-")
print([(x,y) for x in range(5) for y in range(x)]) #y-Schleife ist innere Schleife läuft nur bis zum
                                                   #jeweiligen Wert von x - 1

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
----------------------------------------------------------------------------------------------------
[(0, 0), (0, 1), (0, 2), (0, 3), (0, 4), (1, 0), (1, 1), (1, 2), (1, 3), (1, 4), (2, 0), (2, 1), (2, 2), (2, 3), (2, 4), (3, 0), (3, 1), (3, 2), (3, 3), (3, 4), (4, 0), (4, 1), (4, 2), (4, 3), (4, 4)]
----------------------------------------------------------------------------------------------------
[(1, 0), (2, 0), (2, 1), (3, 0), (3, 1), (3, 2), (4, 0), (4, 1), (4, 2), (4, 3)]


Sehr kompakt und elegant! Es kommt aber noch besser, weil wir if-Anweisungen integrieren können. Diese folgen dann hinter dem Schleifenteil. Im Beispiel zunächst eine Schleifenkonstruktion mit if-Anweisung in normaler Weise, dann die Abstraktion dafür. Hier im Bereich bis 30 die Zahlen, die glatt durcheinander teilbar sind (und nicht identisch sind). Ausserdem sieben wir noch die Primzahlen aus.

In [8]:
res,primes=[],[]
for x in range(1,30):
    found=0
    for y in range(2,x):
        if x//y==x/y and x!=y:
            res.append((x,y))
            found=1
    if found==0:
        primes.append(x)
        found=1
print(res)  
print(100*"-")
print(100*"-")
print([(x,y) for x in range(1,30) for y in range(1,x) if x//y==x/y and x!=y ])
print(primes)

[(4, 2), (6, 2), (6, 3), (8, 2), (8, 4), (9, 3), (10, 2), (10, 5), (12, 2), (12, 3), (12, 4), (12, 6), (14, 2), (14, 7), (15, 3), (15, 5), (16, 2), (16, 4), (16, 8), (18, 2), (18, 3), (18, 6), (18, 9), (20, 2), (20, 4), (20, 5), (20, 10), (21, 3), (21, 7), (22, 2), (22, 11), (24, 2), (24, 3), (24, 4), (24, 6), (24, 8), (24, 12), (25, 5), (26, 2), (26, 13), (27, 3), (27, 9), (28, 2), (28, 4), (28, 7), (28, 14)]
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
[(2, 1), (3, 1), (4, 1), (4, 2), (5, 1), (6, 1), (6, 2), (6, 3), (7, 1), (8, 1), (8, 2), (8, 4), (9, 1), (9, 3), (10, 1), (10, 2), (10, 5), (11, 1), (12, 1), (12, 2), (12, 3), (12, 4), (12, 6), (13, 1), (14, 1), (14, 2), (14, 7), (15, 1), (15, 3), (15, 5), (16, 1), (16, 2), (16, 4), (16, 8), (17, 1), (18, 1), (18, 2), (18, 3), (18, 6), (18, 9), (19, 1), (20, 1), (20, 2), (20, 4), (

Auch ein "else" Teil ist möglich. Hier findet man alle geraden Zahlen positiv in der Liste, alle ungeraden negativ.<b> Der if/else Teil muß vor dem Schleifenteil stehen und entspricht einfach einem ternären if.

In [39]:
print([x if x%2==0 else -x for x in range(20)])

[0, -1, 2, -3, 4, -5, 6, -7, 8, -9, 10, -11, 12, -13, 14, -15, 16, -17, 18, -19]


Listen-Abstraktionen werden noch interessanter, wenn wir die ```all()``` und ```any()```-Funktionen kennen und anwenden. Diese geben Bool_Werte zurück.
- ```all()``` True, wenn alle Elemente True sind
- ```any()``` True, wenn mindestens ein Element True ist
- ```not all()``` True,wenn mindestens ein Elemente False ist
- ```not any()``` True, wenn alle Elemente False sind<br><br>
Unten entsprechende Beispiele wobei wir 1 als True und 0 als False verwenden (implizierter Wahrheitswert für Zahlen, wie schon besprochen):

In [9]:
print(f"all([1,0,1]) ist {all([1,0,1])}")
print(f"all([1,1,1]) ist {all([1,1,1])}")
print("="*100)
print(f"any([1,0,0]) ist {any([1,0,0])}")
print(f"any([0,0,0]) ist {any([0,0,0])}")
print("="*100)
print(f"not all([1,0,0]) ist {not all([1,0,0])}")
print(f"not all([1,1,1]) ist {not all([1,1,1])}")
print("="*100)
print(f"not any([1,0,0]) ist {not any([1,0,0])}")
print(f"not any([0,0,0]) ist {not any([0,0,0])}")
print("="*100)


all([1,0,1]) ist False
all([1,1,1]) ist True
any([1,0,0]) ist True
any([0,0,0]) ist False
not all([1,0,0]) ist True
not all([1,1,1]) ist False
not any([1,0,0]) ist False
not any([0,0,0]) ist True


Statt unserer Listen-Literale im obigen Beispiel können wir natürlich auch Listen-Abstraktionen verwenden.

In [40]:
print(all([1 if x%2==0 else 0 for x in [2,4,6,12]])) #alle Ergebnisse der Abstraktion sind 1
print(all([1 if x%2==0 else 0 for x in [2,7,6,12]])) #das Ergebnis bei "7" ist 0 und somit False

True
False


## Aufgabe: (schwierig)
Schreibe eine Listen-Abstraktion, die die Zahlen im Bereich von 2 bis 100 enthält, die Prim-Zahlen sind. Hinweis: Lasse in der ersten Schleife x von 2 bis 101 laufen, schaue als if Bedingung dann, ob mindestens eine Zahl für x%y Null ergibt für y in range(2 bis x-1) (<b>bei 2 bis x</b> würde ja auch immer durch x geteilt und x%x wäre 0, deshalb nur bis x-1). Im if Teil wäre die y-Schleife auch in einer Listen-Abstraktion enthalten.
Geht es schneller? Wie weit muß y wirklich laufen?

In [46]:













#LÖSUNG
#y muß bis Wurzel(x+1) laufen.
#innere Abstraktion [0 if x%y==0 else 1 for y in range(2,x-1)]
#davon müssen alle Elemente 1 sein, also keine 0 für x%y==0


print([x for x in range(2,101) if all([0 if x%y==0 else 1 for y in range(2,x-1)])])
print([x for x in range(2,101) if all([0 if x%y==0 else 1 for y in range(2,int(x**.5)+1)])])

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]


Wenn auch die List-Abstraktionen sehr elegant ist, sollte man sie nicht übertreiben. Wenn sie nicht mehr lesbar werden und man lange überlegen muß, was gemeint ist, sollte man lieber den herkömmlichen Stil verwenden. Außerdem wird die gesamte Liste im Speicher abgelegt, was bei sehr großen Listen-Abstraktionen problematisch sein kann. Hierzu gleich mehr. Das Konzept beschränkt sich nicht auf Listen. Auch Mengen können so erstellt werden, dann findet man als Begrenzung {}-Klammern.

In [40]:
print({x*y for x in range(10) for y in range(10)})

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 24, 25, 27, 28, 30, 32, 35, 36, 40, 42, 45, 48, 49, 54, 56, 63, 64, 72, 81}


Wir sehen, daß eine Menge zurückgegeben wird, <b> doppelte Einträge gibt es natürlich nicht</b>. Wir haben hier alle Ergebnisse im "kleinen Einmaleins" ausgegeben ("x*y ist:") in einer Menge. Die Syntax ist bis auf die Klammern identisch zur Listen-Abstraktion. Auch hier liegt die gesamte Menge im Speicher. Verwenden wir ein ()-Klammernpaar als Begrenzung, erstellen wir Generatorenausdrücke, die anders funktionieren.

In [44]:
print((x*y for x in range(5) for y in range(5)))
the_list=list((x*y for x in range(5) for y in range(5)))
print(the_list)

<generator object <genexpr> at 0x0000025AE7BEA900>
[0, 0, 0, 0, 0, 0, 1, 2, 3, 4, 0, 2, 4, 6, 8, 0, 3, 6, 9, 12, 0, 4, 8, 12, 16]


Wir erhalten hier also kein Tupel (wie wir vielleicht erwartet hätten), sondern ein Generator-Objekt(hier Generator-Ausdruck, generator expression, Weiteres unten). Dieses können wir in eine Liste verwandeln. Was aber wichtiger ist, ist daß dieses Generatorobjekt nur Werte produziert, wenn wir den einzelnen Wert abrufen. Das Ergebnis wird also nicht insgesamt im Speicher abgelegt, sondern nur bei Bedarf schrittweise erstellt. Bei großen Strukturen ein gewaltiger Unterschied! Wie holen wir den nächsten wert aus dem Generator-Ausdruck? Mit next() wie im Beispiel gezeigt.

In [48]:
the_generator=(x*y for x in range(1,5) for y in range(2,5))
print(next(the_generator))
print(next(the_generator))

2
3


Was passiert, wenn es kein Element mehr gibt?

In [50]:
the_generator=(x*y for x in range(1,5) for y in range(2,5))
counter=0
while True:
    counter+=1
    print(f"Durchlauf {counter}  Ergebnis {next(the_generator)}")


Durchlauf 1  Ergebnis 2
Durchlauf 2  Ergebnis 3
Durchlauf 3  Ergebnis 4
Durchlauf 4  Ergebnis 4
Durchlauf 5  Ergebnis 6
Durchlauf 6  Ergebnis 8
Durchlauf 7  Ergebnis 6
Durchlauf 8  Ergebnis 9
Durchlauf 9  Ergebnis 12
Durchlauf 10  Ergebnis 8
Durchlauf 11  Ergebnis 12
Durchlauf 12  Ergebnis 16


StopIteration: 

Wir sehen, daß dann ein "StopIteration" Fehler ausgegeben wird (den wir natürlich mit try/except abfangen können). Hier wird einmal der Unterschied zwischen Generator und List-Abstraktion in der Praxis gezeigt. ```itertools``` ist ein wichtiges Modul für die Kombinatorik, hier berechnen wir alle Permutationen  (also Aufreihungen ohne Wiederholung) der Zahlen 0 bis 10.

In [10]:
import itertools

permutationen=[x for x in itertools.permutations(range(11))]
print(f"Beispiel: {permutationen[20]}") #Ergebnisbeispiel
print(len(permutationen)) #Wieviele Permutationen gibt es?

(0, 1, 2, 3, 4, 5, 6, 10, 8, 7, 9)
39916800


Es ergibt sich eine lange Laufzeit, alle 39916800 Permutationen werden in den Speicher gelegt. Nun könnten wir z.B. nach einer bestimmten Permutation suchen. <br>
Nun der Generatorausdruck:

In [11]:
import itertools

permutationen_gen=(x for x in itertools.permutations(range(11)))
print("FERTIG")
for _ in range(39916800):
    perm=next(permutationen_gen)
    if _==20:
        print(perm)
    


FERTIG
(0, 1, 2, 3, 4, 5, 6, 10, 8, 7, 9)


Es wird beim Generator-Ausdruck sozusagen nur das Rezept für die Permutation in den Speicher abgelegt und dann schrittweise genutzt. Eine Länge hat das Generatorobjekt nicht! Wir sehen, daß der Generator-Ausdruck viel schneller ist, obwohl wir auch hier alle Elemente der Permutation abgerufen haben.

Generatoren können auch auf andere Weise produziert werden. Sie entsprechen Funktionen ohne return. Man bekommt dann jeweils den nächsten Wert mit der yield-Anweisung. Nun müssen wir die Werte aus der Generatorfunktion in der Schleife immer wieder aufrufen. Oder alternativ können wir das machen, was wir schon kennen:

In [52]:
def unendlich(): #Generatorfunktion
    num = 0
    while True:
        yield num
        num += 1
        
for i in unendlich():
    if i>30:
        break
    print(i,end=" ")
    
   
print() 

#Alternative
generator=unendlich()
for i in range(31):
    print(next(generator),end=" ")

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 

Hier wollen wir nun noch einmal zwei wichtige Konstruktionen wiederholen, die in der täglichen Arbeit wichtig sein können.<br>
- zip
- enumerate
<br><br>
<b>zip(sequenz1,sequenz2...)</b> erzeugt ein zip_Objekt von Tupeln mit jeweils dem entsprechenden Element aus jeder der Sequenzen, bis die kürzeste Sequenz erschöpft ist, der Rest wird verworfen.
Dieses zip_Objekt können wir dann z.B. in eine Liste oder anderen kombinierten Datentyp verwandeln.


In [6]:
l1=[1,2,3,3,4,5]
l2=["eins","zwei","drei","drei"]
l3=[10,11,12,12,13,14,15,16]
print(zip(l1,l2,l3))
print(list(zip(l1,l2,l3)))
print(set(zip(l1,l2,l3))) #ohne Duplikat, da in Set verwandelt

<zip object at 0x0000020758C59EC0>
[(1, 'eins', 10), (2, 'zwei', 11), (3, 'drei', 12), (3, 'drei', 12)]
{(2, 'zwei', 11), (1, 'eins', 10), (3, 'drei', 12)}


<b>enumerate(kombinierter Datentyp)</b> gibt ein enumerate-Objekt mit Tupeln, die fortlaufende Nummern (von 0 beginnend) und den fortlaufenden Werten des kombinierten Datentyps zurück. Beachte die interen Ordnung des Datentyps!

In [17]:
en=enumerate({1,2,3,"eins",False})
print(list(en))

[(0, False), (1, 1), (2, 2), (3, 3), (4, 'eins')]


Damit haben wir unseren Python-Grundkurs beendet. <br>Man kann die Python-Kenntnisse natürlich weiter ausbauen, z.B. mit den Kursen "Fortgeschrittenes Python","Objektorientierung","Maschinellen Lernen mit Python" oder "numerisches Python", die wir anbieten. <br>
Um alles Gelernte aber wirklich in der Praxis anwenden zu können hilft nur :<br><br>
## üben,üben,üben...    

<img width=200 src="Images/sweat.jpg"/>