Um Operationen an Objekten innerhalb einer Liste durchzuführen werden für gewöhnlich For-Iteratoren genutzt. Ohne Filter wird die gesamte Liste durchlaufen, was bei großen Datensätzen viel Speichervolumen verbraucht

In [None]:
def square_numbers(nums):
    result = []
    for i in nums:
        result.append(i * i)
    return result


my_nums = square_numbers([1, 2, 3, 4, 5])

print(my_nums)  # [1, 4, 9, 16, 25]

Um diese Funktion in eine Generatorfunktion umzuwandeln, nutzen wir das yield-Argument. Yield dient dazu, die Funktion zu beenden ohne dass ein Wert zurückgegeben wird (anders als bei return). Die Funktion wird pausiert und merkt sich ihren Zustand.

In [2]:
def square_numbers(nums):
    for i in nums:
        yield (i * i)


my_nums = square_numbers([1, 2, 3, 4, 5])

print(my_nums)  # [1, 4, 9, 16, 25] <-- Vorherige Ausgabe wird nun zu <generator object>

<generator object square_numbers at 0x10ca20450>


Um zu verdeutlichen, wie Generatoren funktionieren, können wir die Werte einzeln abrufen und dabei die next()-Funktion verwenden:

In [4]:
def square_numbers(nums):
    for i in nums:
        yield (i * i)


my_nums = square_numbers([1, 2, 3, 4, 5])

print(next(my_nums))  # [1]
print(next(my_nums))  # [4]
print(next(my_nums))  # [9]

1
4
9


Trotzdem können wir For-Schleifen verwenden, um die einzelnen Indizes in der Liste zu durchlaufen, zu planen und später zu berechnen. Dadurch sparen wir uns Speicherkapazität, weil wir erst berechnen müssen, sobald wir es wünschen.

In [7]:
def square_numbers(nums):
    for i in nums:
        yield (i * i)


my_nums = square_numbers([1, 2, 3, 4, 5])

for num in my_nums:
    print(num)

[1, 4, 9, 16, 25]


List Comprehension bedeutet auf Deutsch Listenvergleich oder Listenerzeugung (wörtlich: "Listenanfassung").

Wie es funktioniert:

List Comprehension ist eine kompakte Syntax, um Listen zu erzeugen. Statt eine normale For-Schleife zu schreiben, schreibst du alles in einer Zeile in Klammern:

Das ist eine Generator Expression – eine Variante von List Comprehension, die wie yield funktioniert:

In [8]:
my_nums = (x * x for x in [1, 2, 3, 4, 5])

for num in my_nums:
    print(num)

1
4
9
16
25


In unserem Projekt nutzen wir Itertools um eine Lazy-Evaluation zu erzeugen. Diese Library bietet Funktionen, die über die Yield-Funktion hinausgehen, aber vom Prinzip her dasselbe macht. Sie spart Speicher ein, indem sie die Computation erst bei Abfrage durchführt. Hier ein Beispiel zum besseren Verständnis:

In [9]:
import itertools

# Ohne itertools: Erzeugt sofort eine große Liste mit allen Werten
# numbers = list(range(1000000))  # Belastet den Speicher stark!

# Mit itertools: Lazy-Evaluation - berechnet Werte nur bei Bedarf
infinite_counter = itertools.count(
    1
)  # Startet bei 1, geht theoretisch unendlich weiter

# map() wird auf jeden Wert angewendet, aber LAZY (erst bei Abfrage)
squared = map(lambda x: x**2, infinite_counter)

# islice() nimmt nur die ersten 5 Werte - speichert NICHT die unendliche Liste
first_five = itertools.islice(squared, 5)

print("Erste 5 Quadrate:")
print(list(first_five))  # [1, 4, 9, 16, 25]

# Und noch weitere 3 Werte
more_values = itertools.islice(squared, 3)
print("\nWeitere 3 Quadrate:")
print(list(more_values))  # [36, 49, 64]

Erste 5 Quadrate:
[1, 4, 9, 16, 25]

Weitere 3 Quadrate:
[36, 49, 64]
