![alt text](../../pythonexposed-high-resolution-logo-black.jpg "Optionele titel")

### Iterators en Generators in Python

In deze les gaan we dieper in op **iterators** en **generators**, fundamentele concepten in Python die iteraties over data compact, flexibel en krachtig maken. We behandelen wat ze zijn, hoe ze werken, en hoe je ze zelf kunt maken.

### **1. Wat zijn Iterators?**

Een iterator in Python is een object dat een iterator protocol implementeert. Dit betekent dat het:

1. Een methode `__iter__()` heeft, die het iteratorobject zelf retourneert.
2. Een methode `__next__()` heeft, die het volgende element in de reeks retourneert. Als er geen elementen meer zijn, roept deze een `StopIteration`-uitzondering op.

Met iterators kun je data element voor element ophalen zonder dat de volledige data in het geheugen geladen hoeft te worden. Iterators worden vaak gebruikt in combinatie met `for`-lussen.

In [2]:
# Voorbeeld van een iterator in actie

s = 'abc'
it = iter(s)
print(next(it))  # Uitvoer: 'a'
print(next(it))  # Uitvoer: 'b'
print(next(it))  # Uitvoer: 'c'

# Volgende oproep:
# StopIteration-exceptie

# Hier zien we dat `iter(s)` een iterator maakt en dat `next()` telkens het volgende element ophaalt.

a
b
c


### **2. Iterators maken in klassen**
Je kunt zelf een iterator maken door de methoden `__iter__()` en `__next__()` te definiëren in een klasse.

**Voorbeeld: Iterator voor omgekeerde strings**

In [41]:
class Reverse:
    """Iterator voor het achteruit doorlopen van een reeks."""
    def __init__(self, data):
        self.data = data
        self.index = len(data)

    def __iter__(self):
        return self

    def __next__(self):
        if self.index == 0:
            raise StopIteration
        self.index -= 1
        return self.data[self.index]

rev = Reverse('spam')
for char in rev:
    print(char)

# Hier gebruiken we een klasse om een iterator te maken die een string achterstevoren doorloopt. 
# De `__iter__()` retourneert `self`, en `__next__()` beheert de iteratielogica.

m
a
p
s


### **3. Wat zijn Generators?**

Generators zijn een compactere en eenvoudigere manier om iterators te maken. In plaats van een klasse te definiëren met `__iter__()` en `__next__()`, gebruik je een functie met het sleutelwoord `yield`. Een generatorfunctie retourneert een generatorobject.  

Generators zijn dus niet direct gekoppeld aan objectgeoriënteerd programmeren (OOP). Ze zijn een voorbeeld van functionele programmeerstijl in Python en vereisen geen klassen of methoden. Terwijl iterators in OOP vaak met klassen worden geïmplementeerd (door `__iter__()` en `__next__()` te definiëren), bieden generators een eenvoudiger alternatief.  

Het gebruik van het sleutelwoord `yield` zorgt ervoor dat Python de iteratorfunctionaliteit automatisch beheert, wat de code leesbaarder en minder complex maakt.

In [6]:
# Voorbeeld: Generator voor omgekeerde strings

def reverse(data):
    for index in range(len(data)-1, -1, -1):
        yield data[index]

for char in reverse('golf'):
    print(char)

# Elke keer dat `yield` wordt aangeroepen, pauzeert de functie en onthoudt waar deze gebleven is. 
# Bij een volgende oproep wordt de uitvoering hervat vanaf dat punt.

f
l
o
g


**Hoe werken generators?**  

- Generators zijn eenmalig (exhaustible):
    - Een generator is een soort "lazy iterator" die waarden één voor één produceert op het moment dat je erom vraagt. Zodra een waarde is geproduceerd, "vergeet" de generator die waarde. Als de generator eenmaal is uitgeput (alle waarden zijn geproduceerd), kan deze niet opnieuw worden gebruikt.
- Geen opslag van gegevens:
    - In tegenstelling tot lijsten of andere containers slaat een generator geen waarden op in het geheugen. Het onthoudt alleen de huidige staat en hoe verder te gaan om de volgende waarde te genereren.

In [31]:
def square(nums):
    for num in nums:
        yield num ** 2

# onderstaande geeft enkel een generator object
results = square([1,2,3])
results

<generator object square at 0x7de93d79a0c0>

In [33]:
print(results)

# pas wanneer we een list maken van deze elementen worden ze effectief berekend!
list(results)

<generator object square at 0x7de93d79a0c0>


[1, 4, 9]

In [34]:
# indien we dezelfde generator nog eens opvragen...
list(results)

[]

**Zoals eerder aangegeven: eenmalig en exhaustief!**

**Voordelen van Generators**  

- Geen noodzaak om `__iter__()` en `__next__()` expliciet te implementeren.
- De interne status en lokale variabelen worden automatisch beheerd.
- Efficiënter in geheugenverbruik dan lijst-gebaseerde iteraties.

### **4. Generator-expressions**  

Generator-uitdrukkingen bieden een compacte syntaxis die lijkt op list-comprehensions, maar ronde haakjes gebruikt in plaats van vierkante.

In [8]:
# Voorbeelden van generator-expressions

# Som van kwadraten
total = sum(i * i for i in range(10))
print(total)

# Inwendig product
xvec = [10, 20, 30]
yvec = [7, 5, 3]
product = sum(x * y for x, y in zip(xvec, yvec))
print(product)

285
260


#### **Generator versus Lijst-comprehensions**
- **Generator-expressions** evalueren elk element on-demand, wat efficiënter is qua geheugen.
- **List-comprehensions** evalueren alle elementen in één keer en slaan ze op in het geheugen.

### **5. Toepassingen en Praktijkvoorbeelden**

**Data streaming**  

Generators zijn ideaal voor situaties waarin data in een stroom wordt verwerkt, zoals bij het lezen van grote bestanden of datastromen over een netwerk.

```python
def read_large_file(file_path):
    with open(file_path) as f:
        for line in f:
            yield line.strip()

for line in read_large_file("bigfile.txt"):
    print(line)
```

**Oneindige reeksen**  

Generators kunnen ook oneindige reeksen produceren:

```python
def infinite_counter(start=0):
    while True:
        yield start
        start += 1

counter = infinite_counter()
print(next(counter))  # Uitvoer: 0
print(next(counter))  # Uitvoer: 1
```

**Iterators in Data Science**

Iterators zijn bijzonder nuttig in data science vanwege hun efficiëntie en flexibiliteit. Enkele toepassingen zijn:

- **Lazy Loading van Data:** Bij het werken met grote datasets (zoals CSV's of databases) kunnen iterators gebruikt worden om data rij voor rij in te lezen, zonder alles tegelijk in het geheugen te laden.

    ```python
    import csv

    def csv_reader(file_name):
        with open(file_name) as file:
            reader = csv.reader(file)
            for row in reader:
                yield row

    for row in csv_reader("large_data.csv"):
        print(row)
    ```

**Batchverwerking:**  

Iterators kunnen worden gebruikt om data in batches te verwerken, wat nuttig is voor machine learning of big data-toepassingen.

```python
    def batch_iterator(data, batch_size):
        for i in range(0, len(data), batch_size):
            yield data[i:i+batch_size]

    data = list(range(100))
    for batch in batch_iterator(data, 10):
        print(batch)
```

**Pipelines:** In data science worden iterators vaak gebruikt in verwerkingpipelines, waarbij data in stappen wordt getransformeerd.

In [36]:
def square(nums):
    for num in nums:
        yield num ** 2

def double(nums):
    for num in nums:
        yield num * 2

nums = range(10)
pipeline = double(square(nums))

In [37]:
for result in pipeline:
    print(result)

0
2
8
18
32
50
72
98
128
162


### **6. Samenvatting**  

- **Iterators** bieden een uniforme manier om door collecties te lopen, met `__iter__()` en `__next__()`.
- **Generators** maken iterators eenvoudiger door gebruik van het `yield`-statement.
- **Generator-uitdrukkingen** zijn compacte, geheugen-efficiënte manieren om iteraties te beschrijven.
- **Iterators in data science** helpen bij het efficiënt verwerken van grote datasets, batchverwerking en het opzetten van flexibele verwerkingpipelines.

Gebruik iterators en generators in je code om flexibele en efficiënte iteraties mogelijk te maken!


### **7. Overzichtsvragen**

1. **Wat is het verschil tussen een iterator en een iterable?**

> Een iterable is een object waarover je kunt itereren, zoals lijsten of strings. Een iterator is een object dat het protocol `__iter__()` en `__next__()` implementeert om elementen één voor één op te halen.

2. **Wat doet het `yield`-statement in een generator?**

> Het `yield`-statement pauzeert de functie en retourneert een waarde. Bij de volgende oproep hervat de functie vanaf het punt waar deze is gestopt.

3. **Waarom zijn generators efficiënter in geheugenverbruik dan lijst-comprehensions?**

 > Generators evalueren elementen on-demand, terwijl lijst-comprehensions de volledige lijst in het geheugen laden.

4. **Hoe kun je een klasse implementeren die als iterator fungeert?**

> Door de methoden `__iter__()` en `__next__()` te definiëren. `__iter__()` retourneert het iteratorobject en `__next__()` haalt het volgende element op of roept een `StopIteration`-uitzondering op.

5. **Wat zijn enkele toepassingen van iterators in data science?**

> Iterators worden gebruikt voor lazy loading, batchverwerking en pipelines voor efficiënte dataverwerking.