# 🔄 Iterabili e Iteratori in Python

## 📚 Introduzione

In Python, **l'iterazione** è uno dei concetti fondamentali per la manipolazione e l'elaborazione di collezioni di dati. Alla base di ogni ciclo `for`, `while` o costrutto iterativo, esiste un insieme di meccanismi che coinvolgono due concetti strettamente legati:

- **Iterabile** (*Iterable*)
- **Iteratore** (*Iterator*)

Questi concetti non rappresentano semplici "tipi di oggetti", ma definiscono **comportamenti specifici** che gli oggetti possono esibire quando vengono usati in contesti iterativi. Comprendere come funzionano questi comportamenti permette di scrivere codice più efficiente, controllato e conforme ai principi del linguaggio Python.

## 🔁 Cos'è un Iterabile?

Un **iterabile** è un oggetto che rappresenta una **sequenza di elementi** e che è in grado di **fornire un iteratore** per accedere a questi elementi uno alla volta.

Un oggetto è considerato **iterabile** se implementa il **protocollo dell'iterabile**, ovvero se:

- **implementa un metodo speciale chiamato `__iter__()`**
- questo metodo restituisce un **oggetto iteratore**

Un iterabile è quindi **una collezione di dati** che non è direttamente responsabile di fornire ciascun valore uno dopo l'altro, ma **sa come creare** un oggetto incaricato di farlo.

In [1]:
# Una lista è un iterabile: possiede il metodo __iter__()
lista = [10, 20, 30]
print('__iter__' in dir(lista))  # True

True


In [2]:
# Anche una stringa è un iterabile
stringa = "ciao"
print('__iter__' in dir(stringa))  # True

True


In [3]:
# Anche un dizionario è un iterabile
dizionario = {"a": 1, "b": 2}
print('__iter__' in dir(dizionario))  # True

True


In [4]:
type(stringa.__iter__())

str_iterator

Come abbiamo potuto osservare, se un oggetto implementa il metodo `__iter__()`, quando esso viene chiamato, restituisce un oggetto **iteratore**.

## 🔄 Cos'è un Iteratore?

Un **iteratore** è un oggetto che **mantiene uno stato interno** e che sa **come restituire i valori successivi** di una sequenza, uno alla volta, fino all'esaurimento degli elementi.

Un oggetto è considerato **un iteratore** se:

- **implementa il metodo `__next__()`**, che restituisce l’elemento successivo nella sequenza a ogni chiamata
- **implementa anche il metodo `__iter__()`**, che restituisce l'oggetto stesso (quindi un iteratore è anche un iterabile)

La caratteristica principale dell’iteratore è che, una volta consumati tutti gli elementi, ogni ulteriore richiesta tramite `__next__()` causerà il sollevamento di un’**eccezione di tipo `StopIteration`**, che segnala la **fine dell’iterazione**.

In [5]:
# Gli iteratori sono oggetti che hanno sia __iter__() che __next__()
lista = [1, 2, 3]

# Creazione di un iteratore a partire da un iterabile
iteratore = lista.__iter__()
type(iteratore)

list_iterator

In [6]:
type(lista)

list

In [7]:
# L'oggetto ottenuto è un iteratore
print('__iter__' in dir(iteratore))   # True
print('__next__' in dir(iteratore))   # True

True
True


In [8]:
# Accesso sequenziale agli elementi tramite __next__()
print(iteratore.__next__())  # 1
print(iteratore.__next__())  # 2
print(iteratore.__next__())  # 3

1
2
3


Quindi l'iteratore si "consuma" ogni volta che usiamo il metodo `__next__()`. Quindi se utilizziamo il metodo ancora una volta, otteniamo un errore dall'interprete:

In [9]:
# print(iteratore.__next__()) # StopIteration Error

## ⚙️ Differenza tra Iterabile e Iteratore

| Caratteristica | Iterabile | Iteratore |
|----------------|-----------|-----------|
| Responsabilità | Sa come **fornire un iteratore** | Sa come **restituire i valori uno a uno** |
| Metodo richiesto | `__iter__()` | `__iter__()` e `__next__()` |
| Stato interno | Non mantiene stato | Mantiene uno **stato interno** tra chiamate successive |
| Riutilizzabile | Può essere usato per creare **nuovi iteratori** ogni volta | **Non riutilizzabile** una volta esauriti gli elementi |
| Tipico esempio | Liste, stringhe, tuple | Oggetto restituito da `iter()` |

Quindi, un iterabile può fornire uno (o più) iteratori, ovvero ha la potenzialità di generare un iteratore.

In [10]:
# Possiamo generare piu iteratori dallo stesso iterabile
print(lista.__iter__())
print(lista.__iter__())

<list_iterator object at 0x72cee8109030>
<list_iterator object at 0x72cee810a500>


### 🗂️ Dizionari: iterabili e iteratori

- Un **dizionario** in Python è un oggetto **iterabile**, il che significa che si può ottenere un iteratore da esso chiamando il metodo `__iter__()`.
- L’iteratore ottenuto da un dizionario scorre **le chiavi** del dizionario, una alla volta.
- L’iteratore implementa il metodo `__next__()`, che restituisce la chiave successiva ogni volta che viene chiamato.
- Quando si raggiungono tutte le chiavi, una chiamata successiva a `__next__()` genera un’eccezione `StopIteration` (tipico comportamento di tutti gli iteratori).

**In sintesi:**

- Dizionario = iterabile (puoi chiamare `__iter__()` su di esso)  
- Iteratore del dizionario = oggetto con `__next__()` che restituisce le chiavi, una alla volta

Se vuoi iterare sui valori o sulle coppie chiave-valore, puoi ottenere iterabili e iteratori specifici usando i metodi `.values()` e `.items()` del dizionario, che funzionano in modo analogo.  

In [11]:
# Dizionario semplice
diz = {'a': 1, 'b': 2, 'c': 3}

# Un dizionario è un iterabile: possiamo ottenere un iteratore chiamando __iter__()
iter_diz = diz.__iter__()

# Verifica che iter_diz è un iteratore (ha __next__)
print('__next__' in dir(iter_diz))  # True

# Accesso manuale alle CHIAVI tramite l'iteratore
print(iter_diz.__next__())  # 'a' (prima chiave)
print(iter_diz.__next__())  # 'b' (seconda chiave)
print(iter_diz.__next__())  # 'c' (terza chiave)

True
a
b
c


In [12]:
# Otteniamo un iterabile sui valori
valori_iterabile = diz.values()

# Creiamo un iteratore sui VALORI
iter_valori = valori_iterabile.__iter__()

print('__next__' in dir(iter_valori))  # True

# Accesso manuale ai VALORI
print(iter_valori.__next__())  # 10
print(iter_valori.__next__())  # 20
print(iter_valori.__next__())  # 30

True
1
2
3


## 🧠 Perché questa distinzione è importante?

Questa distinzione permette a Python di:

- **Separare la struttura dei dati dalla logica di accesso** sequenziale: un iterabile può essere semplice da rappresentare, mentre l’iteratore si occupa della logica dell’avanzamento.
- **Supportare la lazy evaluation**: gli iteratori possono produrre dati “su richiesta” senza doverli tenere tutti in memoria.
- **Consentire l’uso di cicli `for`**, funzioni come `map()`, `filter()`, e comprensioni, basandosi sul protocollo dell’iterazione.

## 🧭 Protocollo dell’Iterazione in breve

1. Quando un oggetto viene usato in un ciclo `for`, Python chiama il suo metodo `__iter__()`.
2. Questo metodo restituisce un oggetto **iteratore**.
3. Python continua a chiamare il metodo `__next__()` sull’iteratore per ottenere ciascun valore.
4. Quando non ci sono più valori, il metodo `__next__()` solleva l’eccezione `StopIteration`.
5. Il ciclo `for` intercetta l’eccezione e termina l’iterazione.

In [13]:
# In un ciclo for, Python chiama internamente __iter__() per ottenere un iteratore
lista = ["a", "b", "c"]
iteratore = lista.__iter__()

# Poi chiama __next__() per ottenere ogni elemento
elemento1 = iteratore.__next__()
print(elemento1)  # "a"

elemento2 = iteratore.__next__()
print(elemento2)  # "b"

elemento3 = iteratore.__next__()
print(elemento3)  # "c"

# Una ulteriore chiamata a __next__() genererebbe un errore StopIteration
# ma qui non possiamo gestirlo, perciò ci fermiamo

a
b
c


## 🧩 Alcune proprietà aggiuntive degli iteratori

- Gli **iteratori sono consumabili**: una volta iterati completamente, non possono essere riutilizzati senza ricrearne uno nuovo.
- Gli **iteratori non hanno lunghezza** nota a priori, a differenza delle liste o tuple.
- La loro natura li rende ideali per lavorare con **flussi di dati infiniti o grandi** (es. file, stream, generatori).

### 🧬 Iteratori e gestione efficiente di grandi quantità di dati

Quando lavoriamo con dataset di dimensioni molto grandi — ad esempio una sequenza genomica composta da miliardi di caratteri (A, C, G, T) — caricare l'intera struttura in memoria può essere estremamente inefficiente o addirittura impossibile. Strutture come `list`, `str` o `tuple` contengono tutti i dati in RAM, il che non è scalabile per file di grandi dimensioni.

#### ✅ Iteratori come soluzione

Gli **iteratori** permettono di elaborare dati **uno alla volta**, senza bisogno di caricare l'intera sequenza in memoria. Questo approccio si chiama **lazy evaluation** (valutazione pigra): i dati vengono forniti solo quando richiesti, tramite il metodo `__next__()`.

In questo modo:

- ✅ l'utilizzo di memoria è minimo (viene mantenuto solo l'elemento corrente),
- ✅ l'applicazione può scalare facilmente a dataset enormi,
- ✅ si riducono i tempi di caricamento iniziale.

#### 📌 Esempio realistico

Nel caso di un file contenente il genoma umano (oltre 3 miliardi di caratteri), è possibile aprirlo come un iteratore di caratteri o righe. Python fornisce oggetti file che **sono già iteratori**: è quindi possibile leggere il file **una riga alla volta**, con un impatto minimo sulla memoria.

Questo approccio è utile, ad esempio, per:

- contare la frequenza di una base (es. quante volte appare "G"),
- cercare un pattern genetico,
- validare o convertire il formato dei dati,
- generare statistiche in tempo reale.

Usando un iteratore, possiamo **analizzare il file pezzo per pezzo**, senza mai caricare tutto in memoria. Questo è un vantaggio chiave nella programmazione di basso livello su grandi dataset.

Nella cella seguente, viene mostrato un esempio concreto in Python.

In [14]:
# Generiamo il file del genoma

# Apriamo un file in modalità scrittura binaria (più efficiente)
nome_file_grande = "./genoma.txt"

chunk = ("ACGT" * 250_000) + "\n"  # circa 1 MB per chunk (4 bytes * 250,000 = 1,000,000 bytes circa)
# Scriviamo 4000 chunk da 1 MB = circa 4 GB

with open(nome_file_grande, "w") as f:
    for _ in range(4000):
        f.write(chunk)
    f.close()

In [15]:
import tracemalloc

# --- Uso iteratore (leggi una riga alla volta) ---
file_iter = open(nome_file_grande, "r")

tracemalloc.start()  # inizia a tracciare la memoria
prima_riga = file_iter.__next__()
current_mem, peak_mem = tracemalloc.get_traced_memory()
tracemalloc.stop()

print(f"[Iteratore] Lunghezza prima riga: {len(prima_riga.strip())} caratteri")
print(f"[Iteratore] Memoria attuale: {current_mem / 1024 / 1024:.2f} MB, picco: {peak_mem / 1024 / 1024:.2f} MB")

file_iter.close()

[Iteratore] Lunghezza prima riga: 1000000 caratteri
[Iteratore] Memoria attuale: 0.96 MB, picco: 1.92 MB


In [16]:
# --- Uso read() (carica tutto il file in RAM) ---
file_whole = open(nome_file_grande, "r")

tracemalloc.start()
contenuto = file_whole.read()
prima_riga_whole = contenuto.split()[0]
current_mem2, peak_mem2 = tracemalloc.get_traced_memory()
tracemalloc.stop()

print(f"\n[Read()] Lunghezza prima riga: {len(prima_riga_whole.strip())} caratteri")
print(f"[Read()] Memoria attuale: {current_mem2 / 1024 / 1024:.2f} MB, picco: {peak_mem2 / 1024 / 1024:.2f} MB")

file_whole.close()


[Read()] Lunghezza prima riga: 1000000 caratteri
[Read()] Memoria attuale: 3815.66 MB, picco: 7629.62 MB


## 🧰 Oggetti built-in iterabili

Python offre molte **strutture dati** che sono nativamente iterabili:

- Liste, tuple, insiemi e dizionari
- Stringhe
- Oggetti restituiti da funzioni come `range()`, `zip()`, `enumerate()`
- File aperti (iterano riga per riga)
- Oggetti definiti dall’utente che implementano `__iter__()`

### 📏 Oggetto di tipo `range`: Iterabile ma non Iteratore

- L’oggetto `range` rappresenta una sequenza di numeri ed è **iterabile**, il che significa che può restituire un iteratore tramite il metodo `__iter__()`.
- Tuttavia, `range` **non è di per sé un iteratore**, perché non implementa il metodo `__next__()`.
- Per scorrere gli elementi di un `range`, è necessario prima ottenere un iteratore da esso chiamando `__iter__()`.
- L’iteratore restituito da `range.__iter__()` implementa `__next__()` e permette di ottenere gli elementi uno per uno.

**Riassunto:**

| Tipo oggetto   | `__iter__()` | `__next__()` | Cos’è?         |
|----------------|--------------|--------------|----------------|
| `range`        | Sì           | No           | Iterabile      |
| `range.__iter__()` | Sì        | Sì           | Iteratore      |

In [17]:
# Oggetto di tipo range
intervallo = range(0, 3)

# range è iterabile
print('__iter__' in dir(intervallo))  # True

# Ma non è un iteratore
print('__next__' in dir(intervallo))  # False

# Possiamo creare un iteratore da esso
it = intervallo.__iter__()
print(it.__next__())  # 0
print(it.__next__())  # 1
print(it.__next__())  # 2

True
False
0
1
2


### 🔗 Uso di `zip`: iteratore di tuple

- La funzione built-in `zip()` prende due o più iterabili e restituisce un **iteratore** che produce tuple composte dagli elementi corrispondenti di ogni iterabile.
- `zip` è un **iteratore** perché implementa `__next__()`, quindi può essere usato direttamente per ottenere gli elementi uno alla volta.
- Le tuple restituite da `zip` combinano i valori degli input posizionati allo stesso indice.

**Esempio di comportamento:**

- Input: liste `[1, 2, 3]` e `['a', 'b', 'c']`
- Output `zip`: (1, 'a'), (2, 'b'), (3, 'c')

In [18]:
# Due liste
numeri = [1, 2, 3]
lettere = ["a", "b", "c"]

# zip() crea un iteratore di tuple
z = zip(numeri, lettere)

# zip è un iteratore (ha __next__)
print('__next__' in dir(z))  # True

# Accesso manuale alle tuple
print(z.__next__())  # (1, 'a')
print(z.__next__())  # (2, 'b')
print(z.__next__())  # (3, 'c')

True
(1, 'a')
(2, 'b')
(3, 'c')


### 🔢 Uso di `enumerate`: iteratore con indice

- `enumerate()` prende un iterabile e restituisce un **iteratore** che produce tuple `(indice, elemento)`.
- È molto utile quando si vuole accedere sia all’elemento sia alla sua posizione durante l’iterazione.
- Come `zip`, `enumerate` implementa `__next__()` e quindi è un iteratore pronto all’uso.

**Esempio di comportamento:**

- Input: lista `['mela', 'banana', 'ciliegia']`
- Output `enumerate`: (0, 'mela'), (1, 'banana'), (2, 'ciliegia')

In [19]:
# Lista di elementi
frutti = ["mela", "banana", "ciliegia"]

# --- Enumerate ---
# enumerate() crea un iteratore di tuple (indice, elemento)
enum = enumerate(frutti)

# enumerate è un iteratore (ha __next__)
print('__next__' in dir(enum))  # True

# Accesso manuale alle tuple (indice, elemento)
print(enum.__next__())  # (0, 'mela')
print(enum.__next__())  # (1, 'banana')
print(enum.__next__())  # (2, 'ciliegia')

True
(0, 'mela')
(1, 'banana')
(2, 'ciliegia')


### 🔄 Uso di `reversed()`: iteratore inverso

- La funzione built-in `reversed()` prende una sequenza (come una lista o una stringa) e restituisce un **iteratore** che attraversa gli elementi in ordine inverso.
- `reversed` è un iteratore perché implementa `__next__()`, quindi possiamo usarlo per scorrere gli elementi a ritroso uno alla volta.
- Non modifica l’oggetto originale, ma crea un iteratore che genera gli elementi in senso opposto.

**Esempio di comportamento:**

- Input: lista `[10, 20, 30]`
- Output `reversed`: 30, 20, 10

In [20]:
# Lista di numeri
numeri = [10, 20, 30]

# reversed() crea un iteratore che scorre la lista al contrario
rev_iter = reversed(numeri)

# reversed è un iteratore (ha __next__)
print('__next__' in dir(rev_iter))  # True

# Accesso manuale agli elementi al contrario
print(rev_iter.__next__())  # 30
print(rev_iter.__next__())  # 20
print(rev_iter.__next__())  # 10

True
30
20
10


### 📋 `sorted()`: restituisce una nuova lista ordinata

- La funzione `sorted()` prende un iterabile e restituisce una **nuova lista** contenente gli elementi ordinati.
- La lista risultante è iterabile, ma **non è un iteratore**.
- Per ottenere un iteratore dalla lista ordinata, si può usare la funzione `iter()`.

### 🔧 `iter()`: creare un iteratore da un iterabile

- `iter()` è una funzione built-in che prende un oggetto iterabile e restituisce un **iteratore**.
- Questo iteratore può essere usato per ottenere gli elementi uno alla volta con `__next__()`.
- È il modo standard per trasformare un iterabile in un iteratore esplicitamente.

In [21]:
numeri = [3, 1, 2]

# sorted() restituisce una lista ordinata
lista_ordinata = sorted(numeri)  # [1, 2, 3]

# Creiamo un iteratore dalla lista ordinata
it = iter(lista_ordinata)

print(it.__next__())  # 1
print(it.__next__())  # 2
print(it.__next__())  # 3

1
2
3


## ✅ Conclusioni

In questa sezione abbiamo esplorato a fondo i concetti di **iterabili** e **iteratori** in Python, pilastri fondamentali per la gestione efficiente e flessibile di sequenze di dati.

### Punti chiave:

- Un **iterabile** è un oggetto che **sa come restituire un iteratore** tramite il metodo `__iter__()`.
- Un **iteratore** è un oggetto che mantiene uno **stato interno** e produce gli elementi uno alla volta con `__next__()`.
- Gli iteratori sono **consumabili**: una volta terminati, non possono essere riutilizzati senza crearne di nuovi.
- La distinzione permette a Python di supportare la **lazy evaluation**, importante per elaborare grandi o infiniti flussi di dati senza caricarli completamente in memoria.
- Molte strutture dati e funzioni built-in come `range()`, `zip()`, `enumerate()`, `reversed()` restituiscono iteratori o oggetti iterabili.
- Lavorare con iteratori consente di scrivere codice più **efficiente, pulito e modulare**, specialmente con dataset grandi (es. file di testo molto grandi o stream di dati).

### Implicazioni pratiche:

- L’iterazione è alla base di cicli `for` e molte funzionalità di Python.
- Comprendere come funzionano iterabili e iteratori aiuta a evitare errori come il consumo involontario di un iteratore.
- Permette di scrivere algoritmi che gestiscono dati molto grandi senza esaurire la memoria.

➡️ Ora sei pronto per approfondire il **controllo dei cicli iterativi** (`for` e `while`), che sfruttano proprio questi meccanismi per processare sequenze di dati.
<a href="https://colab.research.google.com/github/lorenzo-arcioni/programmazione-python-base/blob/main/Capitolo4_Decisioni_e_Cicli/3_For_e_While.ipynb" target="_blank"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>