# Iterators

Il più comune iteratore in Python è _range_

In [None]:
for i in range(10): 
    print(i, end=' ')

In [None]:
type(range(10))

range non è una lista ma _qualcosa_ chiamata _iterator_

Esempio

In [None]:
for value in [2, 4, 6, 8, 10]: 
    print(value, end=' ')

Quando scrivete qualcosa come for _val_ in _L_, l'interprete Python controlla se _L_ ha un'interfaccia iteratore.

Esempio:

In [None]:
iter([2, 4, 6, 8, 10])

In [None]:
I = iter([2, 4, 6, 8, 10]) 
print(next(I))

In [None]:
print(next(I))

In [None]:
print(next(I))

In [None]:
type(I)

In [None]:
a=range(0,100)

In [None]:
type(a)

Ciò consente a Python di trattare come liste cose che non sono effettivamente liste!

Il vantaggio derivato dall'uso dell'iteratore è che _la lista completa non viene mai creata realmente_

In [None]:
N=10**12
for i in range(N):
    if i >= 100: break 
    print(i, end=', ')

Se il _range_ dovesse effettivamente creare la lista, questa conterrebbe circa un trilione di valori e occuperebbe decine di terabyte di memoria della macchina.

### Iteratori Utili ###

#### enumerate

Spesso non si vuole solo *iterare* sui valori di un array ma si vuole anche tenere traccia dell'indice.

In [None]:
L = [2, 4, 6, 8, 10]

In [None]:
len(L)

In [None]:
for i in range(len(L)):
    print(i, L[i])

*Più compatto e Python-like*

In [None]:
for i, val in enumerate(L):
    print(i, val)

#### zip

In alcuni casi si hanno liste multiple sulle quali è necessario iterare simultaneamente

Modalità non-Python:

In [None]:
L = [2, 4, 6, 8, 10]
R = [3, 6, 9, 12, 15]
for i in range(len(L)):
    print(L[i],R[i])

In [None]:
L = [2, 4, 6, 8, 10]
R = [3, 6, 9]
for i in range(len(L)):
    print(L[i],R[i])

_Python-like_

In [None]:
L = [2, 4, 6, 8, 10]
R = [3, 6, 9, 12, 15]
for lval, rval in zip(L, R):
    print(lval, rval)

Se la lunghezza delle due liste non è uguale?

In [None]:
L = [2, 4, 6, 8, 10]
R = [3, 6, 9]
for lval, rval in zip(L, R):
    print(lval, rval)

#### map e filter

L'iteratore _map_ accetta come argomento una funzione e la applica ai valori in un oggetto che implementa l'interfaccia iteratore:

In [None]:
# stampa i primi 10 numeri al quadrato

square = lambda x: x ** 2
for val in map(square, range(10)): 
    print(val, end=' ')

In [None]:
# stampa i primi 10 numeri al quadrato

for val in map(lambda x: x ** 2, range(10)): 
    print(val, end=' ')

L'iteratore _filter_ sembra simile, tranne che viene applicata solo per quei valori per cui la funzione è _True_:

In [None]:
is_even=lambda x:x%2==0
for val in filter(is_even, range(10)): 
    print(val, end=' ')

In [None]:
F=filter(is_even, range(10))

In [None]:
next(F)

In [None]:
next(F)

In [None]:
type(F)

In [None]:
L = list(F)

In [None]:
L

## iterable unpacking

Il termine *Unpacking* in Python si riferisce a un'operazione che consiste nell'assegnare un iterabile a una tupla (o una lista) di variabili con una singola istruzione di assegnazione. 

Viceversa, il termine *Packing* può essere utilizzato quando si raggruppano diversi valori in una singola variabile utilizzando l'operatore di *iterable unpacking*, *.

L'operatore * in questo contesto noto come operatore di *iterable unpacking* estende la funzionalità di unpacking per consentire di comprimere più valori in una singola variabile.

Nell'esempio seguente, impacchettamo una tupla in una singola variabile utilizzando l'operatore *:

In [None]:
*a, = (1,2,3,4,5)

In [None]:
a

In [None]:
type(a)

Attenti alla virgola, la seguente produce un errore

In [None]:
*a = (1,2,3,4,5)

In [None]:
*a, b = 1, 2, 3, 4, 5

In [None]:
a

In [None]:
b

In [None]:
first,*middle,last = [1,5,6,3,2,1,3,20,20,40,503]

In [None]:
first, last

In [None]:
middle

In [None]:
*first,middle,last = [1,5,6,3,2,1,3,20,20,40,503]

In [None]:
first, middle, last

In [None]:
first,middle,*last = [1,5,6,3,2,1,3,20,20,40,503]

In [None]:
first, middle, last

In [None]:
first,second,*middle,before,last = [1,5,6,3,2,1,3,20,20,40,503]

In [None]:
middle

Non possiamo avere più di un operatore di unpacking nella stessa operazione:

In [None]:
*a,*b = [1,5,6,3,2,1,3,20,20,40,503]

**Unire liste con l'unpacking**

Possiamo unire due liste con l'operatore unpacking. Osserva le differenze:

In [None]:
a = [1, 2]
b = [3, 4]

c = [a, b]
print(c)

Otteniamo una lista di liste.

In [None]:
a = [1, 2]
b = [3, 4]

c = [*a, *b]
print(c)

La lista *c* è creata a partire dei valori delle liste *a* e *b*

**Funzioni e unpacking**

Supponiamo di avere una funzione che accetta 3 argomenti

In [None]:
def my_sum(a, b, c):
    return a + b + c

Tradizionalmente passeremmo gli argomenti in questo modo:

In [None]:
my_list = [1, 2, 3]

result = my_sum(my_list[0], my_list[1], my_list[2])
print(result) 

In Python con il packing/unpacking possiamo scrivere invece:

In [None]:
result = my_sum(*my_list)
print(result)

Ecco come fa la funzione print ad accettare un numero non definito di parametri:

In [None]:
print('a','b','c','a','b','c')

**unpacking con i dizionari**

Mentre un singolo asterisco viene utilizzato per l'operazione di unpacking su liste e tuple (o più in generale su iterable), il doppio asterisco ( ** ) viene utilizzato per l'unpacking sui dizionari.

Attenzione però, non possiamo decomprimere un dizionario in una singola variabile come fatto con tuple e liste.

In [None]:
**greetings, = {'hello': 'HELLO', 'bye':'BYE'} 

Tuttavia, possiamo utilizzare l'operatore ** all'interno di altri dizionari. Infatti tale operatore viene usato per combinare più dizionari.

In [None]:
food = {'fish':3, 'meat':5, 'pasta':9} 
colors = {'red': 'intensity', 'yellow':'happiness'}
merged_dict = {**food, **colors}

In [None]:
merged_dict

Per i dizionari si può utilizzare l'operatore * per accedere alle chiavi:

In [None]:
def f(a, b, c):
    print(a)
    print(b)
    print(c)

In [None]:
f(*food)

Posso anche passare i valori con l'operatore **

In [None]:
my_dict = {'a': 1, 'b': 2, 'c': 3}

f(**my_dict)

Attenzione ai nomi delle chiavi però:

In [None]:
my_dict = {'a': 1, 'b': 2, 'd': 3}

f(**my_dict)

**Passaggio di parametri alle funzioni**

L'operatore ** viene utilizzato esclusivamente per i dizionari. Ciò significa che con questo operatore siamo in grado di passare coppie chiave-valore alle funzioni come parametro.

In [None]:
def func(required, *args, **kwargs):
    ''' descrizione della funzione func'''
    print(required)
    print(args)
    print(kwargs)


func("Ciao...", 1, 2, 3, 4, 5, 6, site='test.com', test='test')


In [None]:
func("Ciao...")

In [None]:
func("Ciao...",site='test.com')

Vi ricordate la funzione print? quanti valori prende in ingresso?

In [None]:
help(print)

In [None]:
func.__doc__

Le funzioni quindi possono avere _argomenti_ e _keyword arguments_ che sono argomenti caratterizzati da una parola chiave.

In [None]:
print(1, 2, 3, end='--')

In [None]:
print(1, 2, 3, sep='--')

In [None]:
for i in range(1,4):
    print(i,end='--')

## List Comprehensions

La _list comprehension_ è semplicemente un modo per comprimere la creazione di una lista in una singola linea breve, concisa e allo stesso tempo leggibile.

ES: Costruire una lista con i quadrati dei primi 10 numeri partendo da 0

In [None]:
L = []
for n in range(10):
    L.append(n ** 2)

In [None]:
L

Equivalentemente in Python possiamo scrivere:

In [None]:
L=[ n ** 2 for n in range(10) ]

In [None]:
L

In [None]:
L=[ 1 for n in range(10) ]

In [None]:
L

In generale:

[_expr_ **for** _var_ **in** _iterable_]

**Condizione sull'iteratore**

Costruire una lista, saltando i multipli di 3

In [None]:
L = []
for val in range(20):
    if val % 3:
        L.append(val)

In [None]:
L

ES: Costruire una lista, saltando i multipli di 3 (list comprehension)

In [None]:
T = [val for val in range(20) if val % 3 > 0]

In [None]:
T

**Condizione sul valore**

Se avete programmato in C, avrete familiarità con la condizione su singola linea mediante l'operatore ? :

In [None]:
# in linguaggio C
int absval= (val<0) ? -val : val

In Python esiste qualcosa di simile:

In [None]:
val = -10
absval = val if val >= 0 else -val

In [None]:
absval

Costruire una lista, saltando i multipli di 3, e prendendo il valore negativo dei mutlipli di 2

In [None]:
[val if val % 2 else -val for val in range(20) if val % 3 > 0]

Oppure in modo più leggibile

In [None]:
[val if val % 2 else -val
for val in range(20) if val % 3]

**Nota:** l'interruzione di riga all'interno della list comprehension prima dell'espressione for è consentito in Python ed è spesso considerato un buon modo per spezzare le list comprehension lunghe per una maggiore leggibilità.

**Valori mulitpli con le tuple**

In [None]:
[(i, j) for i in range(2) for j in range(3)]

Utilizzabile anche con i *set*, in questo caso si parla di *set comprehension*

In [None]:
{n**2 for n in range(12)}

Le ripetizioni vengono eliminate

In [None]:
{a % 3 for a in range(10000)}

In [None]:
[a % 3 for a in range(10000)]

### Un riassunto sulle List Comprehension

Ogni list comprehension usa il seguente template:

my_list=[ expression **for** item **in** iterable (**if** condition) ]

Due parentesi quadre che racchiudono i seguenti tre elementi chiave:
- un ciclo for per iterare su un *iterable*
- Una espressione per trattare gli item
- Una condizione if opzionale

### Caso 1: Sostituire il ciclo for

In [None]:
full_name = "Davide Taibi"
characters = [char for char in full_name]

print(full_name)
print(characters)

Più compatto di:

In [None]:
full_name = "Davide Taibi"
characters = []
for char in full_name:
    characters.append(char)
    
print(full_name)
print(characters)

Tutti gli oggetti di tipo iterabile possono essere usati in python nelle list comprehension:

In [None]:
Matrix = [[12, 1, 5],
          [30, 122, 4],
          [5, 99, 0]]

row_max = [max(row) for row in Matrix]

print(row_max)

In [None]:
max(Matrix)

In [None]:
max(Matrix, key=lambda item : sum(item))

In [None]:
help(max)

In [None]:
sum([12, 1, 5])

In [None]:
help(sum)

In [None]:
help(max)

### Caso 2: Uso della condizione if in modo smart 

In [None]:
Genius = ["Yang", "Tom", "Jerry", "Jack", "tom", "yang"]

L1 = [name for name in Genius if name.startswith('Y')]
L2 = [name for name in Genius if name.startswith('Y') or len(name) < 4]
L3 = [name for name in Genius if len(name) < 4 and name.islower()]
print(L1, L2, L3)

### Caso 3: Usare esperessioni complesse

In [None]:
Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = [name.capitalize() for name in Genius]
print(L1)

Anche usando la clausola else

In [None]:
Genius = ["Jerry", "Jack", "tom", "Davide"]
L1 = [name if name.startswith('D') else 'Not Genius' for name in Genius]
print(L1)

### Caso 4: Usare cicli for annidati per gestire Iterables annidati

In [None]:
Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = [char for name in Genius for char in name]
print(L1)

Equivalente a:

In [None]:
Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = []
for name in Genius:
    for char in name:
        L1.append(char)
print(L1)

In [None]:
Matrix = [[12, 1, 5],
          [30, 122, 4],
         [5, 99, 0]]

L = [val for vet in Matrix for val in vet]

In [None]:
L

E possiamo aggiungere anche la condizione if

In [None]:
Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = [char for name in Genius if len(name) < 4 for char in name]
print(L1)

### Caso 5: Evitare funzioni di ordine superiore (higher-order functions) per migliorare la leggibilità

Python ha alcune funzioni di ordine superiore come map(), filter() e così via. 

**NOTA:** Una funzione di ordine superiore (o funzione higher-order) è una funzione che può prendere altre funzioni come parametri e/o restituire funzioni come risultato.

Potrebbe essere una buona abitudine usare le list comprehension invece delle funzioni di ordine superiore per rendere il nostro programma più leggibile per gli altri 

In [None]:
L = map(func, iterable)

# può essere rimpiazzato da:

L = [func(a) for a in iterable]

In [None]:
L = filter(condition_func, iterable)

# può essere convertito in

L = [a for a in iterable if condition_func]

In [None]:
Genius = ["Jerry", "Jack", "tom", "yang","Davide","Pippo","Carlo"]
L1 = filter(lambda a: len(a) >= 4, Genius)
print(list(L1))

L2 = [a for a in Genius if len(a) >= 4]
print(L2)

Potrebbe essere una buona abitudine usare le list comprehension invece delle funzioni di ordine superiore per rendere il nostro programma più leggibile per gli altri

**Ma attenzione alle dimensioni!!**

In [None]:
L1.__sizeof__()

In [None]:
L2.__sizeof__()

In [None]:
type(L1)

### Comprendere la filosofia alla base delle List Comprehension

* Il motivo intuitivo per utilizzare la list comprehension è rendere il nostro codice più pulito ed elegante. 

* Inoltre, è una buona pratica del paradigma di programmazione funzionale. Una delle pratiche della programmazione funzionale consiste nell'evitare flussi di controllo. 

* La list comprehension può spostare l'attenzione dei programmatori dal flusso di controllo alla creazione dei dati. 

**In altre parole, è un passaggio mentale dal pensare a come funziona un ciclo for a ciò che è una lista.**

Il loro utilizzo può aiutarti a pensare più facilmente alla logica dell'intero programma.

## Generatori

Un generatore è essenzialmente una list comprehension in cui gli elementi vengono generati in base alle richieste piuttosto che tutti in una volta.

In [None]:
G = (n ** 2 for n in range(10))

In [None]:
type(G)

In [None]:
G

Nota di sintassi: mentre le list comprehensions usano parentesi quadre, le espressioni generatrici usano parentesi tonde. 

Ovviamente non è l'unica differenza!

*Una lista è un insieme di valori, mentre un generatore è una ricetta per produrre valori*.

Quando si crea una lista, si sta effettivamente costruendo una raccolta di valori e vi è una certa occupazione di memoria associata. Quando si crea un generatore, non si sta creando una raccolta di valori, ma una _ricetta_ per produrre quei valori. 

In entrambi i casi esiste una interfaccia iteratore esposta e quindi sul generatore posso chiamare il metodo \_\_next\_\_():

In [None]:
print(G.__next__())

In [None]:
lista = [0,1,2]
M = [n ** 2 for n in lista]
lista.append(3)
lista.append(4)
lista.append(5)
lista

In [None]:
for val in M:
    print (val)

In [None]:
lista = [0,1,2]
L = (n ** 2 for n in lista)
lista.append(3)
lista.append(4)
lista.append(5)
lista

In [None]:
for val in L:
    print (val)

In [None]:
L = [n ** 2 for n in range(12)]
for val in L:
    print(val, end=' ')

In [None]:
G = (n ** 2 for n in range(12))
for val in G:
    print(val, end=' ')

**Cosa cambia?**

La differenza è che un *generatore di espressione* non calcola i valori fino al loro utilizzo. Ciò comporta non solo un uso efficiente della memoria, ma risulta anche efficiente dal punto di vista computazionale. 

Mentre la dimensione di una *lista* è limitata dalla memoria disponibile, la dimensione di un *generatore di espressione* è illimitata!

### Differenze tra liste e generatori

In [None]:
L = [n ** 2 for n in range(12)]
for val in L:
    print(val, end=' ')
    
print()

for val in L:
    print(val, end=' ')

Eseguiamo le stesse operazioni con un generatore...

In [None]:
G = (n ** 2 for n in range(12))
for val in G:
    print(val, end=' ')
    
print()

for val in G:
    print(val, end=' ')

Differenze? come mai?

Altro esempio, creo una lista dal generatore:

In [None]:
G = (n ** 2 for n in range(12))
list(G)

In [None]:
list(G)

Questo ci può tornare utile quando dobbiamo interrompere una iterazione e poi riprendere:

In [None]:
G = (n**2 for n in range(12))
for n in G:
    print(n, end=' ')
    if n > 30: break

print("\nFaccio qualcosa di interessante")

for n in G:
    print(n, end=' ')

Esempio di "qualcosa di interessante":


Quando si lavora con collezioni di dati sul disco; utilizzando un approccio di questo tipo diventa abbastanza facile analizzarli a blocchi.

### Creare funzioni da usare nei generatori

Possiamo creare generatori più complicati usando le _funzioni generatore_.

Esempio:

In [None]:
G1 = (n ** 2 for n in range(12))

In [None]:
print(*G1)

Potrei anche scrivere:

In [None]:
def gen():
    for n in range(12):
        yield n ** 2

G2 = gen()

print(*G2)

Un generatore una volta esaurito non lo posso più usare:

In [None]:
print(*G1)

Questo vale anche in questo caso:

In [None]:
lista = [0,1,2]

In [None]:
L = (n ** 2 for n in lista)

In [None]:
for val in L:
    print (val)

Anche se aggiungo dei valori a lista, se ho esaurito il generatore questo non si rigenera con i nuovi valori.

In [None]:
lista.append(3)
lista.append(4)
lista.append(5)

In [None]:
lista

In [None]:
for val in L:
    print (val)

Utilizzando una funzione generatrice posso invece ricreare il mio generatore se dovesse servirmi di nuovo

In [None]:
G3 = gen()

In [None]:
print(*G3)

Nelle funzioni generatrici invece di **return** nella funziona def abbiamo usato **yield** per indicare una sequenza di valori potenzialmente infinita. 

In [None]:
def gen_primes(N):
    """Generare i numeri primi fino a N"""
    primes = set()
    for n in range(2, N):
        if all(n % p > 0 for p in primes):
            primes.add(n)
            yield n

            
gen_primes(1_0000_000_000)

fin quanto non uso il generatore non veranno generati valori

In [None]:
print(*gen_primes(100000))

Altro esempio:

In [None]:
def countdown(n):
    print ("Conto alla rovescia da:", n) 
    while n > 0:
        yield n
        n-=1

x = countdown(10)

**Nota** quando assegno il generatore a x nessun output viene prodotto

In [None]:
x

Per generare l'output il generatore deve essere *usato*

In [None]:
x.__next__()

In [None]:
x.__next__()

Oppure

In [None]:
next(x)

In [None]:
help(next)

Un generatore può essere chiuso richiamando la funzione *close*:

In [None]:
x.close()

In [None]:
x.__next__()

In [None]:
def countdown(n):
    print ("Conto alla rovescia da:", n) 
    while True:
        yield n
        n-=1

x = countdown(2)

In [None]:
x.__next__()

**Nota: Un oggetto generatore è diverso da un oggetto iteratore**

Nel generatore:
* L'iterazione avviene una sola volta
* Se si vuole ripetere l'iterazione, è necessario creare un altro generatore
* Un iteratore può iterare su una lista quante volte vuole

Nota sull'occupazione della memoria

In [None]:
large_list = [x for x in range(1_000_000)]
large_list_g = (x for x in range(1_000_000)) 
print(large_list.__sizeof__())
print(large_list_g.__sizeof__())

**yeld multipli**

Una funzione generatore può avere più yeld

In [None]:
def simple_generator():
    yield 'apple'
    yield 'orange'
    yield 'pear'

In [None]:
for fruit in simple_generator():
    print(fruit)

In [None]:
g = simple_generator()

In [None]:
next(g)

Esempio di generatore con *più yeld* concetto di suspend e restart e differenza con *return*

In [None]:
def gen():
    for n in range(12):
        print ("-")
        yield n
        print ("-----")
        yield n*n
        print ("---------")
        yield n*n*n

In [None]:
g=gen()

In [None]:
next(g)

**Altro esempio**

Collegare insieme degli *iterables* 

In [None]:
def chain(x, y):
    yield from x
    yield from y

In [None]:
a = [1, 2, 3]
b = [4, 5, 6]

for x in chain(a, b):
    print(x,end=' ')

In [None]:
c = [7,8,9]

for x in chain(a, chain(b, c)):
    print(x, end=' ')