## Iteradores

In [1]:
# range no devuelve una lista
r = range(5)
r

range(0, 5)

In [2]:
r.__class__

range

In [3]:
# pero se puede iterar por sus elementos
for v in r:
    print(v, end=", ")

0, 1, 2, 3, 4, 

In [4]:
it = iter(r)

In [5]:
next(it)

0

In [6]:
next(it)

1

In [7]:
while True:
    print(next(it))

2
3
4


StopIteration: 

Los iteradores permiten tratar cosas como si fueran listas, aunque no lo sean. El beneficio fundamental de esto es que la lista nunca se crea en memoria!

In [8]:
# Queremos sumar el cuadrado de los primeros 10K numeros
nums = [v * v for v in range(10000)]
print(sum(nums))

333283335000


In [9]:
# Lo mismo, pero sin crear la lista
t = 0
for v in range(10000):
    t += v * v
print(t)

333283335000


### Algunos iteradores útiles
- *enumerate* convierte cada elemento iterado en una tupla formada por su posición y el elemento

In [10]:
l = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
for idx, v in enumerate(l):
    print(idx, v)

0 a
1 b
2 c
3 d
4 e
5 f
6 g
7 h


In [11]:
# elementos en las posiciones pares
[v for idx, v in enumerate(l) if idx % 2 == 0]

['a', 'c', 'e', 'g']

In [12]:
# Almacenar en una lista todos los valores generados por un iterador
print(range(2, 20, 3))
l = list(range(2, 20, 3))
print(l)
print(list(enumerate(range(2, 20, 3))))

range(2, 20, 3)
[2, 5, 8, 11, 14, 17]
[(0, 2), (1, 5), (2, 8), (3, 11), (4, 14), (5, 17)]


- *map* y *filter* son iteradores, de ahí el uso de *list* en los ejemplos

In [13]:
import math
for v in map(lambda x: math.sqrt(x), range(6)):
    print(v)

0.0
1.0
1.4142135623730951
1.7320508075688772
2.0
2.23606797749979


In [14]:
for v in filter(lambda x: x % 2 == 0, range(20)):
    print(v **4)

0
16
256
1296
4096
10000
20736
38416
65536
104976


- mezclando colecciones con *zip*
*zip* itera en paralelo en las colecciones, devolviendo los valores que están en las mismas posiciones. Cuando una colección (o iterador) se acaba, para la iteración.

In [15]:
l_a = [2, 3, 4, 5, 6]
l_b = ['a', 'b', 'c', 'd', 'e']
for a, b in zip(l_a, l_b):
    print(a, b)

2 a
3 b
4 c
5 d
6 e


- iteradores especializados: paquete *itertools*

In [16]:
# Permutaciones
import itertools as it
p = it.permutations(range(3))
print(*p)

(0, 1, 2) (0, 2, 1) (1, 0, 2) (1, 2, 0) (2, 0, 1) (2, 1, 0)


In [18]:
list(it.permutations('abcd'))

[('a', 'b', 'c', 'd'),
 ('a', 'b', 'd', 'c'),
 ('a', 'c', 'b', 'd'),
 ('a', 'c', 'd', 'b'),
 ('a', 'd', 'b', 'c'),
 ('a', 'd', 'c', 'b'),
 ('b', 'a', 'c', 'd'),
 ('b', 'a', 'd', 'c'),
 ('b', 'c', 'a', 'd'),
 ('b', 'c', 'd', 'a'),
 ('b', 'd', 'a', 'c'),
 ('b', 'd', 'c', 'a'),
 ('c', 'a', 'b', 'd'),
 ('c', 'a', 'd', 'b'),
 ('c', 'b', 'a', 'd'),
 ('c', 'b', 'd', 'a'),
 ('c', 'd', 'a', 'b'),
 ('c', 'd', 'b', 'a'),
 ('d', 'a', 'b', 'c'),
 ('d', 'a', 'c', 'b'),
 ('d', 'b', 'a', 'c'),
 ('d', 'b', 'c', 'a'),
 ('d', 'c', 'a', 'b'),
 ('d', 'c', 'b', 'a')]

In [19]:
list(it.permutations(['a','b','c','d']))

[('a', 'b', 'c', 'd'),
 ('a', 'b', 'd', 'c'),
 ('a', 'c', 'b', 'd'),
 ('a', 'c', 'd', 'b'),
 ('a', 'd', 'b', 'c'),
 ('a', 'd', 'c', 'b'),
 ('b', 'a', 'c', 'd'),
 ('b', 'a', 'd', 'c'),
 ('b', 'c', 'a', 'd'),
 ('b', 'c', 'd', 'a'),
 ('b', 'd', 'a', 'c'),
 ('b', 'd', 'c', 'a'),
 ('c', 'a', 'b', 'd'),
 ('c', 'a', 'd', 'b'),
 ('c', 'b', 'a', 'd'),
 ('c', 'b', 'd', 'a'),
 ('c', 'd', 'a', 'b'),
 ('c', 'd', 'b', 'a'),
 ('d', 'a', 'b', 'c'),
 ('d', 'a', 'c', 'b'),
 ('d', 'b', 'a', 'c'),
 ('d', 'b', 'c', 'a'),
 ('d', 'c', 'a', 'b'),
 ('d', 'c', 'b', 'a')]

In [20]:
# combinaciones
list(it.combinations(range(4), 2))

[(0, 1), (0, 2), (0, 3), (1, 2), (1, 3), (2, 3)]

In [None]:
# ejemplo, calcular todas las sumas entre 2 elementos 
# de una lista que sumen 12
list = [1, 2, 4, 5, 7, 8, 9, 10, 12]
s = 12
r = [(x, y) for x, y in it.combinations(list, 2) if x+y == 12]
print(r)

In [21]:
# producto cartesiano entre dos conjuntos
p = it.product('abc', range(3))
print(*p)

('a', 0) ('a', 1) ('a', 2) ('b', 0) ('b', 1) ('b', 2) ('c', 0) ('c', 1) ('c', 2)


In [24]:
# generador cíclico
for a, b in zip(it.cycle('abcd'), range(20)):
    print(a, b)

a 0
b 1
c 2
d 3


In [28]:
print(list(range(20)))
# acumulador
print(*it.accumulate(range(20), lambda x,y: x+y))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
0 1 3 6 10 15 21 28 36 45 55 66 78 91 105 120 136 153 171 190


In [30]:
print(*it.accumulate('abcdefg', (lambda x,y: x+y)))

a ab abc abcd abcde abcdef abcdefg


In [29]:
import random
random.seed(10)
l = [random.randint(5, 100) for _ in range(20)]
print(l)
# running max
print('run_max', *it.accumulate(l, lambda x,y: max(x,y)))
print('run_min', *it.accumulate(l, lambda x,y: min(x,y)))
print('run_tot', *it.accumulate(l, lambda x,y: x+y))

[78, 9, 59, 66, 78, 6, 31, 64, 67, 40, 88, 25, 9, 71, 67, 46, 14, 36, 100, 51]
run_max 78 78 78 78 78 78 78 78 78 78 88 88 88 88 88 88 88 88 100 100
run_min 78 9 9 9 9 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6
run_tot 78 87 146 212 290 296 327 391 458 498 586 611 620 691 758 804 818 854 954 1005


In [31]:
# groupby
l = [random.randint(5, 100) for _ in range(20)]
l.sort(key = lambda x: x % 5)
for k, g in it.groupby(l, lambda x: x % 5):
    print("rest", k)
    print("-", *g)


rest 0
- 10 50 35
rest 1
- 41 91 51 61
rest 2
- 22 82 27 92 22
rest 3
- 58 53 58 38 63 43 63
rest 4
- 89


### Expresiones generadoras
Las expresiones generadoras son el equivalente a las comprehensions, pero usando iteradores. Esto significa que se generan los elementos en vez de las colecciones.

In [32]:
# Calculemos la suma de los cuadrados de los primeros 100 numeros
valores = [x**2 for x in range(101)]
print(sum(valores))

338350


In [33]:
# construir la lista 'valores' es un gasto de tiempo y espacio
valores2 = (x **2 for x in range(101))
print(valores2)
print(sum(valores2))

<generator object <genexpr> at 0x7f8b804d7bd0>
338350


In [34]:
l1 = range(0, 120, 5)
l2 = range(2, 1000, 3)
print(sum(x*y for x, y in zip(l1, l2)))

67620


Un generador es una receta para construir valores, en vez de una lista, que es una colección de valores.

In [None]:
# 'count' genera valores sin limites
for i in it.count():
    print(i, end=",")
    if i > 20:
        break

In [None]:
# 'count' permite generar hasta que se cumpla una condición
# veamos una idea como la criba de Erastosthenos
factors = [2, 3, 5, 7]
G = (i for i in it.count() if all(i % n > 0 for n in factors))
for val in G:
    print(val, end=',')
    if val > 40:
        break

Una diferencia importante entre expresiones generadoras y listas es que una lista se puede usar muchas veces mientras que un generador solamente una vez.

In [35]:
l1 = [x for x in range(10)]
for v in l1:
    print(v, end=',')
print('')
for v in l1:
    print(v, end=',')

0,1,2,3,4,5,6,7,8,9,
0,1,2,3,4,5,6,7,8,9,

In [37]:
l2 = (x for x in range(10))
for v in l2:
    print(v, end=',')
print('')
for v in (x for x in range(10)):
    print(v, end=',')

0,1,2,3,4,5,6,7,8,9,
0,1,2,3,4,5,6,7,8,9,