# Iterators

En informática, un iterador es una construcción de programación que representa una secuencia de elementos y proporciona una interfaz para acceder a ellos secuencialmente. Es un objeto o estructura de datos que permite recorrer y procesar una colección de elementos uno a uno.

En Python, un iterador es un objeto que implementa el protocolo iterador, que consta de los métodos \_\_iter\_\_() y \_\_next\_\_(). Los iteradores se utilizan para recorrer una colección de elementos o para generar una secuencia de valores sobre la marcha.


In [1]:
r = range(5)

In [2]:
type(r)

range

Puedes iterar valores de rango, uno a la vez, con un bucle for


In [3]:
for v in r:
    print(v)

0
1
2
3
4


¿Qué hace el método **for**?

In [4]:
it = iter(r)
try:
    while True:
        v = next(it)
        print(v)
except StopIteration:
    pass
    

0
1
2
3
4


## Common Python iterators

**enumerate** mejora el proceso de iteración al transformar cada elemento iterado en una tupla que consta de su posición (índice) y el elemento en sí.


In [5]:
l = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
for idx, v in enumerate(l):
    print(idx, v)

0 a
1 b
2 c
3 d
4 e
5 f
6 g
7 h


In [6]:
# Seleccionar elementos en posiciones pares
[v for idx, v in enumerate(l) if idx % 2 == 0]

['a', 'c', 'e', 'g']

**map** aplica una función dada a cada elemento de un iterable (p. ej., una lista, una tupla o una cadena) y devuelve un iterador con los resultados. Toma dos argumentos: la función a aplicar y el iterable a procesar.


In [7]:
def double(x):
    return 2 * x

numbers = [1, 2, 3, 4, 5]

for n in map(double, numbers):
    print(n)

2
4
6
8
10


Las comprensiones también utilizan iteradores en su declaración **in**

In [8]:
[x for x in map(double, numbers)]

[2, 4, 6, 8, 10]

In [9]:
list(map(double, numbers))

[2, 4, 6, 8, 10]

**filtro** crea un iterador a partir de los elementos de un iterable que cumplen una condición determinada. Recibe dos argumentos: la función de filtrado y el iterable a procesar.


In [10]:
def is_even(x):
    return x % 2 == 0

numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
even_numbers = filter(is_even, numbers)

list(even_numbers)

[2, 4, 6, 8, 10]

El mapa y el filtro se pueden combinar juntos

In [11]:
list(map(double, filter(is_even, numbers)))

[4, 8, 12, 16, 20]

**Nota**: Las listas por comprensión son solo una simplificación sintáctica del uso de las funciones map() y filter().


La función **zip** de Python es una función integrada que permite combinar elementos de varios iterables en tuplas. Devuelve un iterador que genera tuplas con elementos de cada iterable de entrada, hasta agotar el iterable más corto.


In [12]:
numbers = [1, 2, 3]
letters = ['a', 'b', 'c']
list(zip(numbers, letters))

[(1, 'a'), (2, 'b'), (3, 'c')]

In [13]:
numbers = [2, 4, 5, 6]
numbers2 = [5, 6, 7, 10]
result = []
for n1, n2 in zip(numbers, numbers2):
    result.append(n1+n)
result

[12, 14, 15, 16]

In [14]:
[n1 + n2 for n1, n2 in zip(numbers, numbers2)]

[7, 10, 12, 16]

Seleccione qué elementos considerar al usar una mascarilla


In [15]:
elements = [23, 34, 12, 1, 6, 8, 27, 12]
mask = [True, False, True, True, False, False, True, True]

[e for e, m in zip(elements, mask) if m]

[23, 12, 1, 27, 12]

Implement 'enumerate'

In [16]:
elements = [23, 34, 12, 1, 6, 8, 27, 12]
for v in zip(range(len(elements)), elements):
    print(v)

(0, 23)
(1, 34)
(2, 12)
(3, 1)
(4, 6)
(5, 8)
(6, 27)
(7, 12)


## itertools package

itertools es un módulo de la biblioteca estándar de Python que proporciona una colección de funciones para crear y trabajar con iteradores eficientemente. Ofrece diversas herramientas para iteradores combinatorios y bucles, además de las que ofrecen las funciones y bibliotecas integradas.

In [17]:
import itertools as it

**Permutations**

In [18]:
p = it.permutations(range(3))
print(*p)

(0, 1, 2) (0, 2, 1) (1, 0, 2) (1, 2, 0) (2, 0, 1) (2, 1, 0)


Ejemplo. Supongamos que estás jugando al Scrabble y quieres saber las posibles palabras que puedes formar con las letras que tienes realmente con el tamaño máximo: matrs

In [19]:
def word_exists(w):
    return True

["".join(p) for p in it.permutations('matrs') if word_exists("".join(p))]

['matrs',
 'matsr',
 'marts',
 'marst',
 'mastr',
 'masrt',
 'mtars',
 'mtasr',
 'mtras',
 'mtrsa',
 'mtsar',
 'mtsra',
 'mrats',
 'mrast',
 'mrtas',
 'mrtsa',
 'mrsat',
 'mrsta',
 'msatr',
 'msart',
 'mstar',
 'mstra',
 'msrat',
 'msrta',
 'amtrs',
 'amtsr',
 'amrts',
 'amrst',
 'amstr',
 'amsrt',
 'atmrs',
 'atmsr',
 'atrms',
 'atrsm',
 'atsmr',
 'atsrm',
 'armts',
 'armst',
 'artms',
 'artsm',
 'arsmt',
 'arstm',
 'asmtr',
 'asmrt',
 'astmr',
 'astrm',
 'asrmt',
 'asrtm',
 'tmars',
 'tmasr',
 'tmras',
 'tmrsa',
 'tmsar',
 'tmsra',
 'tamrs',
 'tamsr',
 'tarms',
 'tarsm',
 'tasmr',
 'tasrm',
 'trmas',
 'trmsa',
 'trams',
 'trasm',
 'trsma',
 'trsam',
 'tsmar',
 'tsmra',
 'tsamr',
 'tsarm',
 'tsrma',
 'tsram',
 'rmats',
 'rmast',
 'rmtas',
 'rmtsa',
 'rmsat',
 'rmsta',
 'ramts',
 'ramst',
 'ratms',
 'ratsm',
 'rasmt',
 'rastm',
 'rtmas',
 'rtmsa',
 'rtams',
 'rtasm',
 'rtsma',
 'rtsam',
 'rsmat',
 'rsmta',
 'rsamt',
 'rsatm',
 'rstma',
 'rstam',
 'smatr',
 'smart',
 'smtar',
 'smtra',


**combinations**

In [20]:
list(it.combinations(range(4), 2))

[(0, 1), (0, 2), (0, 3), (1, 2), (1, 3), (2, 3)]

Ejemplo, encontrar todos los pares de números en una colección cuya suma es 12

In [21]:
a_list = [1, 2, 4, 5, 7, 8, 9, 10, 12]
s = 12
[(x, y) for x, y in it.combinations(a_list, 2) if x+y == 12]

[(2, 10), (4, 8), (5, 7)]

Otros iterators ...

In [22]:
# producto cartesiano
p = it.product('abc', range(3))
print(*p)

('a', 0) ('a', 1) ('a', 2) ('b', 0) ('b', 1) ('b', 2) ('c', 0) ('c', 1) ('c', 2)


In [23]:
# Generador cíclico
for a, b in zip(range(15), it.cycle('abcd')):
    print(a, b)

0 a
1 b
2 c
3 d
4 a
5 b
6 c
7 d
8 a
9 b
10 c
11 d
12 a
13 b
14 c


In [24]:
# Ejemplo: dada una lista, cambiar el signo de los elementos en posiciones pares.
base_list = [3, 5, 7, 2, 3, 5, 7, 23, 45, 23]
[x*y for x, y in zip(base_list, it.cycle((1, -1)))]

[3, -5, 7, -2, 3, -5, 7, -23, 45, -23]

In [25]:
# acumulador
def add(x, y):
    return x+y

print(list(range(20)))
print(*it.accumulate(range(20), add))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
0 1 3 6 10 15 21 28 36 45 55 66 78 91 105 120 136 153 171 190


In [26]:
print(*it.accumulate('abcdefg', add))

a ab abc abcd abcde abcdef abcdefg


In [27]:
import random
random.seed(10)
l = [random.randint(5, 100) for _ in range(20)]
print(l)
# running max
print('run_max', *it.accumulate(l, max))
print('run_min', *it.accumulate(l, min))

[78, 9, 59, 66, 78, 6, 31, 64, 67, 40, 88, 25, 9, 71, 67, 46, 14, 36, 100, 51]
run_max 78 78 78 78 78 78 78 78 78 78 88 88 88 88 88 88 88 88 100 100
run_min 78 9 9 9 9 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6


In [28]:
# groupby
def reminder(x):
    return x % 5

l = [random.randint(5, 100) for _ in range(20)]
print(l)
l.sort(key = lambda x: x % 5)
for k, g in it.groupby(l, reminder):
    print("rest", k)
    print("-", *g)


[10, 58, 22, 82, 50, 53, 58, 41, 91, 38, 63, 27, 92, 43, 89, 51, 22, 63, 35, 61]
rest 0
- 10 50 35
rest 1
- 41 91 51 61
rest 2
- 22 82 27 92 22
rest 3
- 58 53 58 38 63 43 63
rest 4
- 89


### Generator expressions

En Python, las expresiones generadoras son una forma concisa y eficiente en memoria de crear iteradores. Son similares a las comprensiones de lista, pero con una sutil diferencia: en lugar de crear una lista, generan valores sobre la marcha a medida que se itera sobre ellos.

Por ejemplo, para calcular la suma de los cuadrados de números entre 1 y 100, se puede hacer lo siguiente:


In [29]:
values = [x**2 for x in range(101)]
sum(values)

338350

Tenga en cuenta que la lista de valores al cuadrado se creó para un solo uso de cada valor, por lo que usar expresiones generadoras es más eficiente en términos de memoria.

In [30]:
values_generator = (x **2 for x in range(101))
print(values_generator)
sum(values_generator)

<generator object <genexpr> at 0x7984a01ca400>


338350

Ejemplo: calcular la suma de los productos de elementos de dos listas

In [31]:
l1 = range(0, 120, 5)
l2 = range(2, 1000, 3)
gen = (x*y for x, y in zip(l1, l2))
print(sum(gen))

67620


Un generador es una receta para construir valores, en lugar de una lista, que es una colección de valores.

## Generator functions with yield

La palabra clave yield se utiliza en Python para crear funciones generadoras. Estas funciones son una forma práctica de crear iteradores sin tener que implementar el protocolo de iteración explícitamente.


In [32]:
def my_generator(limit):
    current = 0
    while current < limit:
        yield current
        current += 1

# Using the generator
generator = my_generator(5)
for num in generator:
    print(num)

0
1
2
3
4


Otro ejemplo, el generador de Fibonacci

In [33]:
def fib_generator(max_value):
    n1 = 0
    n2 = 1
    yield n1
    yield n2
    while True:
        n1, n2 = n2, n1+n2
        if n2 > max_value:
            return
        yield n2

list(fib_generator(100))

[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]

## Solved Exercises

Usando iteradores, devuelve los elementos en posiciones impares en una lista

In [34]:
l = [83, 53, 10, 79, 5, 35, 22, 29, 43, 73, 51, 35, 45, 90, 75, 62, 60, 65, 13, 88]
[v for idx, v in enumerate(l) if idx % 2 == 0]

[83, 10, 5, 22, 43, 51, 45, 75, 60, 13]

From every number in a list, substract its position in the list.

In [None]:
[v - idx for idx, v in enumerate(l)]

**Exercise**. Write a Python program to convert two lists into a dictionary in a way that item from list1 is the key and item from list2 is the value

In [None]:
keys = ['Ten', 'Twenty', 'Thirty']
values = [10, 20, 30]
{k: v for k, v in zip(keys, values)}

**Exercise**. Given two lists, find the difference between the elements which are in the same positions

In [None]:
l1 = [16, 21, 29, 98, 14, 88, 47, 34, 93] 
l2 = [97, 5, 68, 31, 18, 98, 29, 77, 70]
[x - y for x, y in zip(l1, l2)]

**Exercise**. From a given list, return a new list by adding every element with the element next to it

In [None]:
l = [83, 10, 5, 22, 43, 51, 45, 75, 60, 13]

[e1 + e2 for e1, e2 in zip(l, l[1:])]

**Exercise**. Using **map** and **filter**, obtain a list with the triple of all odd numbers from 0 to 100

In [None]:
list(map(lambda x: 3*x, filter(lambda x: x % 2 == 1, range(101))))

In [None]:
l1 = [16, 21, 29, 98, 14, 88, 47, 34, 93] 
list(x-y for x, y in zip(l1, l1[1:]))

**Exercise**. Given the following list of numbers

In [None]:
vals = [16, 21, 29, 98, 14, 88, 47, 34, 93, 19, 17, 37, 84, 61, 
     97, 5, 68, 31, 18, 98, 29, 77, 70, 21, 15, 16, 62, 3, 54, 73]

a) Find the maximum sum between two consecutive elements

In [None]:
max(v1 + v2 for v1, v2 in zip(vals, vals[1:]))

b) find the maximum sum among three consecutive elements

In [None]:
max(v1 + v2 + v3 for v1, v2, v3 in zip(vals, vals[1:], vals[2:]))

c) Find the consecutive elements with maximum sum

In [None]:
ordered = sorted(((v1, v2, v1 + v2) for v1, v2 in zip(vals, vals[1:])), 
      key=lambda x: -x[2])
ordered[0]

d) Generate a new list by alternatingly multiplying the numbers by 1 and -1 to switch their signs.

In [None]:
print([x*sgn for x,sgn in zip(vals, it.cycle([1, -1]))])

**Exercise**. Having a list of numbers and a 3x1 kernel, convolute the values using the kernel values

In [None]:
def apply_kernel(values, kernel):
    return [sum((v1 * v2 for v1, v2 in zip((e1, e2, e3), kernel))) 
            for e1, e2, e3 in zip(values, values[1:], values[2:])]

In [None]:
l = [83, 10, 5, 22, 43, 51, 45, 75, 60, 13]
print(apply_kernel(l, [1/3, 1/3, 1/3]))

In [None]:
print(apply_kernel(l, [0.5, 0, 0.5]))

In [None]:
print(apply_kernel(l, [1, -1, 0]))

**Exercise**. Create an iterator from several iterables in a sequence

In [None]:
def my_chain_it(*args):
    for iterator in args:
        for value in iterator:
            yield value
        
list(my_chain_it([1,2,3], ['a','b','c','d'], [4,5,6,7,8,9]))

There is an itertool for doing so

In [None]:
import itertools as it
for v in it.chain([1,2,3], ['a','b','c','d'], [4,5,6,7,8,9]):
    print(v)

**Exercise**. Generates the running product of elements in an iterable

In [None]:
def running_product(source):
    accumulator = 1
    for v in source:
        accumulator *= v
        yield accumulator
list(running_product([3, 4, 5, 6]))

**Exercise**. Other solution doing iteration _manually_ 

In [None]:
def running_product(source):
    my_iter = iter(source)
    try:
        accumulator = next(my_iter)
        yield accumulator
        while True:
            v = next(my_iter)
            accumulator *= v
            yield accumulator
    except StopIteration:
        pass
        
list(running_product([3, 4, 5, 6]))

**Exercise**. Modify previous code to allow passing an accumulating function (min, max, etc)

In [None]:
def running_function(source, fn):
    accumulator = None
    for v in source:
        if accumulator is None:
            accumulator = v
        else:
            accumulator = fn(accumulator, v)
        yield accumulator
        
def max_of_two(x, y):
    return max(x, y)

list(running_function([3, 4, 5, 6, 5, 2, 1, 12, 8], max_of_two))

We can already use the python builtin max or min functions

In [None]:
print(list(running_function([3, 4, 5, 6, 5, 2, 1, 12, 8], max)))
print(list(running_function([3, 4, 5, 6, 5, 2, 1, 12, 8], min)))

Note that we can use it to calculate the running product if proper function is passed

In [None]:
import operator

list(running_function([3, 4, 5, 6, 5, 2, 1, 12, 8], operator.mul))

In [None]:
list(running_function([3, 4, 5, 6, 5, 2, 1, 12, 8], operator.add))