# Itertools

Itertools es una librería nativa de Python que permite crear y gestionar iteradores de una forma muy sencilla e intuitiva. Probablemente lo hayas visto en algún que otro código Python, pero en este post voy a tratar de explicar una por una cada método e intentar replicar lo que está pasando por atrás cada vez que invocamos alguna de esas funciones. Podemos encontrar iteradores infinitos, módulos de combinatoria e incluso iteradores con condicionales. Van a cansarse de ver "for" por todo este post pero por suerte no es nada complicado.


La idea es seguir el orden que se encuentra en la documentación, así que si hay alguna duda podes consultarla [aquí](https://docs.python.org/3/library/itertools.html).

Importamos el módulo y empezamos

In [None]:
import itertools as it

# Iteradores infinitos
Estos pueden ser super útiles, pero hay que tener cuidado de establecer una condición para salir del loop porque sino itera literalmente hasta el infinito, como si fuera un "while True", por eso asegurense de meter un "break" en algún momento

### it.count()

En este método declaras desde donde empieza a iterar (start) y de a cuanto va a saltar de iteración en iteración (step). ¿Hasta cuando? hasta que le pares el carro. Por ejemplo, podemos imprimir los números impares, pero como no queremos que siga hasta el infinito, podemos salir del loop antes de que llegue al número 100. De esta forma:


In [14]:
#count - versión itertools
for even in it.count(start=1,step=2):
    if even > 100:
        break
    print(even, end=" ")
    

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99 

... lo que podría replicarse con un while como:

In [84]:
even = 1
while even < 100:
    print(even, end=" ")
    even += 2
    

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99 

### it.cycle()

Cycle va a recorrer un iterable y al llegar al final, empezar de nuevo, así infinitamente.

Imaginemos que queremos printear las estaciones de los próximos 5 años.
Lo que podríamos hacer es definir las estaciones una vez y volverla a recorrer hasta que pasen esos 5 años:

In [93]:
#cycle - versión itertools
seasons = ["Autumn","Winter","Spring","Summer"]
year = 2020

for season in it.cycle(seasons):
    print(season,year, end=" / ")
    if season == "Summer":
        if year == 2025:
            print("...")
            break
        year += 1
    
    

Autumn 2020 / Winter 2020 / Spring 2020 / Summer 2020 / Autumn 2021 / Winter 2021 / Spring 2021 / Summer 2021 / Autumn 2022 / Winter 2022 / Spring 2022 / Summer 2022 / Autumn 2023 / Winter 2023 / Spring 2023 / Summer 2023 / Autumn 2024 / Winter 2024 / Spring 2024 / Summer 2024 / Autumn 2025 / Winter 2025 / Spring 2025 / Summer 2025 / ...


Como vemos, it.cycle() va a iterar hasta "Summer" y como es un iterador infinito, va a empezar por "Autumn" de nuevo. Entonces, lo que hice es sumar un año en cada vuelta, chequeando si se llegó al 2025. De ser así, es el momento de salir del loop. Una version usando un ciclo while podría ser:

In [94]:
year = 2019

while year != 2025:
    year += 1
    for season in seasons:
        print(season,year, end=" / ")
else:
    print("...")

    

Autumn 2020 / Winter 2020 / Spring 2020 / Summer 2020 / Autumn 2021 / Winter 2021 / Spring 2021 / Summer 2021 / Autumn 2022 / Winter 2022 / Spring 2022 / Summer 2022 / Autumn 2023 / Winter 2023 / Spring 2023 / Summer 2023 / Autumn 2024 / Winter 2024 / Spring 2024 / Summer 2024 / Autumn 2025 / Winter 2025 / Spring 2025 / Summer 2025 / ...


### it.repeat()

Este es simple. No le veo un gran uso realmente pero al menos sabes que existe.

Puedo repetir cualquier datatype una cantidad determinada de veces. Por ejemplo, puedo repetir "Python" 10 veces. En el primer argumento le paso el dato a repetir, y en el segundo la cantidad de veces.

In [95]:
# repeat - versión itertools
times = 10

for rep in it.repeat("python",times):
    print(rep, end=" ")


python python python python python python python python python python 

También podría imitarlo con un iterable (no iterador) como una lista, o simplemente con un range()

In [100]:
# repeat - versión iterable
for rep in ["python"]*times:
    print(rep, end=" ")

python python python python python python python python python python 

In [101]:
# repeat - versión range
for rep in range(times):
    print("python", end=" ")


python python python python python python python python python python 

# Más iteradores

Acá creo que está lo más lindo de itertools porque muchos de estos son super útiles y ya conociendolos probablemente empieces a usarlos. Empecemos con "chain" para unir iteradores

### .chain()

Chain nos sirve para enlazar iteradores, o "encadenar" si queres verlo traduciendolo al inglés. En vez de declarar dos ciclos for, uno para cada iterable, podemos fusionarlos y simplificar la cuestión.

Es decir, podemos pasar de esto:

In [102]:
first_list = [3,5,4]
second_list = [4,6,7]

for i in first_list:
    print(i, end=" ")
    
for i in second_list:
    print(i, end=" ")

3 5 4 4 6 7 

... a algo mucho mejor:

In [105]:
#unir iterables - chain

for i in it.chain(first_list, second_list):
    print(i, end=" ")



3 5 4 4 6 7 

Ahora, otra cosa que esta copada, es que podemos encapsular esos iterables dentro de una lista (que es otro iterable 😂) y recorrerlos como si fueran uno solo. Esto se logra llamando a "from_iterable()" dentro de chain. Ahora en vez de listas probemos con strings

In [20]:
# chain desde un iterable - chain.from_iterable

super_list = ["python ","itertools"]

for i in it.chain.from_iterable(super_list):
    print(i.upper(), end=" ")

P Y T H O N   I T E R T O O L S 

### .accumulate()

Esta es genial. Cuando usamos variables cuya función es acumular saldos, podemos obviarlas ya que con accumulate podemos actualizar una variable de stock imaginaria con distitos flujos que pasamos como parametro.

No se si me explico. Pensemos en los supuestos ingresos que tuve en años anteriores, algunos positivos y otros negativos. Si yo sé cual fue mi saldo inicial y tengo los distintos flujos o resultados que hubo por cada periodo, puedo obtener el saldo a cada periodo, y también con ello el saldo final.  

In [106]:
# accumulate - versión itertools

earnings = [1000,1500,300,-500,750,600,-1000,-200,350,950,-2000]

for e in it.accumulate(earnings,initial=1000):
    print(f'${e}', end=" ")

$1000 $2000 $3500 $3800 $3300 $4050 $4650 $3650 $3450 $3800 $4750 $2750 

Defino el "saldo inicial" como parametro del iterador y los flujos como primer argumento. Si yo quisiera tener el mismo resultado sin usar .accumulate() tendría que definir una variable de stock, como en este ejemplo, que el voy a poner "rest"

In [111]:
rest = 1000
earnings = [1000,1500,300,-500,750,600,-1000,-200,350,950,-2000]

print(f'${rest}', end=" ")
for e in earnings:
    rest += e
    print(f'${rest}', end=" ")

$1000 $2000 $3500 $3800 $3300 $4050 $4650 $3650 $3450 $3800 $4750 $2750 

### .filterfalse()

Con este empezamos con iteradores condicionales. Este es intuitivo. Lo que hace es recorrer el iterable y sólo reproducir la lógica del loop si el resultado de una función a definir NO se cumpla, es decir, devuelva False. Esta función podemos definirla aparte, pero si no es complicada podemos definirla en una línea en una función lambda.

Por ejemplo, sigamos con la lista "earnings" del ejemplo anterior. Si quisiesemos filtrar los resultados negativos, deberíamos definir como primer parametro en .filterfalse() una simple función que devuelva false cuando el número sea negativo, de esta forma:

In [26]:
# filterfalse - versión itertools

for e in it.filterfalse(lambda x: x >= 0, earnings):
    print(f'${e}', end=" ")

$-500 $-1000 $-200 $-2000 

No es más que una condición dentro de un loop, lo que equivale más o menos a esto

In [None]:
# loop
for e in earnings: 
    # condición 
    if e x < 0: 
        print(f'${e}', end=" ")

### .dropwhile()

Otro loop con condición. Pero en este caso, la función va a determinar cuando empieza a reproducir la lógica del loop. Como si tuviesemos una especie de switch, que empieza apagado. Cuando la función lambda devuelve false, el switch se enciende y la lógica se reproduce hasta el final. 

Siguiendo con el ejemplo que venimos viendo. Usando dropwhile, podemos obtener los flujos de fondos DESDE el primer false. Y ahí está la clave, en pensarlo como un "desde". 

In [28]:
# dropwhile - versión itertools

for e in it.dropwhile(lambda x: x >= 0, earnings):
    print(f'${e}', end=" ")

$-500 $750 $600 $-1000 $-200 $350 $950 $-2000 

... lo que equivaldría a utilizar un switch de esta forma:

In [117]:
# dropwhile - versión sintética

switch = False
for e in earnings:
    if e < 0:
        switch = True
    if switch:
        print(f'${e}', end=" ")
    

$-500 $750 $600 $-1000 $-200 $350 $950 $-2000 

### .takewhile()

Si entendiste dropwhile, este también porque es literalmente lo contrario. Si en el ejemplo anterior decíamos que va a iterar DESDE que se cumpla el False, en takewhile(), el switch va a empezar prendido y va a iterar HASTA que se cumpla el primer false. Así:

In [29]:
# takewhile - versión itertools

for e in it.takewhile(lambda x: x >= 0, earnings):
    print(f'${e}', end=" ")

$1000 $1500 $300 

En este caso, el primer flujo negativo se da en el flujo 4, así que ahí se va a parar. Como podemos ver un takewhile más un dropwhile me da el iterable entero. Replicar el último caso es cambiar el estado de nuestro switch. En nativo:

In [120]:
# takewhile - versión sintética

switch = True
for e in earnings:
    if e < 0:
        switch = False
    if switch:
        print(f'${e}', end=" ")

$1000 $1500 $300 

### .islice()

Espantoso. Slice es cortar un pedazo de un iterable inicial, definiendo de donde empezar y en donde terminar. Pero eso ya lo podíamos hacer con las sublistas de Python de forma más fácil.

Si venis de Javascript un golazo porque es parecido, pero no igual. Primer argumento el iterable, segundo desde donde comienza y tercer hasta donde va, definiendo así la porción 

In [121]:
# islice - versión itertools

for e in it.islice(earnings,2,5):
    print(e, end=" ")

300 -500 750 

Pero incluso más fácil es

In [123]:
# islice - versión sintética

for e in earnings[2:5]:
    print(e, end=" ")

300 -500 750 

### .starmap()

Este método nos permite hacer operaciones con tuplas desde itertools. Básicamente es un map. Desde la documentación aclaran "Used instead of map() when argument parameters are already grouped in tuples from a single iterable (the data has been “pre-zipped”)." así que es conveniente pasarlo en formato tupla.

Pensemos en el top 5 de los países con más medallas de los últimos juegos olímpicos. Podemos definir listas con la cantidad de medallas de oro, plata y bronce respectivamente. Si quisiesemos saber cuantas medallas juntaron en total los 5 países, podemos utilizar la funcion map, pasando tuplas con la cantidad de medallas ganadas por todos los países separados por el tipo de medalla. Para eso, hacemos el zip de todas las listas, obteniendo tres tuplas de longitud 5 y las recorremos desde itertools. ¿Cómo funciona? Le aplicamos una funcion, en este caso la suma de todos los elementos, a cada tupla. Imprimimos y obtenemos:

In [126]:
# starmap - versión itertools

eeuu = [39,41,33]
china = [38,32,18]
japon = [27,14,17]
britain = [22,21,22]
cor = [20,28,23]

top5 = zip(eeuu,china,japon,britain,cor)

for i in it.starmap(lambda *x: sum(x),top5):
    print(i, end=" ")


146 136 113 

### .compress()

Este método puede ser interesante si trabajamos con matrices. Teniendo una lista de puros 1 y 0 en donde 1 es true y 0 es false (claro), podemos pasar un iterable cualquiera y la matriz en cuestion para definir si se entra en el loop o no. Claro que ambos iterables deben tener la misma longitud. Veamos:

In [48]:
# compress - versión itertools

my_random_string = "aitjkenrtdofols"
matrix = [0,1,1,0,0,1,0,1,1,0,1,0,1,1,1]

for i in it.compress(my_random_string,matrix):
    print(i, end=" ")

i t e r t o o l s 

En este caso, recorre ambos iterables en paralelo, ejecutando la lógica cuando en la matriz nos encontramos con un 1. Un ejemplo sintético podría ser el siguiente:

In [127]:
# compress - versión sintética

for i in zip(matrix,my_random_string):
    if i[0]:
        print(i[1], end=" ")

i t e r t o o l s 

### .zip_longest()

Este puede ser muy útil. A veces queremos utilizar un zip pero tenemos iterables de distinto orden. Con zip_longest podemos usarlo igual, estableciendo un valor por default en el caso de que un iterable, sea más corto que otro.

Por ejemplo, tenemos dos listas de longitud 5 y 3. Si los juntamos de a pares en tuplas, nos quedan dos valores sin su par. En ese caso le asigna el par por defecto del atributo definido en "fillvalue"

In [50]:
# zip_longest - primer caso

numbers = [1,2,3,4,5]
letters = ["a","b","c"]

for comb in it.zip_longest(numbers,letters, fillvalue="?"):
    print(comb, end=",")

(1, 'a'),(2, 'b'),(3, 'c'),(4, '?'),(5, '?'),

La asimetría puede darse del otro lado tambien. Si alargamos la variable letters y lo hacemos de longitud 9, nos quedarían los últimos 4 valores sin su par, al cual le asigna el valor por defecto de la misma forma. 

In [51]:
letters.extend(["d","e","f","g","h","i"])

for comb in it.zip_longest(numbers,letters, fillvalue="?"):
    print(comb, end=",")

(1, 'a'),(2, 'b'),(3, 'c'),(4, 'd'),(5, 'e'),('?', 'f'),('?', 'g'),('?', 'h'),('?', 'i'),

# Combinatioria

### Producto

In [73]:
# Product

subjects = ["A","B","C","D","E"]
iterator = it.product(subjects,repeat=2)
len_iterator = len(list(it.product(subjects,repeat=2)))

print(f'Hay {len_iterator} formas de combinar {len(subjects)} elementos de a pares:')

for way in iterator:
    print(way, end=" ")
    

Hay 25 formas de combinar 5 elementos:
('A', 'A') ('A', 'B') ('A', 'C') ('A', 'D') ('A', 'E') ('B', 'A') ('B', 'B') ('B', 'C') ('B', 'D') ('B', 'E') ('C', 'A') ('C', 'B') ('C', 'C') ('C', 'D') ('C', 'E') ('D', 'A') ('D', 'B') ('D', 'C') ('D', 'D') ('D', 'E') ('E', 'A') ('E', 'B') ('E', 'C') ('E', 'D') ('E', 'E') 


### Combinaciones sin repetición

In [74]:
# Combinations without replacement

subjects = ["A","B","C","D","E"]
exams = 2
iterator = it.combinations(subjects,exams)
len_iterator = len(list(it.combinations(subjects,exams)))

print(f'Hay {len_iterator} formas de combinar {exams} de {len(subjects)} elementos sin repetir y sin importar el orden:')

for way in iterator:
    print(way, end=" ")

Hay 10 formas de combinar 2 de 5 elementos sin repetir y sin importar el orden:
('A', 'B') ('A', 'C') ('A', 'D') ('A', 'E') ('B', 'C') ('B', 'D') ('B', 'E') ('C', 'D') ('C', 'E') ('D', 'E') 

### Variaciones sin repetición

In [76]:
# "Permutations" - Variations without replacement

subjects = ["A","B","C","D","E"]
iterator = it.permutations(subjects,2)
len_iterator = len(list(it.permutations(subjects,2)))

print(f'Hay {len_iterator} formas de combinar {len(subjects)} elementos:')

for way in iterator:
    print(way, end=" ")
    

Hay 20 formas de combinar 5 elementos:
('A', 'B') ('A', 'C') ('A', 'D') ('A', 'E') ('B', 'A') ('B', 'C') ('B', 'D') ('B', 'E') ('C', 'A') ('C', 'B') ('C', 'D') ('C', 'E') ('D', 'A') ('D', 'B') ('D', 'C') ('D', 'E') ('E', 'A') ('E', 'B') ('E', 'C') ('E', 'D') 