![logo](../files/misc/logo.png)
<h1 style="color:#872325">Generadores e Iteradores</h1>

Recordemos la manera de generar un rango de elementos dentro de Python es mediante la función `range`

In [1]:
for i in range(1, 4):
    print(i, end=" ")

1 2 3 

Sin embargo, si al crear una instancia de un `range`, el resultado no es una colección con los elementos deseados.

In [2]:
range(10)

range(0, 10)

El resultado de `range(10)` se conoce como un generador. Pero antes de hablar de generadores es necesario hablar de **iterables**.

## Iterables

Un iterable es un objeto de python que implementa el método `__iter__`. Al utlizar un _for loop_, python llama la función `iter` sobre el objeto a trabajar.

Por abajo del agua, cuando llamamos un for loop,
1. Python llama la función `iter()` sobre el objeto a iterar;
2. La función `iter()` regresa un objeto **iterable** sobre el cuál se define el método `__next__()`;
3. Python llama la el método `__next__` sobre el resultado del `iter` hasta que no existan más elementos a regresar, en cuyo caso Python levanta una excepción `StopIteration` que termina el loop. 

In [3]:
values = iter(range(1, 4))

In [4]:
next(values)

1

In [5]:
next(values)

2

In [6]:
next(values)

3

In [7]:
next(values)

StopIteration: 

<h3 style="color:#56565a">Ejemplo</h3>

Creemos un primer _iterable_ que nos regrese números entre el 2 y el 10 al azar. Si el número observado es un 1, el ciclo se rompe.

In [5]:
from random import randint, seed

# Creamos un objeto: necesario para crear un iterable
class RandomValues:
    # Mencionamos que esta clase puede ser iterada
    def __iter__(self):
        return self
    # Definimos que sucede a cada iteración
    def __next__(self):
        value = randint(1, 10)
        if value == 1:
            raise StopIteration  # signals "the end"
        return value

La clase `RandomValues` únicamente implementa los métodos `__iter__` y `__next__`. Necesarios y suficientes para crear un iterable:

In [6]:
seed(314)
for v in RandomValues():
    print(v, end=" ")

4 8 2 3 

In [7]:
seed(31415)
for v in RandomValues():
    print(v, end=" ")

10 5 8 

In [8]:
seed(31415926)
for v in RandomValues():
    print(v, end=" ")

7 7 6 5 8 

<h3 style="color:#56565a">Ejemplo</h3>
Consideremos el siguiente ejemplo: queremos crear una clase iterable que nos regrese valores de Fibonacci uno a uno:

In [292]:
class FiboIter:
    # Valores únicos de la clase:
    #  * Número de elementos a iterar
    #  * Número actual (x1)
    #  * Número anterior (x0)
    #  * Número de elementos iterados (curr_elements)
    def __init__(self, n_elements):
        self.x0 = 0
        self.x1 = 1
        self.n_elements = n_elements
        self.curr_elements = 0
    def __iter__(self):
        return self
    def __next__(self):
        self.curr_elements += 1
        if self.curr_elements == 1:
            return self.x0
        elif self.curr_elements == 2:
            return self.x1
        elif self.curr_elements < self.n_elements:
            self.x0, self.x1 = self.x1, self.x0 + self.x1
            return self.x1
        else:
            raise StopIteration

In [293]:
for n in FiboIter(10):
    print(n, end=" ")

0 1 1 2 3 5 8 13 21 

<h3 style="color:crimson">Ejercicios</h3>

1. Crea el iterable `FizzBuzz(n)` el cual itere `n` veces y cumpla que, para cada `i = 1, ..., n`,
    * Si `i` es divisible por `3`, el iterador deberá regresar `"Fizz"`;
    * si `i` es divisible por `5`, el iterador deberá regresar `"Buzz"`; 
    * si `i` es divisible por `5` y `3`, el iterador deberá regresar `"FizzBuzz"`; 
    * si ninguna de las reglas de arriba se cumple, el iterador deberá regresar `i`.
2. Crea el iterable `FizzBuzzV2(n, v1, v2)` el cuál itere `n` veces y cumpla que, para cada `i = 1, ..., n`,
    * Si `i` es divisible por `v1`, el iterador deberá regresar `"Fizz"`;
    * si `i` es divisible por `v2`, el iterador deberá regresar `"Buzz"`; 
    * si `i` es divisible por `v1` y `v2`, el iterador deberá regresar `"FizzBuzz"`; 
    * si ninguna de las reglas de arriba se cumple, el iterador deberá regresar `i`.
3. Crea el iterrable `Div(n, v1, v2, ..., vk)` el cuál itere `n` veces y cumpla que, para cada `i = 1, ..., n`
    * Si `i` es divisible por cualesquiera `vi`, el iterador deberá regresar:  
        `"i divisible by vi, vi2, ..., vik"`
    * En otro caso, el iterrador deberá regresar: `i`
    
    
```python
>>> for v in Divn(n=14, v1=2, v2=3, v3=7):
>>>     print(v)
1
2 divisible by 2
3 divisible by 3
4 divisible by 2
5
6 divisible by 2, 3
7 divisible by 7
8 divisible by 2
9 divisible by 3
10 divisible by 2
11
12 divisible by 2, 3
13
14 divisible by 2, 7
```

## Generadores

La complejidad de crear un iterador no es siempre necesaria. Un _generador_ es una simple y efectiva herramienta para crear un iterador.

> Una función _generadora_ nos permite declarar una función que se comporte como un iterador, i.e., que se pueda usar en un _for loop_

La diferencia entre una función y un generador está en usar el keyword `yield` a cada momento que deseamos regresar información.

```python
def generator_fn():
    ...
    yield v
```

A diferencia de una función, al llegar a `yield`, la función regresa un valor y sigue el curso de la función.

In [18]:
from time import sleep
def give_10():
    for i in range(10):
        yield i

for v in give_10():
    print(v, end=" ")

0 1 2 3 4 5 6 7 8 9 

In [19]:
from time import sleep
def give_10():
    return [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

for v in give_10():
    print(v, end=" ")

0 1 2 3 4 5 6 7 8 9 

En los ejemplos anteriores creamos una función la cuál nos regresa una lista de 10 elementos.

En el siguiente ejemplo veremos las ventas y desventajas de usar una función o un generador dentro de una función. 

In [20]:
# Corriendo Función 
!time python -m memory_profiler ../files/lec02/func.py

Filename: ../files/lec02/func.py

Line #    Mem usage    Increment   Line Contents
     1   36.203 MiB   36.203 MiB   @profile
     2                             def my_func():
     3   43.836 MiB    7.633 MiB       a = [1] * (10 ** 6)
     4   43.836 MiB    0.000 MiB       return sum(a)



real	0m0.839s
user	0m0.440s
sys	0m0.215s


In [21]:
# Corriendo un generador
!time python -m memory_profiler ../files/lec02/gen.py

Filename: ../files/lec02/gen.py

Line #    Mem usage    Increment   Line Contents
     1   36.195 MiB   36.195 MiB   @profile
     2                             def my_func():
     3   36.195 MiB    0.000 MiB       total_sum = 0
     4   36.207 MiB    0.000 MiB       for v in range(10 ** 6):
     5   36.207 MiB    0.012 MiB           total_sum += v
     6   36.207 MiB    0.000 MiB       return total_sum



real	1m11.906s
user	0m47.399s
sys	0m24.312s


Mientras que `func.py` corrió substancialmente más rápido, crear la lista `a` genera 7mb de memoria extra que no ocupa el archivo `gen.py`.

<h3 style="color:#56565a">Ejemplos</h3>

1. Crea el generador `fizz_buzz(n)` el cual itere `n` veces y cumpla que, para cada `i = 1, ..., n`,
    * Si `i` es divisible por `3`, el generador deberá regresar `"Fizz"`;
    * si `i` es divisible por `5`, el generador deberá regresar `"Buzz"`; 
    * si `i` es divisible por `5` y `3`, el generador deberá regresar `"FizzBuzz"`; 
    * si ninguna de las reglas de arriba se cumple, el generador deberá regresar `i`.

In [17]:
def fizz_buzz(n):
    for i in range(1, n + 1):
        f_or_b = [i % 3 == 0, i % 5 == 0]
        if any(f_or_b):
            yield "Fizz" * f_or_b[0] + "Buzz" * f_or_b[1]
        else:
            yield i

for v in fizz_buzz(15):
    print(v, end="   ")

1   2   Fizz   4   Buzz   Fizz   7   8   Fizz   Buzz   11   Fizz   13   14   FizzBuzz   

2. Calculemos la suma de los números $\{0, 1, \ldots, 10^{10} - 1\}$. Considerando los siguientes dos programas, **¿Cuál de las siguientes gráficas es más factible haya sido creado por el primer programa? ¿por qué?**

* `Programa_1`
```python
    sum(list(range(10 ** 10)))
```

* `Programa_2`
```python
    sum(range(10 ** 10))
```

![F1](../files/lec02/pfunc.png)

![Generator](../files/lec02/pgen.png)

Del ejemplo antetior,
* el incremento de memoría usada del segundo al primer programa, en su punto máximo es 9,900% (approx);
* el incremento del primer al segundo programa fue 125% (approx)

Usar un generador es más convieniente cuando:
* Trabajemos con datos sobre los cuáles vamos a iterar. _Desempacar_ los valores uno a uno o _one shot_ depende de la cantidad de información con la que trabajaremos;
* exista un proceso dentro de nuestro programa el cuál no dependa de nuestra computadora, e.g., requerir información de un servidor o base de datos.



<h3 style="color:crimson">Ejercicios</h3>

1. Crea el generador `fibo_iter(n)` el cuál itere `n` veces y, a cada paso, regrese el `i`-ésimo elemento de la secuencia Fibonacci.

In [1]:
import math
from random import shuffle, seed

## Itertools

`itertools` es una colección de generadores es que regresan `iterators`. Como hemos visto, es importante crear iteradores que controlen el uso de memoria. `itertools` es una librería especializada para tratar con esos problemas.

In [2]:
import itertools as it

---
### `itertools.count`
Esta función es un contador infinito de valores

In [70]:
for x in it.count(start=0, step=math.pi / 5):
    y = math.sin(x)
    print(y)
    if round(y) == 0 and x != 0:
        break

0.0
0.5877852522924731
0.9510565162951535
0.9510565162951536
0.5877852522924732
1.2246467991473532e-16


In [79]:
values = [1, 2, 3, 4]
for v, dec in zip(values, it.count(0, 0.1)):
    print(f"{v} ^ {dec:0.2f} = {v ** dec:0.2f}")

1 ^ 0.00 = 1.00
2 ^ 0.10 = 1.07
3 ^ 0.20 = 1.25
4 ^ 0.30 = 1.52


----
### `itertools.cycle`
Dado un iterable, esta función itera uno a uno los valores y, una vez agotados, incia de nuevo

In [361]:
letters = ["A", "B"]
for n, letter in enumerate(it.cycle(letters)):
    if n == 10:
        break
    print(n, letter)

0 A
1 B
2 A
3 B
4 A
5 B
6 A
7 B
8 A
9 B


In [122]:
numbers = range(1, 20)
forms = ["impar", "par"]
for number, form in zip(numbers, it.cycle(forms)):
    print(f"{number:02} {form}")

01 impar
02 par
03 impar
04 par
05 impar
06 par
07 impar
08 par
09 impar
10 par
11 impar
12 par
13 impar
14 par
15 impar
16 par
17 impar
18 par
19 impar


Los iteradores anteriores son conocidos como **iteradores infinitos** dado que no se establece dentro de estos el momento último en el que acaban.

### `itertools.accumulate`
Esta función acumula los resultados de los valores uno a uno hasta que se agote la lista de los valores a iterar. 

![Acumulate](../files/lec02/accumulate.png)

La función predeterminada a ocupar es suma. En cuyo caso, dada una lista $\{x_1, x_2, \ldots, x_n\}$ los elementos resultantes serían
$$
    \{x_1, x_1 + x_2, \ldots, x_1 + x_2 + \ldots + x_n\}
$$

In [27]:
x = [1, 2, 3, 4, 5]
for v in it.accumulate(x):
    print(v, end=" ")

1 3 6 10 15 

la función `accumulate` lleva como parámetro opcional la función a aplicar a cada uno de los elementos. Esta función deberá tomar como primer parámetro el valor acumulado y como segundo parámetro el nuevo valor a aplicar.

In [45]:
numbers = [-56, -18,  49,  0, -55,  30, -46, -80, -42,  89,  88,  82, -73, -25,  32]
[n for n in it.accumulate(numbers, max)]

[-56, -18, 49, 49, 49, 49, 49, 49, 49, 89, 89, 89, 89, 89, 89]

In [46]:
[n for n in it.accumulate(numbers, min)]

[-56, -56, -56, -56, -56, -56, -56, -80, -80, -80, -80, -80, -80, -80, -80]

----
### `itertools.chain`
Esta función crea un iterable de elementos iterables sobre una lista

In [194]:
for v in it.chain(["A", "B"], ["C", "D"]):
    print(v)

A
B
C
D


In [287]:
for v in it.accumulate(it.chain(["A", "B"], ["C", "D"])):
    print(v)

A
AB
ABC
ABCD


En el caso de tener una lista con iterables sobre los cuáles aplicaremos `chain`, podemos

In [289]:
# Desempacar los valores de la lista 
letters = [["A", "B"], ["C", "D"]]
for v in it.chain(*letters):
    print(v)

A
B
C
D


In [290]:
# usar la propiedad "from_iterable" dentro de letters
letters = [["A", "B"], ["C", "D"]]
for v in it.chain.from_iterable(letters):
    print(v)

A
B
C
D


----
### `itertools.groupby`
Esta función crea un iterador que regresa las llaves de agrupación y los elementos agrupados dentro de un conjunto de datos.

In [308]:
values = "AAAAAXXBBBBCCCCCDDDOOOO"
for key, iterables in it.groupby(values):
    print(key)

A
X
B
C
D
O


In [309]:
values = "AAAAABBBBCCCCCDDDOOOO"
for key, iterables in it.groupby(values):
    print(iterables)

<itertools._grouper object at 0x113b5dfd0>
<itertools._grouper object at 0x113b5da20>
<itertools._grouper object at 0x113b5dfd0>
<itertools._grouper object at 0x113b5da20>
<itertools._grouper object at 0x113b5dfd0>


<h3 style="color:#56565a">Ejemplo</h3>

Considerando la siguiente lista de clientes con nombre y monto de deuda, supón queremos crear un programa en Python que nos agrupe la lista entre aquellos que estén por abajo del promedio y los que estén por arriba del promedio.
```
clients = [('person_0', 8),
 ('person_1', 30),
 ('person_2', 97),
 ('person_3', 516),
 ('person_4', 4597),
 ('person_5', 4592),
 ('person_6', 489),
 ('person_7', 7628),
 ('person_8', 6098),
 ('person_9', 2),
 ('person_10', 80501),
 ('person_11', 58094),
 ('person_12', 6743),
 ('person_13', 10018),
 ('person_14', 1736),
 ('person_15', 5678),
 ('person_16', 93520),
 ('person_17', 1956),
 ('person_18', 8083),
 ('person_19', 430017)]
```

El siguiente paso será crear una función auxiliar que nos diga el _orden_ del monto que deben

In [259]:
def order_num(n, o=1):
    if n % o != n:
        return order_num(n, o * 10)
    else:
        return o // 10

In [267]:
order_num(5)

1

In [275]:
order_num(80)

10

In [277]:
order_num(89404)

10000

El paso siguiente será ordenar los elementos de menor a mayor considerando el monto. Para esto, usaremos la función `sorted` ocupando como _lave_ la segunda entrada de cada tuple.

In [59]:
sorted(clients, key=lambda v: v[1])

[('person_9', 2),
 ('person_0', 8),
 ('person_1', 30),
 ('person_2', 97),
 ('person_6', 489),
 ('person_3', 516),
 ('person_14', 1736),
 ('person_17', 1956),
 ('person_5', 4592),
 ('person_4', 4597),
 ('person_15', 5678),
 ('person_8', 6098),
 ('person_12', 6743),
 ('person_7', 7628),
 ('person_18', 8083),
 ('person_13', 10018),
 ('person_11', 58094),
 ('person_10', 80501),
 ('person_16', 93520),
 ('person_19', 430017)]

Con los elementos ordenados, podemos agrupar los elementos dependiendo de su _orden_.

In [278]:
it.groupby(sorted(clients, key=lambda v: v[1]), key=lambda v: order_num(v[1]))

<itertools.groupby at 0x1152fc688>

El iterador anterior nos regresa pares de elementos `(llave, valores[generador])`. Del cuál sólo nos interesa obtener el segundo elemento; otro generador sobre cada agrupación encontrada

In [281]:
map(lambda v: v[1], it.groupby(sorted(clients, key=lambda v: v[1]), key=lambda v: order_num(v[1])))

<map at 0x11638a0f0>

In [310]:
values = map(lambda v: v[1], it.groupby(sorted(clients, key=lambda v: v[1]), key=lambda v: order_num(v[1])))
for v in values:
    print(list(v), end="\n" * 2)

[('person_9', 2), ('person_0', 8)]

[('person_1', 30), ('person_2', 97)]

[('person_6', 489), ('person_3', 516)]

[('person_14', 1736), ('person_17', 1956), ('person_5', 4592), ('person_4', 4597), ('person_15', 5678), ('person_8', 6098), ('person_12', 6743), ('person_7', 7628), ('person_18', 8083)]

[('person_13', 10018), ('person_11', 58094), ('person_10', 80501), ('person_16', 93520)]

[('person_19', 430017)]



----
### `itertools.compress`
Crea un iterador que regresa únicamente los elementos que regresen ciertos.

In [358]:
values = [3, 1, 4, 1, 5, 2, 3, 1, 5, 2]
select = [1, 0, 0, 0, 1, 0, 1, 0, 0, 1]

for v in it.compress(values, select):
    print(v)

3
5
3
2


<h3 style="color:#56565a">Ejemplo</h3>

Crea la función `range_primes` que regrese todos los números primos entre un rango `[2, n]`.

In [60]:
def range_primes(values, primes=None):
    primes = primes if primes is not None else [2]
    *_, last_prime = primes
    prime, *values = it.compress(values, map(lambda x: x % last_prime != 0, values))
    primes.append(prime)
    if len(values) != 0:
        return range_primes(values, primes)
    else:
        return primes

In [61]:
vals = range(2, 60)
range_primes(vals)

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59]

----
### `itertools.product`
Esta función regresa el producto cartesiano entre dos iterables. Esta  función es comunmente usada como reemplazo de un doble for loop.

In [25]:
upper = ["A", "B", "C"]
lower = ["a", "b", "c"]

for u, l in it.product(upper, lower):
    print(f"{u}-{l}", end="  ")

A-a  A-b  A-c  B-a  B-b  B-c  C-a  C-b  C-c  

In [12]:
table_size = 5
elements = [*[" "] * (table_size - 1), "\n"]
for (i, j), end in zip(it.product(*it.repeat(range(1, table_size + 1), 2)), it.cycle(elements)):
    print(f"{i * j:02}", end=end)

01 02 03 04 05
02 04 06 08 10
03 06 09 12 15
04 08 12 16 20
05 10 15 20 25


----
### `itertools.permutations`
Esta función crea un iterable de todas las permutaciones posibles de elementos de longitud `m`

In [106]:
for v in it.islice(it.permutations("Nabla"), 10):
    print(v)

('N', 'a', 'b', 'l', 'a')
('N', 'a', 'b', 'a', 'l')
('N', 'a', 'l', 'b', 'a')
('N', 'a', 'l', 'a', 'b')
('N', 'a', 'a', 'b', 'l')
('N', 'a', 'a', 'l', 'b')
('N', 'b', 'a', 'l', 'a')
('N', 'b', 'a', 'a', 'l')
('N', 'b', 'l', 'a', 'a')
('N', 'b', 'l', 'a', 'a')


----
### `itertools.combinations`
Esta función crea un iterable de todas las combinaciones posibles de elementos de longitud `m`

All possible combinations of games

In [18]:
def royal_flush(hand):
    """
    Returns True if all suits are same
    and has combinations 10, J, Q, K, A
    """
    rank = [10, "J", "Q", "K", "A"]
    same_suits = all(hand[0][0] == s for s, r in hand[1:])
    all_ranks = all(r in rank for s, r in hand)
    return all_ranks and same_suits

In [46]:
%%timeit -n 3
list(itertools.filterfalse(lambda hand: not royal_flush(hand), itertools.combinations(poker, 5)))

3.56 s ± 41.3 ms per loop (mean ± std. dev. of 7 runs, 3 loops each)


In [39]:
%%memit
hands = list(itertools.combinations(poker, 5))
for hand in hands:
    if royal_flush(hand):
        (hand)

peak memory: 496.74 MiB, increment: 191.01 MiB


<h3 style="color:crimson">Ejercicios</h3>

1. Usando elementos de itertools, crea la función `factorial` que regrese los primeros `n` números naturales aplicados
2. Crea una lista de todos los elementos dentro de una tabla de multiplicación de 10x10 cuyo último dígito sea 1
4. Considerando la lista `clients` definida arriba, escribe un programa que regrese un generador de los clientes cuyo monto en deuda está por abajo del promedio y aquellos que están por arriba del promedio.
3. Considerando la variable `numbers = [[(i, j) for i in range(1, 10)] for j in range(1, 10)]`, crea la función `sum_pairs(n)` que regrese un iterable con todos los pares de números que sumen `n` ocupando **unicamente** `itertools`, `sorted`, `map` & `filter`. No puedes ocupar for loops ni list comphrensions\*\*

```python
>>> numbers = [[(i, j) for i in range(1, 10)] for j in range(1, 10)]
>>> for v in sum_pairs(5):
>>>    print(v)
(4, 1)
(3, 2)
(2, 3)
(1, 4)
 ```
5. Sabiendo que existen 4 clases de cartas de poker y 12 rango de cartas, calcula usando `itertools` el número de cartas posibles por tener

```python
poker_class = ["Espadas", "Corazones", "Diamantes", "Tréboles"]
poker_rank = ["A", 1, 2, ..., 10, "J", "Q", "K"]
```
6. Un juego títpico de poker involucra tener 5 cartas en la mano. ¿Cuántas combinaciones de 5 cartas en la mano existen?

## Referencias
1. https://wiki.python.org/moin/Generators
2. https://wiki.python.org/moin/Iterator
3. https://docs.python.org/3/tutorial/classes.html
4. https://docs.python.org/3/library/itertools.html