<a href="https://colab.research.google.com/github/Danangellotti/Ciencia_de_datos_2025/blob/main/Semana_04_08_Generadores.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Generadores en Python
Si alguna vez te has encontrado con una función en Python que no sólo tiene una sentencia `return`, sino que además devuelve un valor haciendo uso de `yield`, ya has visto lo que es un generador o generator. A continuación te explicó cómo se crean, para qué sirven y sus ventajas. Es muy importante también no confundir los generadores con las corrutinas, que también usan `yield` pero de otra manera, sin embargo estas las dejamos para más adelante.

Empecemos por lo básico. Seguramente ya sepas lo que es una función y cómo puede devolver un valor con `return`.

In [None]:
def funcion():
    return 5

Como hemos explicado, los generadores usan `yield` en vez de `return`. Vamos a ver que pasaría si cambiamos el return por el yield.

In [None]:
def generador():
    yield 5

Y ahora vamos a intentar llamar a las dos “funciones”.



In [None]:
print('Resultado de la ejecución de la función: ', funcion())
print('Resultado de la ejecución del generador: ', generador())

Resultado de la ejecución de la función:  5
Resultado de la ejecución del generador:  <generator object generador at 0x79f5acce6dc0>


Podemos ver ya la primera diferencia al usar el `yield`. La función devuelve un 5, pero el generador devuelve un objeto de la clase `generator`. En realidad el número `5` también puede ser accedido en el caso del generador, pero esto lo veremos más adelante.

Entonces, si una función contiene al menos una sentencia `yield`, se convertirá en una función generadora. Una función generadora se diferencia de una función normal en que tras ejecutar el `yield`, la función devuelve el control a quién la llamó, pero la función es pausada y el estado (valor de las variables) es guardado. Esto permite que su ejecución pueda ser reanudada más adelante.

## Iterando los Generadores

A continuación vamos a ver cómo acceder a los valores del generador. Para comprenderlo mejor, te recuerdo que leas antes más acerca de iterables e iteradores.

Otra de las características que hacen a los generators diferentes, es que pueden ser iterados, ya que sobreescriben los métodos `__iter__` y `__next__`, por lo que podemos usar `next` sobre ellos. Dado que son iterables, lanzan también un `StopIteration` cuando se ha llegado al final.

Volviendo al ejemplo anterior, vamos a ver como podemos usar el `next`.

In [None]:
a = generador()
print('El resultado de invocar al generador y pasarselo a next es: ', next(a))

El resultado de invocar al generador y pasarselo a next es:  5


Como te prometimos antes, el `5` también se podía acceder ¿has visto?. Pero vamos a ver que pasa ahora si intentamos llamar otra vez a `next`. Si recuerdas, sólo tenemos una llamada a `yield`.

In [None]:
import traceback

In [None]:
a = generador()
print('El resultado de invocar al generador y pasarselo a next es: ', next(a))
try:
  print(next(a))
except StopIteration:
  traceback.print_exc()

El resultado de invocar al generador y pasarselo a next es:  5


Traceback (most recent call last):
  File "<ipython-input-6-d7987709420e>", line 4, in <cell line: 3>
    print(next(a))
StopIteration


Como era de esperar, tenemos una excepción del tipo `StopIteration`, ya que el generador no devuelve más valores. Esto se debe a que cada vez que usamos `next` sobre el generador, se llama y se continúa su ejecución después del último `yield`. Y en este caso cómo no hay más código, no se generan más valores.

## Creando Generadores

Vamos a ver otro ejemplo más completo donde tengamos un generador que genere varios valores. En la siguiente función podemos ver como tenemos una variable `n` que incrementada en 1, y después retorna con `yield`. Lo que pasará aquí, es que el generador generará un total de tres valores.

In [None]:
def generador():
    n = 1
    yield n

    n += 1
    yield n

    n += 1
    yield n

Y haciendo uso de `next` al igual que hacíamos antes, podemos ver los valores que han sido generados. Lo que pasa por debajo, sería lo siguiente:

* Se entra en la función generadora, `n=1` y se devuelve ese valor. Como ya hemos visto, el estado de la función se guarda (el valor de `n` es guardado para la siguiente llamada)
* La segunda vez que usamos `next` se entra otra vez en la función, pero se continúa su ejecución donde se dejó anteriormente. Se suma `1` a la variable `n` y se devuelve el nuevo valor.
* La tercera llamada, realiza lo mismo.
* Una cuarta llamada daría un error, ya que no hay más código que ejecutar.

In [None]:
g = generador()
print('El resultado de invocar al generador y pasarselo a next es: ', next(g))
print('El resultado de invocar al generador y pasarselo a next es: ', next(g))
print('El resultado de invocar al generador y pasarselo a next es: ', next(g))

El resultado de invocar al generador y pasarselo a next es:  1
El resultado de invocar al generador y pasarselo a next es:  2
El resultado de invocar al generador y pasarselo a next es:  3


Otra forma más cómoda de realizar lo mismo, sería usando un simple bucle for, ya que el generador es iterable.

In [None]:
for i in generador():
    print('El resultado es: ', i)


El resultado es:  1
El resultado es:  2
El resultado es:  3


## Forma alternativa
Los generadores también pueden ser creados de una forma mucho más sencilla y en una sola línea de código. Su sintaxis es similar a las list comprehension, pero cambiando el corchete `[]` por paréntesis `()`.

El ejemplo con list comprehensions sería el siguiente. Simplemente se generan los valores de una lista elevados al cuadrado.

In [None]:
lista = [2, 4, 6]
al_cuadrado = [x**2 for x in lista]
print('Se generó una lista con los valores: ', al_cuadrado)

Se generó una lista con los valores:  [4, 16, 36]


Y su equivalente con generadores sería lo siguiente.



In [None]:
al_cuadrado_generador = ((x**2,input('\tPausa del iterador, presione enter para continuar')) for x in lista)

print('Se generó un generador: ', al_cuadrado_generador)

Se generó un generador:  <generator object <genexpr> at 0x79f5acce7ca0>


Y como hemos visto los valores pueden ser generados de la siguiente forma.



In [None]:
for i in al_cuadrado_generador:
  print('El resultado es: ', i[0])

	Pausa del iterador, presione enter para continuar
El resultado es:  4
	Pausa del iterador, presione enter para continuar
El resultado es:  16
	Pausa del iterador, presione enter para continuar
El resultado es:  36


La diferencia entre el ejemplo usando list compregensions y generators es que en el caso de los generadores, los valores no están almacenados en memoria, sino que se van generando al vuelo. Esta es una de las principales ventajas de los generadores, ya que los elementos sólo son generados cuando se piden, lo que hace que sean mucho más eficientes en lo relativo a la memoria.

Nótese como primero se muestra la pausa dentro del generador y luego se muestra el mensaje del `for`.

## Ventajas y ejemplos
Llegados a este punto tal vez te preguntes para qué sirven los generadores. Lo cierto es que aunque no existieran, podría realizarse lo mismo creando una clase que implemente los métodos `__iter__` y `__next__`. Veamos un ejemplo de una clase que genera los primeros 10 números (0,9) al cuadrado.



In [None]:
class AlCuadrado:

    """ Clase que genera los primeros 10 números al cuadrado.
    """
    def __init__(self):
        self.i = 0

    """ Método que permite iterar sobre la clase.
    """
    def __iter__(self):
        return self

    """ Método que permite obtener el siguiente valor de la clase.
    """
    def __next__(self):
        if self.i > 9:
            raise StopIteration

        result = self.i ** 2
        self.i += 1
        return result

Y de la misma forma que usábamos los generadores, podemos usar nuestra clase AlCuadrado. Creamos un objeto de ella, y la iteramos. En cada iteración generará un nuevo valor nuevo hasta que se llegue al final.

In [None]:
eleva_al_cuadrado = AlCuadrado()
for i in eleva_al_cuadrado:
    print('El resultado es: ', i)

El resultado es:  0
El resultado es:  1
El resultado es:  4
El resultado es:  9
El resultado es:  16
El resultado es:  25
El resultado es:  36
El resultado es:  49
El resultado es:  64
El resultado es:  81


Sin embargo esta forma es un tanto larga y tal vez confusa. Como hemos visto antes, podemos llegar a hacer lo mismo en una sola línea de código. ¿Para que complicarse la vida?

Por otro lado, ya hemos mencionado que el uso de los generadores hace que no todos los valores estén almacenados en memoria sino que sean generados al vuelo. Vamos a ver un ejemplo donde se puede ver mejor. Supongamos que queremos sumar los primeros 100 números naturales (referencia). Una opción podría ser crear una lista de todos ellos y después sumarla. En este caso, todos los valores son almacenados en memoria, algo que podría ser un problema si por ejemplo intentamos sumar los primeros 1e10 números.

In [None]:
def primerosn(n:int) -> list[int]:
    """ Crea una lista con los primeros n números naturales.

    Args:
        n (int): número de elementos a sumar.

    Returns:
        int: suma de los primeros n números naturales.
    """
    nums:list[int] = []
    for i in range(n):
        nums.append(i)
    return nums

print('La suma de los primeros 100 número es: ', sum(primerosn(100)))

La suma de los primeros 100 número es:  4950


Sin embargo, podemos realizar lo mismo con un generador. En este caso los valores serán generados uno por uno según se vayan necesitando.

In [None]:
def primerosn_(n:int) -> int:
    """ Generador de los primeros n números naturales.

    Args:
        n (int): número de elementos a generar.

    Yields:
        int: número generado.
    """
    num = 0
    for i in range(n):
        yield num
        num += 1
print('La suma de los primeros 100 número es: ', sum(primerosn_(100)))

La suma de los primeros 100 número es:  4950


Nótese que es un ejemplo con fines didácticos, por lo que si quieres hacer esto, la mejor manera sería usando un simple range() asumiendo que usas Python 3.

In [None]:
print('La suma de los primeros 100 número es: ', sum(range(100)))

La suma de los primeros 100 número es:  4950
