# Iterables e iteradores

Python permite la [iteración](https://docs.python.org/3.6/library/stdtypes.html#iterator-types) sobre muchos tipos de objetos, por ejemplo sobre las listas.
El bucle for lo que hace es utilizar esta capacidad para iterar sobre cada uno de los elementos del objeto que está siendo iterado.

Cuando estamos iterando a los elementos de un iterador accedemos de uno en uno utilizando la función next y no podemos volver hacia atrás.

Los objetos range son un ejemplo de iterable del que podemos obtener un iterador utilizando la función iter.
Otro ejemplo de iterador es el objeto file que utilizamos para leer de los ficheros.

In [17]:
numeros = range(2)
print(numeros)

range(0, 2)


In [18]:
numeros = iter(numeros)
print(numeros)

<range_iterator object at 0x10ffa2990>


In [19]:
next(numeros)

0

In [20]:
next(numeros)

1

## Iterable vs iterador

Un iterable es una clase de la que podemos crear un iterable utilizando la función iter, su método \_\_iter\_\_ debe devolver un iterador.

Un iterador es un objeto que implementa la interfaz de iteración, los métodos \_\_next\_\_ e \_\_iter\_\_.

Una lista es un iterable, pero no un iterador.

In [None]:
lista = [1, 2, 3]

Podemos generar un iterador a partir de una lista.

In [27]:
iterador = iter(lista)

Pero no podemos iterar una lista porque no es un iterador.

In [28]:
next(lista)

TypeError: 'list' object is not an iterator

Podemos iterar sobre un iterador.

In [29]:
next(iterador)

1

## No podemos obtener la longitud de un iterador

El protocolo de iteración no tiene soporte para la función len ya que al ser el único requisito el de acceder a los elementos de uno en uno no tiene porque saber cuántos elementos se acabarán generando en total.

In [24]:
len(numeros)

TypeError: object of type 'range_iterator' has no len()

## Los iteradores ahorran memoria

Una gran ventaja de los iteradores es que al acceder a los elementos de uno en uno no tenemos porque tener esos elementos en memoria antes de comenzar.
Por ejemplo, si hacemos un range de un millón de elmentos estos elementos no son creados hasta que no les llega su turno, hasta que no son requeridos por la función next.

## Los iteradores se consumen

A medida que vamos pidiendo elementos a un iterador utilizando la función next éste se va consumiendo y aunque lo tengamos almacenado en otra variable cuando intentemos acceder a él nos daremos cuenta de que se ha agotado total o parcialmente.

In [21]:
iterador1 = iter([1, 2, 3])
iterador2 = iterador1
next(iterador1)

1

In [22]:
next(iterador1)

2

Si ahora intentamos utilizar la otra variable que hacía referencia al iterador la iteración continuará por dónde había quedado, no comenzará de nuevo.

In [23]:
next(iterador2)

3

## Protocolo de iteración

Cualquier clase que implemente el protocolo de iteración es un iterador porque se comporta como un iterador.
El protocolo de iteración se compone de dos métodos especiales:

  - \_\_iter\_\_ que debe devolver una instancia del propio iterador. Este es el método especial que será invocado por la función iter.
  - \_\_next\_\_ que irá devolviendo los elementos uno a uno al ser llamada la función next. Este método creará una excepción StopIteration cuando ya no queden más objetos.

In [2]:
lista = [1, 2, 3]
iterador = iter(lista)
next(iterador)

1

In [3]:
next(iterador)

2

In [4]:
next(iterador)

3

In [5]:
next(iterador)

StopIteration: 

## for y los iteradores

for es capaz de funcionar con cualquier iterable.
Internamente primero convierte el iterable en un iterador haciendo uso de su método \_\_iter\_\_ y después consume el iterador usando su método \_\_next\_\_.

## Generadores

Un generador es una especie de función que se comporta como iterador.
Su sintaxis es muy similar a la de una función normal, pero en vez de return utiliza yield.

In [31]:
def un_generador():
    yield 1

una_instancia_del_generador = un_generador()
print(una_instancia_del_generador)

<generator object un_generador at 0x11002c3b8>


In [32]:
next(una_instancia_del_generador)

1

In [34]:
next(una_instancia_del_generador)

StopIteration: 

Podemos pensar en un generador como en una función es llamada cuando utilizamos next y que interrumpe su ejecución cuando llega al yield a la espera del siguiente next.

In [35]:
def generador():
    print('Hola')
    yield 1
    print('Caracola')
    yield 2

objeto_generador = generador()
next(objeto_generador)

Hola


1

In [36]:
next(objeto_generador)

Caracola


2

### Generadores y programación funcional

Los generadores nos permiten hacer programación funcional en Python de un modo muy eficiente.
Imaginemos que queremos crear los cuadrados de los mil primeros números naturales.

Podemos hacerlo con funciones.

In [40]:
def eleva_al_cuadrado(numeros):
    cuadrados = []
    for numero in numeros:
        cuadrados.append(numero**2)
    return cuadrados

numeros = range(1, 1001)
cuadrados = eleva_al_cuadrado(numeros)
print(cuadrados[:10])

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


Altenativamente podemos escribir el mismo código utilizando generadores.

In [41]:
def eleva_al_cuadrado(numeros):
    for numero in numeros:
        yield numero**2

numeros = range(1, 1001)
cuadrados = eleva_al_cuadrado(numeros)
print(cuadrados)

<generator object eleva_al_cuadrado at 0x11004cb48>


In [42]:
print(list(cuadrados)[:10])

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


El generador tiene varias ventajas:
  - Nunca se ha almacenado la lista de cuadrados en memoria. Se ha creado cada cuadrado cuando ha sido demandado por la función usuaria.
  - El código es más legible.
  - Si necesitamos convertir el resultado en una lista siempre podemos hacerlo con list.
  
El ahorro de memoria es crítico cuando estamos trabajando con grandes cantidades de datos que no tienen porqué caber en la memoria de nuestro ordenador.

## map y filter

Una ultima forma de programar la misma tarea en Python es usar la función map.

In [43]:
def eleva_al_cuadrado_un_numero(numero):
    return numero**2

numeros = range(1, 1001)
cuadrados = map(eleva_al_cuadrado_un_numero, numeros)
print(cuadrados)

<map object at 0x110058f60>


In [44]:
print(list(cuadrados)[:10])

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


Python disponde de las funciones [map](https://docs.python.org/3.6/library/functions.html#map) y [filter](https://docs.python.org/3.6/library/functions.html#filter) para hacer programación funcional.

## Itertools

El módulo [itertools](https://docs.python.org/3/library/itertools.html) dispone de una rica funcionalidad para trabajar con iteradores en Python.