A menudo, una parte importante del análisis de datos es repetir un cálculo similar, una y otra vez, de forma automatizada. Por ejemplo, puede tener una tabla de nombres que le gustaría dividir en nombre y apellido , o quizás de fechas que le gustaría convertir a algún formato estándar. Una de las respuestas de Python a esto es la sintaxis del iterador . Ya hemos visto esto con el iterador range:

In [4]:
for i in range(10):
    print(i, end=' ')

0 1 2 3 4 5 6 7 8 9 

**Aquí vamos a profundizar un poco más. Resulta que en Python 3, range no es una lista, sino algo llamado iterador , y aprender cómo funciona es clave para comprender una amplia clase de funcionalidades de Python muy útiles.**

##### Iterando sobre listas 
Los iteradores quizás se entiendan más fácilmente en el caso concreto de iterar a través de una lista. Considera lo siguiente:

In [8]:
for value in [2, 4, 6, 8, 10]:
    # do some operation
    print(value + 1, end=' ')

3 5 7 9 11 

La sintaxis familiar for x in y nos permite repetir alguna operación para cada valor de la lista.

El hecho de que la sintaxis del código esté tan cerca de su descripción en inglés (" para [cada] valor en [la] lista ") es solo una de las opciones sintácticas que hacen de Python un lenguaje tan intuitivo para aprender y usar.

Pero el comportamiento nominal no es lo que realmente está sucediendo. Cuando escribe algo como " for val in L", el intérprete de Python comprueba si tiene una interfaz de iterador , que puede comprobar usted mismo con la función incorporada iter:

In [9]:
iter([2,4,6,8,10])

<list_iterator at 0x16c4e118040>

Es este objeto iterador el que proporciona la funcionalidad requerida por el bucle for. El objeto iter es un contenedor que le da acceso al siguiente objeto mientras sea válido, que se puede ver con la función incorporada next:

In [22]:
I = iter([2, 4, 6, ])

In [23]:
I

<list_iterator at 0x16c4e118220>

In [24]:
print(next(I))

2


In [25]:
print(next(I))

4


In [26]:
print(next(I))

6


In [27]:
print(next(I))

StopIteration: 

¿Cuál es el propósito de este nivel de indirección? Bueno, resulta que esto es increíblemente útil, porque le permite a Python tratar las cosas como listas que en realidad no son listas .

###### range(): Una lista no es siempre una lista 
Quizás el ejemplo más común de esta iteración indirecta es la función range() en Python 3 (nombrada xrange()en Python 2), que devuelve no una lista, sino un objeto especial range() :

In [30]:
range(10)

range(0, 10)

In [31]:
#range, como una lista, expone un iterador:
iter(range(10))

<range_iterator at 0x16c4e122130>

Entonces Python sabe tratarlo como si fuera una lista:

In [34]:
for i in range(10):
    print(i,end='-')

0-1-2-3-4-5-6-7-8-9-

**El beneficio de la indirección del iterador es que la lista completa nunca se crea explícitamente.**

Podemos ver esto haciendo un cálculo de rango que abrumaría la memoria de nuestro sistema si realmente lo instanciamos (tenga en cuenta que en Python 2, rangecrea una lista, por lo que ejecutar lo siguiente no conducirá a cosas buenas):

In [38]:
N = 10 ** 12
for i in range(N):
    if i >= 10:
        break
    print(i, end=', ')

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 

**Si range realmente creara esa lista de un billón de valores, ocuparía decenas de terabytes de memoria de la máquina: un desperdicio, dado que estamos ignorando todos los valores excepto los primeros 10.**

De hecho, ¡no hay ninguna razón por la que los iteradores tengan que terminar! La biblioteca itertools de Python contiene una función count que actúa como un rango infinito:

In [39]:
from itertools import count

for i in count():
    if i >= 10:
        break
    print(i, end=', ')

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 

Si no hubiéramos lanzado una ruptura de bucle aquí, continuaría contando felizmente hasta que el proceso se interrumpa o elimine manualmente (usando, por ejemplo, ctrl-C).

#### Iteradores útiles 
Esta sintaxis de iterador se usa casi universalmente en los tipos integrados de Python, así como en los objetos más específicos de la ciencia de datos que exploraremos en secciones posteriores. Aquí cubriremos algunos de los iteradores más útiles en el lenguaje Python:

#### enumerate
**A menudo es necesario iterar no solo los valores de una matriz, sino también realizar un seguimiento del índice**. Es posible que tenga la tentación de hacer las cosas de esta manera:

In [45]:
L = [2, 4, 6, 8, 10]
for i in range(len(L)):
    print(i, L[i])

0 2
1 4
2 6
3 8
4 10


Aunque esto funciona, Python proporciona una sintaxis más limpia usando el enumerateiterador:

In [46]:
for i,val in enumerate(L):
    print(i,val)


0 2
1 4
2 6
3 8
4 10


Esta es la forma más "Pythonic" de enumerar los índices y valores en una lista.

#### ZIP
**Otras veces, es posible que tenga varias listas sobre las que desee iterar simultáneamente.**

Ciertamente, podría iterar sobre el índice como en el ejemplo no Pythonic que vimos anteriormente, pero es mejor usar el iterador zip, que junta los iterables:


In [48]:
L = [2, 4, 6, 8, 10]
R = [3, 6, 9, 12, 15]
for lval, rval in zip(L, R):
    print(lval, rval)

2 3
4 6
6 9
8 12
10 15


Se puede comprimir cualquier número de iterables juntos, y si tienen diferentes longitudes, el más corto determinará la longitud del zip.

In [52]:
small=[1,4]
big=[3,33,1]

for s,b in zip(small,big):
    print(s,b)

1 3
4 33


### map y filter
**El iterador map toma una función y la aplica a los valores en un iterador:**

In [56]:
# averiguar los 10 primeros cuadrados
square = lambda x: x ** 2
for val in map(square, range(10)):
    print(val, end=' ')

0 1 4 9 16 25 36 49 64 81 

**El iterador filter tiene un aspecto similar, excepto que solo transfiere valores para los que la función de filtro se evalúa como Verdadero:**

In [57]:
# find values up to 10 for which x % 2 is zero
is_even = lambda x: x % 2 == 0
for val in filter(is_even, range(10)):
    print(val, end=' ')

0 2 4 6 8 

Las funciones map y filter, junto con la función reduce(que vive en el módulo functools de Python ) son componentes fundamentales del estilo de programación funcional , que, aunque no es un estilo de programación dominante en el mundo de Python, tiene sus defensores abiertos (ver, por ejemplo, la biblioteca pytoolz ).

##### Iteradores como argumentos de función ¶
Vimos en * args y ** kwargs: Argumentos flexibles .  * args y ** kwargs se puede utilizar para pasar secuencias y diccionarios a funciones. Resulta que la sintaxis * args funciona no solo con secuencias, sino con cualquier iterador:

In [61]:
print(*range(10))

0 1 2 3 4 5 6 7 8 9


Entonces, por ejemplo, podemos complicarnos y comprimir el ejemplo anterior de map en lo siguiente:

In [63]:
print(*map(lambda x: x ** 2, range(10)))

0 1 4 9 16 25 36 49 64 81


El uso de este truco nos permite responder la antigua pregunta que surge en los foros de estudiantes de Python: ¿por qué no hay una funcion unzip() que haga lo contrario de zip()? 

Si te encierras en un armario oscuro y lo piensas por un tiempo, es posible que te des cuenta de que lo opuesto zip()es ... zip()! La clave es que zip()puede unir cualquier número de iteradores o secuencias. Observar:

In [65]:
L1 = (1, 2, 3, 4)
L2 = ('a', 'b', 'c', 'd')

In [68]:
z  =  zip ( L1 ,  L2 ) 
print(  *z )

(1, 'a') (2, 'b') (3, 'c') (4, 'd')


In [70]:
z = zip(L1, L2)
new_L1, new_L2 = zip(*z)
print(new_L1, new_L2)

(1, 2, 3, 4) ('a', 'b', 'c', 'd')


Reflexiona sobre esto por un momento. Si comprende por qué funciona, ¡habrá recorrido un largo camino en la comprensión de los iteradores de Python!

#### Iteradores especializados: itertools
Antes miramos brevemente al iterador infinito range, itertools.count. El módulo itertools contiene una gran cantidad de iteradores útiles; Vale la pena explorar el módulo para ver qué hay disponible. 
Como ejemplo, considere la función itertools.permutations, que itera sobre todas las permutaciones de una secuencia:

In [72]:
from itertools import permutations
p = permutations(range(3))
print(*p)

(0, 1, 2) (0, 2, 1) (1, 0, 2) (1, 2, 0) (2, 0, 1) (2, 1, 0)


De manera similar, la itertools.combinationsfunción itera sobre todas las combinaciones únicas de N valores dentro de una lista:

In [74]:
from itertools import combinations
c = combinations(range(4), 2)
print(*c)

(0, 1) (0, 2) (0, 3) (1, 2) (1, 3) (2, 3)


Algo relacionado es el iterador product, que itera sobre todos los conjuntos de pares entre dos o más iterables:

In [76]:
from itertools import product
p = product('ab', range(3))
print(*p)

('a', 0) ('a', 1) ('a', 2) ('b', 0) ('b', 1) ('b', 2)


Existen muchos más iteradores útiles en itertools: la lista completa se puede encontrar, junto con algunos ejemplos, en la documentación en línea de Python .