## Estructuras de control: bucles



Por ahora nuestros programas han sido todos lineales: Una serie de instrucciones que se ejecutan una detras de la otra. Las estructuras de control nos permiten cambiar esto de varias formas, por ejemplo, podemos hacer que una serie de instrucciones se repita varias veces, o podemos hacer que distintas partes del código se ejecute en diferentes condiciones. 

Los bucles son la estructura de control que nos permite repetir algo muchas veces. En Python hay de dos tipos, los bucles _for_ y los bucles _While_. Las dos formas son igual de potentes, pero un algunos casos es más legible y sencillo usar uno que otro. En esta sección veremos solo el bucle `for`, y dejaremos la [explicación del while](./009_while.ipynb) para un poco más adelante.

## El bucle for

La primera estructura de control que veremos es el **bucle for**, que nos permite realizar una serie de instrucciones varias veces. Los bucles for están muy vinculados a las secuecias como las listas, porque funcionan repitiendo unas determinadas instrucciones _para cada elemento de la secuencia_. Su forma general es:

<code>
**for** _variable_ **in** _secuencia_:
    _instruccion 1_
    _instruccion 2_
    _etc..._
</code>
    
Observese que todas las instrucciones que se repiten están sangradas o **indentadas**, es decir, están más a la derecha que la línea for que empieza el bucle. En otrs lenguajes este sangrado o indentación es voluntario, porque se usan determinadas marcas para indicar el comienzo y el final de un bloque de código (símbolos como { y } en el caso de C y derivados, C++, C#, Java, JavaScript, etc... o con palabras reservadas como en Pascal `BEGIN` y `END`).

En Python, por el contrario, como en otros lenguajes (Haskell, Occam, ...) **el sangrado tiene significado y es, por tanto, obligatorio**. La forma que tiene el lenguaje de saber, en este caso, que líneas de programa tiene que ejecutar de forma repetida es ver que líneas están indentadas a un nivel superior.

> Nota: _Indentación_ es un anglicismo (de la palabra inglesa indentation) de uso común en  informática; no es un término reconocido por la Real Academia Española, por ahora. La Real Academia recomienda utilizar "sangrado". Este término significa mover un bloque

Veamos un ejemplo, si queremos calcular  la suma de los números en una lista dada:

In [5]:
lista_de_numeros = [1, 2, 3, 4, 5, 6]
acc = 0
for num in lista_de_numeros:
    acc = acc + num
print(acc)

21


Veamos varias cosas nuevas en este codigo:

 - Usamos la función `print` para imprimir un resultado. Hasta ahora hemos puesto simplrmente la variable o expresión a representar al final de la celda, que Jupyter notebook la pinta por nosotros. Usando la función `print` podemos imprimir en cualquier parte del programa.
    
 - Usamos un acumulador (la variable `acc`) para ir sumando poco a poco los valores de la lista
    
 - El bucle for solo ejecuta una línea, porque solo hay una línea indentada a un mayor nivel que el propio for

**Ejercicio:** ¿Qué pasaría si el bucle for repitiera las dos líneas siguientes, no solo una? Es decir, si la línea `print(acc)` estuviera indentada

In [6]:
lista_de_numeros = [1, 2, 3, 4, 5, 6]
acc = 0
for num in lista_de_numeros:
    acc = acc + num
    print(acc)

1
3
6
10
15
21


**Otro ejercicio:** Calcular la media de los números de una lista
    
Para este ejercicio, hay que usar una función llamada `len`. Esta función acepta como parámetro una secuencia (como por ejemplo, una lista) y nos devuelve el número de elementos particilares en la misma. Por ejemplo:

In [8]:
l = [0, 1, 2, 3, 4]
print(len(l))  # Debería ser 5

5


In [10]:
lista_de_numeros = [1, 2, 3, 4, 5, 6]
acc = 0
for num in lista_de_numeros:
    acc = acc + num
    
media = ...  # Tu código aquí

print(acc, len(lista_de_numeros), media)


21 6 Ellipsis


Observese que la función `print` admite un **número variable de parámetros**. En este caso se le estan dado tres parámetros, y el simplemente los representa en pantalla uno después de otro.

¿Qué pasa si quiero ejecutar algo 1000 veces? Como hemos visto hasta ahora, el `for` depende de una secuencia para ejecutarse. Para ello recurrimos al ya conocido `range`. Esta función devuelve una secuencia de valores perfectamente recorribles por un `for`. Por ejemplo, vamos a imprimir los cuadrados de los 10 primeros números naturales:

In [11]:
for i in range(1, 11):
    print(i, i**2)

1 1
2 4
3 9
4 16
5 25
6 36
7 49
8 64
9 81
10 100


### Cómo NO recorrer una lista

A veces, la gente que viene de otros lenguajes de programación está acostumbrada
a una forma del bucle `for` en el que el valor que cambia en cada iteración no es el valor del elemento correspondiente de la secuencia, sino un índice númerico de la posición del elemento en la secuencia. Los programadores acostumbrados a ese tipo de bucles a veces hacen código de esta forma:

In [2]:
l = ['lunes', 'martes', 'miércoles', 'jueves', 'viernes', 'sábado', 'domingo']
for i in range(len(l)):
    dia = l[i]
    print(dia)

lunes
martes
miércoles
jueves
viernes
sábado
domingo


Hay que cambiar ese hábito, porque los bucles son así más lentos y el código, encima, más difícil de leer; comparen el código anterior con esta forma más _pythónica_:

In [4]:
l = ['lunes', 'martes', 'miércoles', 'jueves', 'viernes', 'sábado', 'domingo']
for dia in l:
    print(dia)

lunes
martes
miércoles
jueves
viernes
sábado
domingo


In [None]:
La excusa que dan a veces es ¿Y si mañana necesito el índice? por ejemplo, para mostrar el índice y el nombre del día:


In [5]:
l = ['lunes', 'martes', 'miércoles', 'jueves', 'viernes', 'sábado', 'domingo']
for i in range(len(l)):
    dia = l[i]
    print(i, dia)

0 lunes
1 martes
2 miércoles
3 jueves
4 viernes
5 sábado
6 domingo


Para resolver esto se usa una función llamada `enumerate`, que por cada elemento de la secuencia que le pasamos como entrada, nos devuelve una pareja de valores, siendo el primero  de ellos el índice y el segundo el elemento en si, de forma que la solución _pythónica_ del caso anterior sería:

In [6]:
l = ['lunes', 'martes', 'miércoles', 'jueves', 'viernes', 'sábado', 'domingo']
for i, dia in enumerate(l):
    print(i, dia)

0 lunes
1 martes
2 miércoles
3 jueves
4 viernes
5 sábado
6 domingo


Que sigue siendo más rápida y legible que la alternativa no _pythónica_.

## Resumen y comentario

- Los bucles nos permiten ejecutar un bloque de ĺíneas de código muchas veces

- El bucle `for` es una forma especializada de bucle que está especialmente indicada
  para recorrer secuencias.
  
- Si venimos de otros lenguajes de programación, podemos sentirnos tentados de hacer 
  los bucles con for usando siempre el `range`. Esto no es recomendable porque el código 
  resulta menos legible y es más lento

In [1]:
stop_words = '''
el la los las por de del que se y que
a ante bajo con contra de desde en entre hacia hasta para por segun
sin sobre tras durante mediante
'''.split()

stop_words

['el',
 'la',
 'los',
 'las',
 'por',
 'de',
 'del',
 'que',
 'se',
 'y',
 'que',
 'a',
 'ante',
 'bajo',
 'con',
 'contra',
 'de',
 'desde',
 'en',
 'entre',
 'hacia',
 'hasta',
 'para',
 'por',
 'segun',
 'sin',
 'sobre',
 'tras',
 'durante',
 'mediante']