# Módulo II: Cadenas, estructuras de datos y de control
***

## Sesión a
   
### Manipulación de cadenas (y expresiones regulares*)
***

Continuando con la compra de productos anterior, vamos  guardar la dirección del sitio donde los encontramos:


In [3]:
direccion1 = "Avenida 4 calle 10"

Es común que en algún punto queramos extraer información de un pedazo de texto. Si tenemos una cadena de texto, podemos acceder a sus valores:


In [4]:
direccion1[0]

'A'

Los **corchetes** nos ayudan a extraer valores de la variable cadena. Dentro de los corchetes usamos un número que indica la posición del caracter que queremos obtener. Hay que recordar que **la numeración de índices de acceso en Python inicia en '0'**. Es decir, si tenemos 10 elementos, entonces el primer elemento tendrá la posición '0' y el último, la posición '9'. En la imagen puedes ver una guía de las posiciones para cada caracter de la cadena:

![Indices en python](images/023-indicespython.png)

Usamos **dos puntos** para extraer secciones del texto. Desde el índice de la izquierda, hasta el índice que indiquemos a la derecha:

In [5]:
direccion1[1:4]

'ven'

Si dejamos en blanco el primer índice, por defecto se tomará la primera posición como inicio de la subsección.

In [6]:
direccion1[:5]

'Aveni'

Análogamente, si dejamos en blanco el segundo índice, se tomará el resto del texto a partir del primer índice.

In [7]:
direccion1[10:]

'calle 10'

Las cadenas también pueden ser definidas con comillas simples. Si usamos comillas triples, podemos construir textos de varias líneas.

In [8]:
# cadena construida con comillas simples
cadena = 'Avenida 4'  

# cadena de varias líneas, con comillas triples
direccion2 = """Avenida 4    
calle 10
edificio A
"""

print(direccion2)

Avenida 4    
calle 10
edificio A



Como compramos varios productos en distintos lugares, queremos almacenar esta información para futuras referencias:

In [9]:
tienda1 = "los chinos de la esquina"
tienda2 = "supermercado MUNDO"
tienda3 = "Abasto el rey"
tienda4 = "la bodega de Juan"

Python incluye herramientas para manipular cadenas de caracteres como éstas. Por ejemplo, existen funciones bastante útiles para modificar las mayúsculas y minúsculas de una cadena.

In [10]:
direccion1.upper()

'AVENIDA 4 CALLE 10'

In [11]:
direccion1.lower()

'avenida 4 calle 10'

La función **upper** convierte todas las letras a mayúsculas, mientras que **lower** las convierte a minúsculas. Este tipo de transformaciones son importantes cuando tenemos que mantener datos y textos limpios y consistentes. Por ejemplo, los nombres de nuestras tiendas no tienen mucha consistencia.

La función **title()**, Lleva a mayúsculas la primera letra de cada palabra dentro de la cadena, y coloca el resto en minúsculas. Por otro lado, la función **capitalize()** transforma sólo la primera letra de la cadena a mayúscula, mientras las demás a minúsculas.

In [12]:
tienda1.title()

'Los Chinos De La Esquina'

In [13]:
tienda2.capitalize()

'Supermercado mundo'

In [14]:
tienda3.capitalize()

'Abasto el rey'

In [15]:
tienda4.capitalize()

'La bodega de juan'

Otra función útil es **swapcase()**, que permite cambiar los caracteres que estén en minúsculas a mayúsculas, y viceversa:

In [16]:
tienda2.swapcase()

'SUPERMERCADO mundo'

Una de las tareas más comunes al tratar con textos es buscar ocurrencias de ciertas palabras o caracteres que nos interesen. En Python podemos usar las funciones **find, index, rfind, endswith, startwith**, y también podemos reemplazar ocurrencias con **replace**.

```python
direccion.find()
direccion.index()
direccion.rfind()
direccion.endswith
direccion.startwith
```


Queremos saber si en la dirección de la tienda está especificada la "calle". La función **find** nos indica la posición de la cadena donde empieza la palabra que buscamos, en caso de que la encuentre. En caso contrario, devuelve **-1**.

In [17]:
direccion1.find("calle")   # entre paréntesis la palabra que buscamos, entre comillas

10

Ahora queremos saber si anotamos el edificio donde está la tienda.

In [18]:
direccion1.find("edif")

-1

En este caso la dirección no contiene ninguna sub-cadena **"edif"**. La función **index()** opera de forma similar, pero en caso de no encontrar la cadena, devuelve un error de valor:

In [19]:
direccion1.index("edif")

ValueError: substring not found

La función **rfind** es similar a **find**, con la diferencia de que realiza la búsqueda desde la derecha de la cadena, devolviendo la posición de la primera ocurrencia. Por ejemplo:

In [20]:
tienda4.rfind("de")

10

Recordemos que ** ``` tienda4 = "la bodega de Juan"```**. La posición 10 corresponde a el segundo **"de"** que aparece en la frase. **rfind** empieza la búsqueda desde el final, por lo que la primera ocurrencia está en 10, y no en 5 (el **"de"** en la palabra "bodega"). Con **find** podemos encontrar la primera ocurrencia desde el inicio de la cadena:

In [21]:
tienda4.find("de")

5

Para verificar si una frase empieza o termina con algún caracter o palabra en particular, usamos las funciones **endswith()** y **startswith()**:

In [22]:
direccion1.endswith("Avenida")

False

In [23]:
direccion1.startswith("Avenida")

True

También es típico que queramos separar las palabras de un texto. Para ello, Python cuenta con la función **split()**.

In [24]:
direccion1.split()

['Avenida', '4', 'calle', '10']

Por defecto, **split()** separará la cadena por cada espacio, y guardará las palabras individuales en una lista. Si queremos separar el texto según otro caracter, podemos especificarlo dentro de los paréntesis:

In [77]:
direccion1.split("e")

['Av', 'nida 4 call', ' 10']

Podemos recuperar la cadena original usanod la función **join**, para unir las partes:

In [26]:
partes = direccion1.split("e")   # separamos la cadena donde se encuentre el caracter "e"
partes

['Av', 'nida 4 call', ' 10']

In [27]:
"e".join(partes)                 # volvemos a unir la cadena con el mismo caracter "e"

'Avenida 4 calle 10'

También podemos obtener sub-cadenas completas de acuerdo a algún caracter o palabra. En el caso anterior, obtenemos una lista con algunas palabras que no tienen mucha utilidad. En lugar se eso podemos separarlas así:

In [28]:
direccion1.partition("4")  # partición de la cadena a partir del caracter "4"

('Avenida ', '4', ' calle 10')

Esta función hace una "partición" de la cadena, devolviéndonos 3 partes: las sub-cadenas anterior y posterior del caracter que indicamos. En este caso, divide a partir de "4".

In [31]:
partes = direccion1.partition("4")
partes

('Avenida ', '4', ' calle 10')

In [32]:
"".join(partes)

'Avenida 4 calle 10'

Para unir nuevamente las partes de la tupla que obtenemos con la función **partition**, hacemos el **join** sin ningún caracter (usamos una cadena vacía **""**).

Ahora supón que en lugar de la palabra "Avenida" se quiere que aparezca la abreviación "Av." por comodidad. Con la función **replace()** podemos cambiar caracteres y palabras convenientemente:

In [33]:
direccion1.replace("Avenida", "Av.")

'Av. 4 calle 10'

El primer argumento de la función recibe el patrón o palabra que queremos reemplazar, y el segundo indica su reemplazo.

### Estructuras de datos
***

Hasta ahora sólo hemos guardado la información de pocos productos. Queremos almacenar otros, y es lógico que queramos hacerlo con orden, en un mismo lugar. En Python, podemos hacer uso de distintas estructuras de datos para ello. Por ejemplo, habíamos definido:

In [34]:
azucar = 9850.5
arroz = 9000.0

Pero podemos mantener ambos valores en una sola variable:

In [35]:
precios = [9850.50, 9000.0]
precios

[9850.5, 9000.0]

#### Listas 
***
A diferencia de los tipos de datos que hemos visto anteriormente, este es un dato compuesto, formado por una estructura conocida como **lista**. Literalmente almacena una lista de datos, que pueden ser de cualquier tipo (incluyendo a otras listas!). En este caso, es una lista de numeros flotantes, pero podemos tener también:

In [36]:
lista = [1, "hola", 34.66, [1,2,3]]
lista

[1, 'hola', 34.66, [1, 2, 3]]

Podemos almacenar otros productos dentro de listas, esta vez limitado sólo a los nombres. Además ya conocemos el precio de los dos primeros, e incluimos precios del resto, así que creamos una lista de precios:

In [38]:
nombres = ["azucar","arroz","harina", "aceite"]  # nombres de cada producto
precios = [arroz, azucar, 12000, 18000]          # precios correspondientes a cada producto

Observa que podemos construir la lista **"precios"** usando otras variables definidas anteriormente (en este caso los precios de arroz y azucar, las colocamos dentro de los corchetes).

##### Tamaño de la lista
¿Cuántos elementos tiene la lista? Podemos usar la función **len()**, que nos informa el número de elemento o "longitud" del objeto lista.

In [39]:
len(nombres)

4

In [40]:
len(precios)

4

##### Agregrar más elementos

Supón que queremos agregar el precio de otro producto. Dentro del manejo de listas, fácilmente podemos anexar un nuevo elemento haciendo:

In [41]:
nombres.append("pasta")    # agregamos al final el producto "pasta"
nombres

['azucar', 'arroz', 'harina', 'aceite', 'pasta']

In [42]:
precios.append(11000)      # agregamos al final el precio 11000
precios

[9000.0, 9850.5, 12000, 18000, 11000]

La función **append()**, usada después del punto, colocará el nuevo elemento al final de la lista. En la consola de Pyhton, podemos presionar la tecla "tab" o tabulador despues del punto al final del nombre de variable, en este caso *lista*, esto nos dará las opciones de funciones que podemos aplicar sobre el objeto.

En el terminal de Python en linux, las opciones se desplegan como muestra la imagen siguiente.

![Autocompletado en el terminal](images/011-listatab.png)

En los cuadernos de Jupyter se puede hacer uso de la misma funcionalidad:

![Autocompletado en el terminal](images/010-listajupyter.png)


Ahora que ya conocemos las listas, aprovechemos de guardar mas información relevante de nuestro productos. Para cada uno tenemos la tienda donde lo compramos, la dirección de la tienda y dos variables para indicar si hay estacionamiento y si el lugar tiene punto de venta:

In [138]:
# ahora construimos la lista con todos los nombres de las tiendas
tiendas = [tienda1, tienda2, tienda3, tienda4]
tiendas

['los chinos de la esquina',
 'supermercado MUNDO',
 'Abasto el rey',
 'la bodega de Juan']

In [104]:
# construimos directamente la lista con las direcciones. En este caso, es una lista de cadenas.
direcciones = ["Avenida 5 CALLe 10", "av 4 calle 25 edif c", 
               "AV LORA CALLE 23", "av Don tulio edif Uno calle 32"]

# variables lógicas que indican False o True dependiendo 
# si hay o no estacionamiento o punto de venta en cada lugar.
estacionamientos = [True, True, False, False]
puntos = [True, False, True, False]

> ¿Se pueden arreglar las direcciones para que esten escritas de manera estándar? Prueba a usar las funciones de cadenas que vimos antes!

##### Ordenar la lista

Una tarea frecuente sobre una lista es ordenar sus elementos. La funcion **sort** los ordena, siempre y cuando sea posible. En la variable "número" almacenamos algunos elementos enteros y aplicamos la función:

In [106]:
numeros = [4,3,1,5,2]
numeros.sort()
numeros

[9000.0, 9850.5, 11000, 12000, 18000]

La función **sort** actúa directamente sobre el mismo objeto, es decir, no hay necesidad de asignar el resultado a otra nueva variable, por eso podemos continuar usando "numeros", que ahora estará ordenado.

De la misma forma podemos ordenar nuestra lista de precios, que por defecto se ordena de menor a mayor:

In [108]:
precios.sort()
precios

[9000.0, 9850.5, 11000, 12000, 18000]

Para ordenarlos de mayor a menor, podemos hacer uso de la opción *reverse* de la función. Si configuramos esta opcíon con *True*, obtendremos el orden descendente de los elementos.

``` python
precios.sort(reverse = True)
```

##### Otras operaciones
Podemos realizar otro tipo de operaciones con las listas. ¿Qué crees que resulte de la siguiente?

In [110]:
lista + numeros

[1, 'hola', 34.66, [1, 2, 3], 1, 2, 3, 4, 5]

El operador '+' permite en este caso concatenar o "pegar" los elementos de ambas listas en una sola, no sumar aritméticamente los elementos.

Ya hemos visto que para acceder a elementos de la lista, usamos los corchetes y el índice que indica la posición del elemento.

In [112]:
precios[2] , nombres[2]

(11000, 'harina')

Un detalle útil es que los índices negativos permiten acceder desde el último elemento de la lista. De manera que -1 indica "la primera posición desde el final", -2 indica el penúltimo, y así sucesivamente.

In [114]:
precios[-1], nombres[-1]

(18000, 'pasta')

##### Subselección de listas

Si queremos acceder a una subsección de los datos, podemos acceder a ellos de la misma manera en que accedíamos al texto de cadenas de caracteres:

In [115]:
print(precios[1:3])  # desde la posición 1 hasta la 3 (es decir desde el segundo elemento hasta el cuarto)
print(precios[2:4])  
print(precios[:4])   # desde la posición inicial hasta la posición 4
print(precios[3:])   # desde la posición 3 hasta la posición final

[9850.5, 11000]
[11000, 12000]
[9000.0, 9850.5, 11000, 12000]
[12000, 18000]


Podemos acceder de maneras mas específica, haciendo uso de un índice adicional:

In [118]:
items = list(range(30))    # lista de elementos del 0 al 29
items[3:len(items):2]      # subsección de la lista, desde la posición 3 hasta el final de la lista

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28]

El primer y segundo índice indican el inicio y el final de la subsección que queremos extraer (en este caso usamos la longitud completa de la lista). El último índice indica "el paso", es decir: cada cuántas posiciones del recorrido se escogerán los elementos, que en este caso es de dos en dos.

#### Tuplas 
***
Agrupemos ahora algunos otros elementos:

In [43]:
t = (1, 2, 4, 5)
t

(1, 2, 4, 5)

In [44]:
s = {6, 7, 8, 9}
s

{6, 7, 8, 9}


Además de las listas, tenemos estos conjuntos de datos. ¿Cuál es la diferencia entre ellos?

La sucesión de números en **t** la creamos usando paréntesis, lo que indica una estructura de datos llamada **tupla**. Mientras que las llaves en la variable **s**, definen un **conjunto (set)**.

El acceso a los elementos de una **tupla** es similar al de las listas, la diferencia importante entre las tuplas y las listas está en que las primeras son inmutables, es decir una vez creadas, no se puede cambiar ni sus elementos ni su tamaño. También pueden crearse sin necesidad de usar los paréntesis:

In [45]:
t1 = 1, 2, 3, 4    # tupla creada sin paréntesis
len(t1)     # podemos aplicar funciones sobre ella

4

In [46]:
t1[0]     # y acceder a sus elementos mediante índices, al igual que las listas

1

In [47]:
t1[2] = 5    # la sobreescritura o modificación de elementos no está definida para las tuplas

TypeError: 'tuple' object does not support item assignment

Al intentar asignarle un nuevo valor a la posición 2 de la tupla, se genera un error informándonos que no puede aceptar asignación de nuevos elementos, por el tipo de estructura definida.

#### Conjuntos (sets)
***

La variable **s**, al igual que las tuplas y listas, almacena elementos, pero en este caso elementos **sin orden** y **únicos**. Tal como el concepto matemático de conjuntos (set).


In [120]:
s = {1,2,3,4,4}     # creación de un conjunto, con llaves
s

{1, 2, 3, 4}

Nota que a pesar de que repetimos el número 4 al crear el set, automáticamente toma **sólo una vez** el elemento. Las operaciones matemáticas definidas sobre conjuntos también se pueden aplicar dentro de Python, con las funciones de unión, intersección, diferencia, entre otras.

Supón que compraste ciertos artículos, y tu amigo compró algunos otros. Cuando comparamos ambas compras, podemos unirlas, o ver qué cosas distintas compraron:

In [50]:
mi_compra = {"arroz", "harina", "azucar", "papas"}    
su_compra = {"papas", "zanahorias", "harina", "aceite"}
mi_compra.union(su_compra)    # todos los artículos tuyos y de tu amigo (sin repetición)

{'aceite', 'arroz', 'azucar', 'harina', 'papas', 'zanahorias'}

In [51]:
mi_compra.intersection(su_compra)  # cosas que compraron en común

{'harina', 'papas'}

También se pueden utilizar estas funciones por medio de los operadores **&** y **|**, para intersección y unión, respectivamente, obteniendo el mismo resultado:

In [52]:
mi_compra | su_compra   # unión con el operador |

{'aceite', 'arroz', 'azucar', 'harina', 'papas', 'zanahorias'}

In [53]:
mi_compra & su_compra   # intersección con el operador &

{'harina', 'papas'}

Podemos averiguar cuáles artículos están en tu compra y obviar los que tienes en común con tu amigo. Es decir, qué artículos tuyos son diferentes de los de tu amigo. Para ello calculamos la diferencia de conjuntos:

In [54]:
# Diferencias o restas de conjuntos
mi_compra - su_compra     # uso del operador - 

{'arroz', 'azucar'}

In [55]:
su_compra - mi_compra

{'aceite', 'zanahorias'}

Nota que en este caso la "resta" o diferencia no es conmutativa, es decir, $a-b \neq b-a$. Observa el resultado de las diferencias entre las compras tuyas y de tu amigo para comprobar. Esta operación también tiene una función explícita equivalente: **difference()**.

In [134]:
mi_compra.difference(su_compra)   # uso de función explícita

{'arroz', 'azucar'}

Para averiguar cuáles son los artículos de ambos mercados sin tomar en cuenta los que están repetidos, hacemos una diferencia simétrica de conjuntos. En Python se puede usar el operador **^** o la función **symetric_difference()**.

In [56]:
# Diferencia simétrica
mi_compra ^ su_compra

{'aceite', 'arroz', 'azucar', 'zanahorias'}

In [57]:
mi_compra.symmetric_difference(su_compra)

{'aceite', 'arroz', 'azucar', 'zanahorias'}

In [58]:
su_compra ^ mi_compra    # como es una operación simétrica, el orden de los factores no interesa

{'aceite', 'arroz', 'azucar', 'zanahorias'}

#### Diccionarios
***
Volviendo a la lista de precios de nuestros productos, construimos un contenedor con los datos que tenemos:

In [143]:
productos = {'azucar':9000.0, 'arroz':9850.5, 'harina':11000, 'aceite':12000, 'pasta':18000}
productos

{'aceite': 12000,
 'arroz': 9850.5,
 'azucar': 9000.0,
 'harina': 11000,
 'pasta': 18000}

Esta conveniente estructura de datos es llamada "diccionario" y almacena valores con sus respectivos nombres o "claves". Se crean como un **set o conjunto**, con pares **clave-valor** separados por comas. Los dos puntos separan la clave de su valor, respectivamente.

La extracción o acceso a los valores se logra a través de las claves de cada elemento, entonces si queremos saber cuál es el precio del azucar, escribimos:

In [144]:
productos["azucar"]

9000.0

De la misma manera podemos cambiar los valores, y agregar nuevos pares clave-valor. 

In [151]:
productos['azucar'] = 9500   # modifica el valor existente de "azucar"
productos['caraotas'] = 8000  # agrega un nuevo elemento clave:valor

Nota que también podemos usar comillas simples para el texto y funciona igualmente. En la última línea acabamos de incluir un nuevo producto junto con su precio:

In [152]:
productos

{'aceite': 12000,
 'arroz': 9850.5,
 'azucar': 9500,
 'caraotas': 8000,
 'harina': 11000,
 'pasta': 18000}

Esta estructura no toma en cuenta el orden de los elementos, lo que aumenta la eficiencia para manipular y realizar búsquedas dentro del diccionario. Si queremos verificar que uno producto está o no en nuestra compra, podemos utilizar el operador **in**. ¿Está azucar "en" (**in**) el diccionario "productos"?


In [149]:
"azucar" in productos

True

¿Has comprado aceite?

In [150]:
"aceite" in productos

True

Análogamente se puede usar el operador **```not in```**:

In [155]:
"pan" not in productos   # resulta en True porque pan no está en la lista

True

## Sesión b 
   
### Estructuras de control: Condicionales if-else  (Si-Entonces)
***

Las instrucciones condicionales ayudan a construir secciones de código dependiente de valores y estados de otras variables. De esta manera puede tenerse más control de flujo de ejecución de los programas. La estructura más básica y conocida permite verificar una condición y actuar de acuerdo al resultado, con instrucciones del tipo:

```
    Si el azucar cuesta más de 9000bs, 
        decir que es cara,
    Si no, si el azucar cuesta menos de 9000bs pero más de 7000bs, 
        decir que está bien,
    Si no, si el azucar cuesta menos de 7000, 
        decir que está muy barata.
```
Lo que se traduce en código de python como:

``` python
if azucar > 9000:
    print("Es cara!")
elif azucar >= 9000:
    print("Está bien...")
else:
    print("Está muy barata!")
```

Dentro de estas condiciones también podemos modificar valores de otras variables, crear otras nuevas, e incluir cualquier otro tipo de instrucción que se quiera ejecutar. Hay que tener siempre presente que cada bloque de código para cada **if**, debe empezar después de los dos puntos (:).

La sentencia **elif** es una contracción de la instrucción **else if** que es común en otros lenguajes de programación, y equivale al condicional "si no". La sentencia **else** es utilizada opcionalmente, usualmente al final del bloque, para tomar en cuenta el resto de las opciones que no cubren los *elif* previos.

Si queremos tomar la decisión de volver o no al sitio donde compramos los productos, podemos verificar ciertas condiciones en nuestro programa. Supongamos que nuestro regreso depende de la disponibilidad de estacionamiento y del punto de venta:

In [59]:
est = False              # False si no tiene estacionamiento, True si tiene.
pto = True               # False si no tiene punto de venta, True si tiene.

if est & pto:          # Si tiene estacionamiento y punto (ambos)
    print("Excelente!")
elif not(est) & pto:   # Si no tiene estacionamiento y si tiene punto
    print("Bien..")
elif est & ~pto:       # Si tiene estacionamiento y no punto
    print("Ehh bueno")
else:                  # La ultima opción posible: no tiene estacionamiento ni punto
    print ("No!")

Bien..


Aquí volvemos a hacer uso del operador lógico **&**. Además usamos el operador unitario **~** que significa la negación del elemento al que precede, igual que el uso de **not**. Combinando distintas sentencias condicionales como estás podemos construir bloques de código que controlen la ejecución de nuestros programas.

### Bucles *for*
***

Los bucles **for** son una forma de automatizar tareas repetitivas dentro del código. Por ejemplo, si quieres listar todos los productos que has comprado, podrías escribir secuencialmente:

In [157]:
print(productos["azucar"])
print(productos["arroz"])
print(productos["harina"])

9500
9850.5
11000


¿Pero qué pasa si son 10, 20, 100 o más productos? Mas aun, ¿si no sabes exactamente cuántos son y no recuerdas todos los nombres? Con un bucle **for** puedes automatizar este proceso:

In [160]:
# Recorriendo una lista
print("Lista de precios ", precios)
# Para cada item "i" en la variable "precios", imprimir el item.
for i in precios:
    print(i)

Lista de precios  [9000.0, 9850.5, 11000, 12000, 18000]
9000.0
9850.5
11000
12000
18000


In [159]:
# Recorriendo elementos de un diccionario
# Para cada item "i" en la variable "productos", imprimir el item.
for i in productos:
    print(i)

azucar
arroz
harina
aceite
pasta
caraotas


In [158]:
# Recorriendo valores de una lista
# Para cada item "i" en la los valores del diccionario "productos", imprimir el item.
for i in productos.values():
    print(i)

9500
9850.5
11000
12000
18000
8000


La variable **i** recorre los elementos en *productos*, que puede ser una lista o un iterador de Python. La sintaxis simple de Python permite poder leer explicitamente la instrucción, incluso en lenguaje natural podriamos decir:  

    Para cada elemento "i" en la variable "productos":
       imprimir(i)

Debe usarse con cuidado, asegurándose que el bucle no se ejecute en un tiempo o un número de iteraciones infinitas, afectando el rendimiento del código o agotando los recursos de tu computadora.

Los objetos iterables en Python pueden ser desde una lista, hasta un diccionario, como en nuestro ejemplo. Pero también hay herramientas especiales como el objeto **range** (rango). Estos iteradores son utilizados frecuentemente en la construcción de bucles **for**.

In [64]:
range(10)

range(0, 10)

Esta instrucción genera un objeto iterador que va de 0 hasta 9 (10 iteraciones). En python 2, produce una lista con los elementos a iterar, mientras que en Python 3 produce un objeto iterable.

In [163]:
range(5, 20)

range(5, 20)

In [60]:
list(range(5,20))    # De esta forma podemos ver la lista que genera el iterador

[5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

El siguiente bloque de código indica si cada número entre 0 y 9 es par o impar, recorriendo cada elemento del rango.

In [61]:
for x in range(10):    # para cada x del rango 0-9
    if x % 2 == 0:     # si el resto de la división x/2  es 0
        print(x, "es par")
    else:              # si no es 0
        print(x, "es impar")

0 es par
1 es impar
2 es par
3 es impar
4 es par
5 es impar
6 es par
7 es impar
8 es par
9 es impar


### Bucles *while*
***

El bucle **while** actúa de forma similar al **for**. La diferencia principal es que se ejecuta hasta que cierta condición lógica sea cumplida.

In [166]:
x = 0              # establecemos un valor inicial a la variable que usaremos para iterar
while x < 10:      # el bucle se ejecutará siempre y cuando x sea menor que 10
    if x % 2 == 0:
        print(x, "es par")
    else:
        print(x, "es impar")
    x += 1         # incrementamos manualmente el valor de x para continuar con la ejecución

0 es par
1 es impar
2 es par
3 es impar
4 es par
5 es impar
6 es par
7 es impar
8 es par
9 es impar


#### Instrucciones *break, continue* y *finally*
***
Los bucles que hemos visto pueden mejorarse usando estas instrucciones para ganar mas control sobre el flujo de ejecución.

+ La instrucción **break** permite detener la ejecución de los bucles **for** y **while**.
+ La instrucción **continue** permite saltar la ejecución restante del bucle actual y continuar a la siguiente.


In [8]:
for n in range(20): # para cada n del rango 0-19
    if n % 2 == 0:  # si n es par
        continue    # no ejecuta el resto de las instrucciones a partir de aquí. Continúa la proixma iteración
    print(n)

1
3
5
7
9
11
13
15
17
19


En este trozo de código, cuando **n** es un número par, entonces se salta el resto de las instrucciones, en este caso **print(n)**, y ejecuta la siguiente iteración, dando como resultado que sólo se impriman los números impares.

Por ejemplo, si de nuestra lista de productos queremos listar solamente los que cuesten menos de 9000bs, podemos adaptar el código anterior:

In [167]:
for i in productos:    # recorre todos los elementos del diccionario "productos"
    if productos[i] >= 9000:  # si el valor del elemento "i" es mayor o igual que 9000
        continue              # interrumpe el bucle y continua a la siguiente iteración (no imprime)
    print(i)

caraotas


El código siguiente imprime una sucesión de [fibonnacci](https://es.wikipedia.org/wiki/Sucesión_de_Fibonacci). Es importante ver que el bucle **while**, dada la condición que especificamos (*True*), se ejecutará infinitamente a menos que le coloquemos la instrucción **break** dentro del bloque.

In [168]:
a, b = 0,1     # primeros dos valores de la secuencia
maximo = 100   # el tope que queremos para el fibonacci
lista = []     # lista vacía para almacenar los elementos

while True:    # se ejecutará infinitamente a menos que interrumpamos el bucle internamente
    (a, b) = (b, a+b) 
    if a > maximo:    # se interrumpe cuando el número llega al tope que especificamos
        break
    lista.append(a)   # inserta cada elemento en la lista

print(lista)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]


### Comprensión de listas, tuplas y diccionarios
***

Existe una manera de comprimir los bucles para construir o hacer operaciones sobre objetos como listas. Supón que quieres generar una secuencia de números y guardarlos en una lista. Pensarías de inmediato en usar un bucle como:

In [14]:
lista = []  # lista vacia
for i in range(12):  # para i desde 0 hasta 11
    lista.append(i)
print(lista)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]


Con la instrucción siguiente reducimos a una sóla línea nuestro código:

In [13]:
[i for i in range(12)]

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

Esta construcción es llamada **comprensión de listas**, y genera el mismo resultado que nuestro código anterior. La instrucción está contenida entre corchetes [,], lo que indica que generaremos una lista. Cada elemento de la lista tendrá el contenido de la variable **i** según la iteración. Este valor esta enlazado con el bucle **for** que le sigue, como un *for* usual.
```
[toma el elemento i de cada i en el rango 0-11]
```
En una comprensión de listas podemos tener múltiples bucles, además de instrucciones condicionales. Pero debemos tener criterio para no sacrificar la simpleza o entendimiento del código. Presta atención a la siguiente instrucción:

In [16]:
[(x, y) for x in range(3) for y in range(4)]

[(0, 0),
 (0, 1),
 (0, 2),
 (0, 3),
 (1, 0),
 (1, 1),
 (1, 2),
 (1, 3),
 (2, 0),
 (2, 1),
 (2, 2),
 (2, 3)]

En esta única línea, hacemos uso de dos bucles **for**, uno para la variable **x** y otro para **y**, a partir de ellos formamos tuplas **(x,y)**, almacenándolas en una lista.

> ¿Cuál es el código equivalente sin usar comprensión de listas? Intenta escribirlo!

In [170]:
l = []   # lista vacía preparada para almacenar elementos
for x in range(3):  # bucle para la variable x, desde 0 hasta 2
    for y in range(4):  # bucle para la variable y, desde 0 hasta 3
        l.append((x,y))  # llenamos la lista con las tuplas (x,y)
print(l)      # vemos el resultado

[(0, 0), (0, 1), (0, 2), (0, 3), (1, 0), (1, 1), (1, 2), (1, 3), (2, 0), (2, 1), (2, 2), (2, 3)]


Podemos hacer operaciones dentro de la misma instrucción. En el ejemplo anterior podemos usar los valores *x*, *y*, para obtener una lista de sus productos.

In [None]:
[x*y for x in range(3) for y in range(4)]

La utilidad de esta instrucción comprimida se extiende a **sets, tuplas e incluso diccionarios**.

In [171]:
{i for i in range(10)}    # set con elementos del 0 al 9

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

In [172]:
{a % 4 for a in range(100)} # set con los restos posibles de la división entre 4, de los números del 0 al 99.

{0, 1, 2, 3}

Como estamos tratando con conjuntos, sólo se toman valores únicos sin repetición, a pesar de que hay 100 elementos en el rango, la operacion **a % 4** arroja resultados iguales para distintos números (se descartan los repetidos).

Para crear una comprensión de diccionario, solo agregamos los dos puntos necesarios para separar las claves de los valores al inicio:

In [173]:
{n:n*1000 for n in range(10)}  # Crea los pares clave:valor con n:n*1000 tomando n del rango 0-9

{0: 0,
 1: 1000,
 2: 2000,
 3: 3000,
 4: 4000,
 5: 5000,
 6: 6000,
 7: 7000,
 8: 8000,
 9: 9000}

Como ya tenemos la lista de precios y la lista de nombres de nuestros productos, podemos usar la comprensión de diccionario para crearlo de forma más directa:

In [176]:
{n: p for n, p in zip(nombres,precios)}

{'aceite': 12000,
 'arroz': 9850.5,
 'azucar': 9000.0,
 'harina': 11000,
 'pasta': 18000}

En la instrucción anterior, usamos la función **zip** para indicar que queremos tomar valores simultáneos por pares, en este caso de *n* y *p*. De esta manera construimos el diccionario con los productos y sus respectivos precios.

Dentro de la comprensión de listas, podemos incluso usar instrucciones condicionales para construir nuestros valores. Una instrucción de la forma:

In [25]:
l = []
for i in range(30):
    if i % 3:          # descarta los múltiplos de 3 
        l.append(i)
l

[1, 2, 4, 5, 7, 8, 10, 11, 13, 14, 16, 17, 19, 20, 22, 23, 25, 26, 28, 29]

Puede comprimirse en la instrucción:

In [177]:
[i for i in range(30) if  i % 3]  # la condición para el *for* se coloca después de éste, 
                                  # tal como un bucle usual.

[1, 2, 4, 5, 7, 8, 10, 11, 13, 14, 16, 17, 19, 20, 22, 23, 25, 26, 28, 29]

Podemos construir comprensiones de listas más complejas como la siguiente:

In [29]:
[i if i % 2 else -i
    for i in range(20) if i % 3]

[1, -2, -4, 5, 7, -8, -10, 11, 13, -14, -16, 17, 19]

Esta instrucción usa condicionales tanto dentro del bucle como en la construcción de la variable **i**. En la parte inicial se coloca **i** en la lista si es par, si no es par, se coloca **i** negativo.
```
   [i if i % 2 else -i ....
```
Se puede escribir como:

```python
    if i % 2:
        i
    else:
        -i
```
En la segunda parte, **i** se selecciona del rango 0-19 sólo si es divisible entre 3 (la última condición en la instrucción). 

``` python
    for i in range(20):
        if i % 3:
            i
```

El elemento **i** que devuelve esta condición dentro del **for** es el que es utilizado luego por las instrucciones condicionales anteriores. Finalmente la lista es una secuencia de números divisibles por 3, de los cuales se niegan los que sean divisibles por 2.

La siguiente instrucción aplica la misma idea de comprensión de listas, pero esta vez a los diccionarios:

In [178]:
{n: p for n, p in zip(nombres,precios) if p <= 9000}

{'azucar': 9000.0}

Aqui creamos el diccionario con los pares **` nombre:precio `**, pero filtrando sólo los productos que cuesten 9000bs o menos. Suponiendo que realmente tengamos una lista inmensa de las compras de varios meses o un año, este tipo de filtrado condicional resulta obviamente útil. Si consideramos la instrucción por partes podemos comprender mejor su funcionamiento:

``` python
{nombre: precio                  # crea el par clave:valor
 for nombre, precio in zip(n,p)  # para los valores "nombre y precio" que están en las listas n y p.
 if precio <= 9000}              # pero sólo si el precio 9mil o menos.
```

### Paquetes y módulos
***

Ya hemos utilizado anteriormente varios métodos o funciones para manipular objetos de varios tipos, como listas, cadenas, conjuntos. Estás funciones vienen por defecto listas para usar en Python. Pero además, Python contiene muchas más librerías estándar integradas con variadas funcionalidades. Para usar estas librerías, utilizamos la sentencia **import**:

In [32]:
import math

El módulo **math** incluye funciones para cálculo matemático más allá de sólo sumas y restas. Por ejemplo, el cálculo de raíces cuadradas, o encontrar valores de funciones trigonométricas.

In [33]:
math.cos(1)

0.5403023058681398

Usamos el nombre del módulo seguido de un punto, y luego el objeto o función del módulo que queremos utilizar. En este caso, **cos()** es una función que recibe un valor para encontrar su coseno. Podemos utilizar constantes matemáticas como **pi** o **e**, de la misma manera.

In [34]:
math.pi

3.141592653589793

Otra forma de importar estos módulos es por medio de un alias. Algunos módulos tienen nombre largos que harían el código mas engorroso. Para ellos podemos escribir:
```python
import modulo as alias
```
De esta manera podemos usar "alias" como la abreviación del nombre del módulo, con todas sus funcionalidades.

In [35]:
import math as m
m.pi

3.141592653589793

Una costumbre generalizada es utilizar el módulo **numpy** (módulo con herramientas numéricas utilizado comummente en ciencia de datos), con el alias **np**.

In [None]:
import numpy as np
np.cos(np.pi)

Puede que queramos sólo utilizar cierto contenido específico de un módulo, en ese caso indicamos explícitamente tales contenidos de la siguiente forma:

In [36]:
from math import cos, pi

Desde el módulo *math*, importa *cos* y *pi*. Es fácil de comprender la lógica de esta importación explícita y específica.

In [None]:
from math import *

En este caso estamos importando TODO el contenido del módulo **math** dentro del espacio de trabajo de Python. Esta instrucción debe ser usada con precaución, porque puede resultar en la sobreescritura de algunas funciones que tengan el mismo nombre y que hayan sido cargadas en el mismo espacio de trabajo anteriormente.

Por ejemplo, si el módulo **numpy** contiene una funcion *suma*, y ya existe una función llamada *suma* dentro del espacio, al importar con asterisco (\*) reescribiríamos la segunda, causando posibles conflictos o resultados no deseados en nuestro programa.

Lo más recomendable es importar y usar el módulo explícitamente, sin alias o con alias, como en los primeros ejemplos.

#### Librerias Estándar 

Las siguiente son librerías estándar importantes incluidas en python:


+ **os y sys**: Contiene herramientas para interactuar con el sistema operativo, como manejar archivos y directorios y ejecutar comando en el terminal.
+ **math y cmath**: Funciones y operaciones matemáticas sobre números reales y complejos.
+ **itertools**: Para construir y manejar interadores y generadores.
+ **functools**: Asistencia para programación funcional.
+ **random**: Para generar números pseudo aleatorios.
+ **pickle**: Herramientas para guardar y cargar objetos desde el disco duro.
+ **json y csv**: Para leer archivos .csv y JSON.
+ **urllib**: Herramientas para hacer solicitudes Http u otras modalidades web.

***
| [Atrás](Módulo I - Introducción a Python.ipynb) | [Inicio](Introducción - Contenido.ipynb) | [Siguiente](Módulo III - Funciones, lectura y escritura de archivos.ipynb)