# Control flow

- En Python la indentación se utiliza para marcar los bloques.
- Por eso, los espacios son importantes.
- Hace el código más leíble.
- Se usan cuatro espacios por nivel de anidado.
- Los editores se configuran para que el tabulador sean 4 espacios (Jupyter por defecto).

## Conditionals

### If

In [4]:
a = 3
if a > 2:
    print('correcto')

correcto


### else

In [6]:
a = 2
if a > 2:
    print('correcto')
else:
    print('incorrecto')

incorrector


### elif

In [7]:
a = 3
if a > 5:
    print('correcto')
elif a > 2:
    print('estamos en el elif')
else:
    print('incorrector')

estamos en el elif


- Podemos anidar condicionales (en general, las anidaciones se intentan evitar)

In [8]:
a = 5
b = 10
if a > 2:
    if b < 5:
        print(1)
    else:
        print(2)
else:
    print(3)

2


## Loops

- Para iterar sobre un conjunto de enteros usamos la función `range()`

In [1]:
total = 0
for i in range(5):
    total += i # Le suma cada vez a la variable el número i
total

10

- Podemos iterar sobre listas

In [2]:
list_names = ['Juan', 'Fer', 'Paco']
for item in list_names:
    print(item)

Juan
Fer
Paco


In [11]:
list_of_lists = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
for list_ in list_of_lists:
    print(list_)

[1, 2, 3]
[4, 5, 6]
[7, 8, 9]


- Unpacking del iterador

In [12]:
list_of_lists = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
for a, b, c in list_of_lists:
    print(a)

1
4
7


- También se pueden anidar los bucles `for` (se intenta evitar).
- Existen muchas funciones para ayudar en la iteración.
- Por ejemplo: `enumerate()`, `zip()`, `sorted()`, `reversed()`

- `enumerate()` 

In [13]:
# Crea una lista enumerada del bucle y ojo que no devuelve una lista, 
# devuelve un objeto, con un iterador (no está almacenado en ningún sitio)
lista = ['lluvia', 'sol', 'niebla']
for i, name in enumerate(lista):
    print(f"Número {i}: {name}")

Número 0: lluvia
Número 1: sol
Número 2: niebla


- `zip()` 

In [18]:
# Unir como si fuera una cremallera
lista = ['lluvia', 'sol', 'niebla']
lista_dias = ['ayer', 'hoy', 'mañana']
for dia, tiempo in zip(lista_dias, lista):
    print(f"Día {dia}: {tiempo}")

Día ayer: lluvia
Día hoy: sol
Día mañana: niebla


In [15]:
a = zip(lista_dias, lista)

In [16]:
type(a)

zip

In [17]:
b = list(a)
b

[('ayer', 'lluvia'), ('hoy', 'sol'), ('mañana', 'niebla')]

- Para deshacer la operación, se hace también con `zip()`

In [14]:
a

<zip at 0x1e52b06cfc8>

In [15]:
lista_1, lista_2 = list(zip(*b))

In [16]:
lista_1

('ayer', 'hoy', 'mañana')

In [17]:
lista_2

('lluvia', 'sol', 'niebla')

## While

In [18]:
# No se suele usar mucho
i = 1
while i < 3:
    print(i)
    i = i + 1
print('Bye')

1
2
Bye


## Break

- Podemos terminar un bucle si se da cierta condición

In [19]:
# Imprime todos los números hasta el 7
for i in range(100):
    print(i)
    if i >= 7:
        break

0
1
2
3
4
5
6
7


In [20]:
# Ojo, diferencia
for i in range(100):
    if i >= 7:
        break
    print(i)
    

0
1
2
3
4
5
6


## Continue
- Continúa con el bucle, pero la iteración actual no se termina.

In [21]:
for i in range(10):
    if i > 4:
        print("Ignored", i)
        continue
    print("Processed", i)

Processed 0
Processed 1
Processed 2
Processed 3
Processed 4
Ignored 5
Ignored 6
Ignored 7
Ignored 8
Ignored 9


## map, filter, reduce

- El objteivo de los bucles en la mayoría de los casos es uno de los siguientes:
    - `map` -> aplicar una transformación a una serie de valores y almacenar el resultado
    - `filter` -> filtrar elementos aplicando condicionales
    - `reduce` -> realizar una operación de agregación (asociativa y conmutativa)
- Estas funciones:
    - Son más eficientes
    - Mejoran la legibilidad del código
    - Son los pilares del paradigma de computación de **Spark**

In [23]:
import math

- Calcular el seno de los números del 1 al 100

Podemos hacerlo con un bucle for

In [24]:
lista = []
for i in range(10+1):
    lista.append(math.sin(i))
lista

[0.0,
 0.8414709848078965,
 0.9092974268256817,
 0.1411200080598672,
 -0.7568024953079282,
 -0.9589242746631385,
 -0.27941549819892586,
 0.6569865987187891,
 0.9893582466233818,
 0.4121184852417566,
 -0.5440211108893699]

O directamente con la función `map()`

In [31]:
lista_map = map(math.sin, range(10+1)) #Calcular el seño de todos estos número

In [32]:
lista_map

<map at 0x10dfb4438>

In [26]:
lista_map_l = list(lista_map) #se hace una lista para recoger estos valores de map

In [33]:
list(lista_map) #Sale vacío porque map es un iterador

[0.0,
 0.8414709848078965,
 0.9092974268256817,
 0.1411200080598672,
 -0.7568024953079282,
 -0.9589242746631385,
 -0.27941549819892586,
 0.6569865987187891,
 0.9893582466233818,
 0.4121184852417566,
 -0.5440211108893699]

In [28]:
lista_map_l #Cuando se crea la lista es cuando se calcula, por eso aquí si funciona.

[0.0,
 0.8414709848078965,
 0.9092974268256817,
 0.1411200080598672,
 -0.7568024953079282,
 -0.9589242746631385,
 -0.27941549819892586,
 0.6569865987187891,
 0.9893582466233818,
 0.4121184852417566,
 -0.5440211108893699]

In [34]:
dir(lista_map)

['__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__ne__',
 '__new__',
 '__next__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

In [35]:
lista == lista_map_l

True

- Calcular el logaritmo de los números divisibles por 7 hasta 100

Con un bucle `for` y un `if`

In [40]:
lista = []
for i in range(1, 100+1):
    if i%7 == 0:
        lista.append(math.log(i))
lista

[1.9459101490553132,
 2.6390573296152584,
 3.044522437723423,
 3.332204510175204,
 3.5553480614894135,
 3.7376696182833684,
 3.8918202981106265,
 4.02535169073515,
 4.143134726391533,
 4.248495242049359,
 4.343805421853684,
 4.430816798843313,
 4.51085950651685,
 4.584967478670572]

Usando `filter()` y `map()`

In [38]:
lista_f = filter(lambda x: x%7==0, range(1, 100+1)) #Para filtrar ciertos valores
lista_map = map(math.log, lista_f)
lista_map_list = list(lista_map)
lista_map_list

[1.9459101490553132,
 2.6390573296152584,
 3.044522437723423,
 3.332204510175204,
 3.5553480614894135,
 3.7376696182833684,
 3.8918202981106265,
 4.02535169073515,
 4.143134726391533,
 4.248495242049359,
 4.343805421853684,
 4.430816798843313,
 4.51085950651685,
 4.584967478670572]

In [39]:
lista == lista_map_list

False

- Calcular la tangente de los números divisibles por 13 hasta 100 y sumar el resultaod total

Con dos bucles `for`, un `if` y almacenando el resultado

In [61]:
lista = []
for i in range(100):
    if i%13 == 0:
        lista.append(math.tan(i))
resultado = sum(lista)

Usando `filter()`, `map()` y `reduce()`

In [62]:
from functools import reduce

In [63]:
lista_f = filter(lambda x: x%13 == 0, range(100))
lista_map = map(math.tan, lista_f)
resultado_reduce = reduce(lambda a, b: a + b, lista_map)

In [64]:
resultado_reduce

-2.9727494166581927

In [65]:
resultado == resultado_reduce

True

- Comparemos la eficiencia en tiempo

In [47]:
%%timeit
lista = []
for i in range(10**6):
    if i%13 == 0:
        lista.append(math.tan(i))
resultado = sum(lista)

55.4 ms ± 1.86 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [48]:
%%timeit
lista_f = filter(lambda x: x%13 == 0, range(10**6))
lista_map = map(math.tan, lista_f)
resultado_reduce = reduce(lambda a, b: a + b, lista_map)

89.8 ms ± 593 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


- No sólo importa la efciencia en tiempo, sino también la eficiencia en espacio

In [49]:
import math

In [50]:
%%time
lista = []
for i in range(10**8):
    if i%2 == 0:
        lista.append(math.tan(i))
resultado = sum(lista)
del(lista)

CPU times: user 15.1 s, sys: 451 ms, total: 15.6 s
Wall time: 15.6 s


In [51]:
import math
from functools import reduce

In [52]:
%%time
lista_f = filter(lambda x: x%2 == 0, range(10**8))
lista_map = map(math.tan, lista_f)
resultado_reduce = reduce(lambda a, b: a + b, lista_map)
#No usa tanta memoria ram, porque hace todo el proceso y cierra y vuelve a hacerlo

CPU times: user 13.8 s, sys: 19.6 ms, total: 13.8 s
Wall time: 13.8 s


### Extra
- Para liberar la memoria RAM podemos eliminar las variables que estemos usando o reiniciar el kernel
- En caso de que ejecutemos el programa directamente desde la línea de comandos, al finalizar se borran todas las variables y se libera la RAM

In [71]:
%%file tmp/test.py #Para ejecutar el fichero hay que usar la barra "/", es olo para MAC
import math
lista = []
for i in range(10**8):
    if i%2 == 0:
        lista.append(math.tan(i))
resultado = sum(lista)

Writing tmp/test.py


- No es el caso si lo ejecutamos desde una celda, ya que en ese caso las variables sí quedan almacenadas en el kernel.

In [72]:
%run tmp/test.py

In [73]:
lista[:5]

[0.0,
 -2.185039863261519,
 1.1578212823495775,
 -0.29100619138474915,
 -6.799711455220378]

In [74]:
%whos

Variable           Type                          Data/Info
----------------------------------------------------------
a                  zip                           <zip object at 0x10dcfd808>
b                  list                          n=3
c                  int                           9
dia                str                           mañana
i                  int                           99999999
item               str                           Paco
list_              list                          n=3
list_names         list                          n=3
list_of_lists      list                          n=3
lista              list                          n=50000000
lista_dias         list                          n=3
lista_f            filter                        <filter object at 0x10df112e8>
lista_map          map                           <map object at 0x10df115f8>
lista_map_l        list                          n=11
lista_map_list     list                          n

In [75]:
%who_ls

['a',
 'b',
 'c',
 'dia',
 'i',
 'item',
 'list_',
 'list_names',
 'list_of_lists',
 'lista',
 'lista_dias',
 'lista_f',
 'lista_map',
 'lista_map_l',
 'lista_map_list',
 'math',
 'name',
 'reduce',
 'resultado',
 'resultado_reduce',
 's',
 'sizes',
 'sys',
 'tiempo',
 'total',
 'var',
 'variables']

In [76]:
import sys #Para ver cuánta memoria usa cada variable
variables = %who_ls
sizes = {var: sys.getsizeof(eval(var)) for var in variables}
for var, s in sizes.items():
    print(f'{s/2**20:12.2f} Mb -> {var}')

        0.00 Mb -> a
        0.00 Mb -> b
        0.00 Mb -> c
        0.00 Mb -> dia
        0.00 Mb -> i
        0.00 Mb -> item
        0.00 Mb -> list_
        0.00 Mb -> list_names
        0.00 Mb -> list_of_lists
      404.43 Mb -> lista
        0.00 Mb -> lista_dias
        0.00 Mb -> lista_f
        0.00 Mb -> lista_map
        0.00 Mb -> lista_map_l
        0.00 Mb -> lista_map_list
        0.00 Mb -> math
        0.00 Mb -> name
        0.00 Mb -> reduce
        0.00 Mb -> resultado
        0.00 Mb -> resultado_reduce
        0.00 Mb -> s
        0.00 Mb -> sizes
        0.00 Mb -> sys
        0.00 Mb -> tiempo
        0.00 Mb -> total
        0.00 Mb -> var
        0.00 Mb -> variables


## Exceptions

- Los errores en Python se generan en forma de excepciones.
- Excepciones -> objetos en los que se incluye tanto el detalle del error, como la pila de llamadas que han generado dicho error.
- Si las excepciones no son capturadas el código terminará su ejecución de forma repentina.
- Hay muchos tipos de excepciones (se pueden consultar [aquí](https://docs.python.org/3/library/exceptions.html#bltin-exceptions))
- También podemos crear nuestras propias excepciones

In [77]:
a = [1, 2, 3]
a[3]

IndexError: list index out of range

In [79]:
 IndexError #Es un objeto

IndexError

- Las excepciones se 'capturan' con los comandos `try`, `except` y `finally`

- Podemos capturar cualquier excepción

In [80]:
try:
    a[3]
except:
    print('No se puede')

No se puede


- O capturar una excepción específica

In [83]:
try:
    a[3]
except IndexError:
    print('No se puede')

No se puede


In [84]:
try:
    a[3]
except NameError:
    print('No se puede')

IndexError: list index out of range

In [85]:
dir(IndexError())

['__cause__',
 '__class__',
 '__context__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setstate__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__suppress_context__',
 '__traceback__',
 'args',
 'with_traceback']

In [86]:
try:
    a[3]
except IndexError as e:
    print(e.args)

('list index out of range',)


- Podemos lanzar excepciones nosotros mismos

In [87]:
count = 0
while True:
    print("Looping")
    count = count + 1
    if count > 3:
        raise Exception("Mi Error")

Looping
Looping
Looping
Looping


Exception: Mi Error

- Las excepciones se propagan hacia arriba, y se pueden capturar en niveles superiores del código

In [88]:
try:
    count = 0
    while True:
        print("Looping")
        count = count + 1
        if count > 3:
            raise Exception("Mi error")
except Exception as e:
    print("Caught exception:", e)

Looping
Looping
Looping
Looping
Caught exception: Mi error


## Tracebacks

- **Tracebacks** -> Pilas de llamadas que se muestran cuando se levanta una excepción
- Interpretar correctamente los tracebacks
- Tomarse un tiempo para leerlos y sobre todo aprender!
- Los tracebacks muestran toda la historia de llamadas que ha ocasionado el error.
    - **Código nuestro**: Parte de esa historia será código que hayamos escrito nosotros.
    - **Código de módulos**: Puede que haya parte de código de los propios módulos que estemos usando en nuestro código.
    - **Código inaccesible**: Cuando usamos módulos que a su vez tienen implementaciones en otros lenguajes como C, a esa parte del código no tendremos acceso desde Python.

In [89]:
import math

In [90]:
math.sqrt(-5)

ValueError: math domain error

In [92]:
import numpy as np
a = np.array([None])
a.var(ddof=1)

  This is separate from the ipykernel package so we can avoid doing imports until


TypeError: unsupported operand type(s) for /: 'NoneType' and 'int'

## Debugger

- Python tiene una herramienta para debuguear código -> `pdb`
- `pdb.set_trace()` -> Línea donde se abrirá el debugger
- Algunos de los comandos más usados son:
    - `l`, `l .` -> Lista la posición donde nos encontramos
    - `ll` -> Muestra el código completo
    - `n` -> Ejecuta la siguiente línea de código
    - `s` -> Ejecuta la siguiene línea metiéndose dentro de las funciones que haya definidas
    - `q` -> Abortar
    - `c` -> Continuar
    - `r` -> Continuar hasta el siguiente return
    - `a` -> Imprime los argumentos de la función actual
    - `retval` -> Imprime el valor devuelto por el último return
    - `unt` -> Ejecuta hasta la línea indicada
    - `p` -> Impime la expresión dada
    - `pp` -> Imprime en bonito la expresión dada
    - `interact` -> Abre un entorno interactivo con el scope global y local

In [1]:
import pdb

In [2]:
def fun(x):
    res = x**2
    return res

In [3]:
lista = []
if not lista:
    pdb.set_trace()
    for i in range(10**5):
        if i%2 == 0:
            lista.append(fun(i))
resultado = sum(lista)
print(resultado)

> <ipython-input-3-cb4ae22272ee>(4)<module>()
-> for i in range(10**5):


(Pdb)  l


  1  	lista = []
  2  	if not lista:
  3  	    pdb.set_trace()
  4  ->	    for i in range(10**5):
  5  	        if i%2 == 0:
  6  	            lista.append(fun(i))
  7  	resultado = sum(lista)
  8  	print(resultado)
[EOF]


(Pdb)  n


> <ipython-input-3-cb4ae22272ee>(5)<module>()
-> if i%2 == 0:


(Pdb)  n


> <ipython-input-3-cb4ae22272ee>(6)<module>()
-> lista.append(fun(i))


(Pdb)  n


> <ipython-input-3-cb4ae22272ee>(4)<module>()
-> for i in range(10**5):


(Pdb)  n


> <ipython-input-3-cb4ae22272ee>(5)<module>()
-> if i%2 == 0:


(Pdb)  n


> <ipython-input-3-cb4ae22272ee>(4)<module>()
-> for i in range(10**5):


(Pdb)  a
(Pdb)  c


166661666700000


- Podemos usar el debugger de IPython `ipdb`
- Se instala de la siguiente forma
    - `conda install -c conda-forge ipdb`
- Igual pero más bonito

In [6]:
conda install -c conda-forge ipdb

Collecting package metadata (current_repodata.json): done
Solving environment: done


  current version: 4.8.0
  latest version: 4.8.1

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /Users/victormac/anaconda3

  added / updated specs:
    - ipdb


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    ca-certificates-2019.11.28 |       hecc5488_0         145 KB  conda-forge
    certifi-2019.11.28         |           py37_0         148 KB  conda-forge
    conda-4.8.0                |           py37_1         3.0 MB  conda-forge
    ipdb-0.12.3                |             py_0          12 KB  conda-forge
    openssl-1.1.1d             |       h0b31af3_0         1.9 MB  conda-forge
    ------------------------------------------------------------
                                           Total:         5.2 MB

The follo

In [8]:
import ipdb

In [9]:
lista = []
if not lista:
    ipdb.set_trace()
    for i in range(10**5):
        if i%2 == 0:
            lista.append(fun(i))
resultado = sum(lista)
print(resultado)

> [0;32m<ipython-input-9-cdf36650fcc6>[0m(4)[0;36m<module>[0;34m()[0m
[0;32m      3 [0;31m    [0mipdb[0m[0;34m.[0m[0mset_trace[0m[0;34m([0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 4 [0;31m    [0;32mfor[0m [0mi[0m [0;32min[0m [0mrange[0m[0;34m([0m[0;36m10[0m[0;34m**[0m[0;36m5[0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      5 [0;31m        [0;32mif[0m [0mi[0m[0;34m%[0m[0;36m2[0m [0;34m==[0m [0;36m0[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m


ipdb>  n


> [0;32m<ipython-input-9-cdf36650fcc6>[0m(5)[0;36m<module>[0;34m()[0m
[0;32m      4 [0;31m    [0;32mfor[0m [0mi[0m [0;32min[0m [0mrange[0m[0;34m([0m[0;36m10[0m[0;34m**[0m[0;36m5[0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 5 [0;31m        [0;32mif[0m [0mi[0m[0;34m%[0m[0;36m2[0m [0;34m==[0m [0;36m0[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      6 [0;31m            [0mlista[0m[0;34m.[0m[0mappend[0m[0;34m([0m[0mfun[0m[0;34m([0m[0mi[0m[0;34m)[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m


ipdb>  q


BdbQuit: 