![logo](../files/misc/logo.png)
<h1 style="color:#872325">Debugging, Profiling and IPython Magics %</h1>

A medida que vamos trabajando con código cada vez más complejo, la probabilidad de erroes lógicos y cuellos de botella en el procesamietno de nuestros datos se incrementa de igual manera.

Python cuenta con varias herramientas para combatir estos tipos de problemas.

## IPython Magics
### `%` & `%%`

Jupyter considera cualquier celda que empiece con `%` o `%%` como una llamada hacia un *magic command*. Un *magic command* nos permite controlar características del sistema y de IPython (dentro de Jupyter).

* Los magics que llamemos con un solo `%` corresponden a *magics* que llamamos en una única línea.
* Los magics que llamemos con dos `%%` corresponden a *magics* que llamamos en más de una línea.

#### Ejemplos de *magics* en una línea

In [1]:
# Print Current Directory (imprime la ruta hacia el directorio actual)
%pwd

'/Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/notas'

In [2]:
# Muestra todos los archivos dentro del directorio actual
%ls

lec01.ipynb  lec02.ipynb  lec03.ipynb  lec04.ipynb  lec05.ipynb  lec06.ipynb


In [3]:
# Nos movemos una carpeta atrás
%cd ..

/Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python


In [4]:
# Nos movemos hacía el directorio 'lec03' dentro de 'files'
%cd files/lec03

/Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/files/lec03


In [7]:
# Regresamos al directorio original
%cd ../../notas

/Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/notas


In [8]:
# Historia de todos los directorios que hemos visitado
%dhist

Directory history (kept in _dh)
0: /Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/notas
1: /Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python
2: /Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/files/lec03
3: /Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/notas


In [10]:
a = 3
var1 = "ML"
var2 = {"SVM", "LSR", "BR"}

In [11]:
# Variables que hemos definido dentro de nuestro espacio de trabajo (workspace)
%whos

Variable   Type    Data/Info
----------------------------
a          int     3
var1       str     ML
var2       set     {'SVM', 'LSR', 'BR'}


In [35]:
# Cargando un archivo de python local
%load ../files/lec03/function.py

'Soy una función dentro de archivo'

In [None]:
# Cargando un archivo que vive en la web
%load https://raw.githubusercontent.com/analysic-nabla/intermediate-python/master/files/lec03/load_me.txt

In [5]:
%quickref

In [6]:
import numpy as np

In [11]:
%psearch np.*me*

In [36]:
np.*me*?

In [37]:
1e100 * 2.1238234

2.1238234e+100

In [38]:
%precision 3
1e100 * 2.1238234

21238234000000001227338981530055795475666928490322715591362343458540113850722415288885155338328735744.000

#### Ejemplos de *magics* en más de una línea

In [44]:
%%bash
# Unicamente para Unix / Linux
for f in ../*
do echo $f
done

../README.md
../files
../notas
../solutions


In [41]:
%%time
N = 10_000_000
sum(i**2 for i in range(N)) / N

CPU times: user 2.7 s, sys: 3.98 ms, total: 2.7 s
Wall time: 2.7 s


In [45]:
%%writefile function.py
def greeting(name):
    return f"Hola, {name}!"

Writing function.py


## `pdb` / `ipdb`

El módulo `pdb` (Python Debugger) define un *debugger* interactivo para programas en python. Este tipo de herramientas nos ayudan a analizar nuestro código y poder detectar más facilmente los errores de nuestros programas.

* `ipdb` es el `pdb` de IPython 

In [239]:
import ipdb

Una vez importado, hacemos uso de `pdb` dentro de un programa con `pdb.set_trace()`. Esta función pausa el programa en la línea deseada e inicia el debugger.

**Comandos de navegación PDB** ([fuente](https://web.stanford.edu/class/physics91si/2013/handouts/Pdb_Commands.pdf))

* `(l)ist`: muestra 11 líneas alrededor de la línea actual
* `(w)here`: muestra el archivo y la línea actual del programa
* `(n)ext`: ejecuta la línea actual
* `(s)tep`: ingresa a la función dentro de la línea actual
* `(r)eturn`: (dentro de una función), corre el progama hasta encontrar el `return` de la función actual
* `(c)ontinue`: corre el programa hasta encontrar un *trace* o *breakpoint*

In [248]:
values = []
for i in range(10):
    if i % 2 == 0:
        ipdb.set_trace() # <--- Selección de un "breakpoint"
        values.append(i ** 2)

> [0;32m<ipython-input-248-545381b527ae>[0m(5)[0;36m<module>[0;34m()[0m
[0;32m      3 [0;31m    [0;32mif[0m [0mi[0m [0;34m%[0m [0;36m2[0m [0;34m==[0m [0;36m0[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      4 [0;31m        [0mipdb[0m[0;34m.[0m[0mset_trace[0m[0;34m([0m[0;34m)[0m [0;31m# <--- Selección de un "breakpoint"[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 5 [0;31m        [0mvalues[0m[0;34m.[0m[0mappend[0m[0;34m([0m[0mi[0m [0;34m**[0m [0;36m2[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m
ipdb> print("'l' nos muestra en dónde estamos parados en el programa")
'l' nos muestra en dónde estamos parados en el programa
ipdb> l
[1;32m      1 [0m[0mvalues[0m [0;34m=[0m [0;34m[[0m[0;34m][0m[0;34m[0m[0;34m[0m[0m
[1;32m      2 [0m[0;32mfor[0m [0mi[0m [0;32min[0m [0mrange[0m[0;34m([0m[0;36m10[0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[1;32m      3 [0m    [0;32mif[0m [0mi[0m [0;34m%[0m [0

BdbQuit: 

### Debugging de un archivo desde Jupyter

En ocasiones queremos corregir errores o simplemente entender el código dentro de un archivo.

<h2 style="color:teal">Ejemplo</h2>

Un número entero positivo es conocido como un número de Amstrong de orden $n$ si

$$
    \alpha_1\alpha_2\ldots\alpha_n = \sum_{i=1}^n \alpha_i^n = \alpha_1 ^ n + \alpha_2 ^ n + \ldots + \alpha_n ^ n
$$

Por ejemplo, el número 153 es un número de Amstrong de orden 3 ya que $153 = 1^3 + 5 ^3  + 3 ^ 3$

Se quiere escribir un programa que regrese todos los números Amstrong dentro de un rango $[a, b]$. Hasta ahora se tiene el archivo `numeric.py` dentro de `../files/lec03/` que contiene las funciones `is_amstrong` y `amstrong_between`

Usando `pdb`, arregla el programa anterior para regresar todos los números Amstrong de $a$ a $b$.

In [251]:
# Hasta ahora vemos que corriendo un progama
%run ../files/lec03/numeric.py 153

153 no es número de amstrong


Si queremos correr un archivo y poner un *breakpoint* en una línea en específico, podemos hacer uso del parámetro `-d` para ejecutar el programa en modo *debugging*.
* `-dN`; N es `int`, específica en dónde queremos marcar un *breakpoint*

In [261]:
# Iniciamos modo debugging (-d) y crea un breakpoint en la línea 23 (-d23)
%run -d -b23 ../files/lec03/numeric.py 153

Breakpoint 1 at /Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/files/lec03/numeric.py:23
NOTE: Enter 'c' at the ipdb>  prompt to continue execution.
> [0;32m/Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/files/lec03/numeric.py[0m(2)[0;36m<module>[0;34m()[0m
[0;32m      1 [0;31m[0;34m[0m[0m
[0m[0;32m----> 2 [0;31m[0;32mdef[0m [0mis_amstrong[0m[0;34m([0m[0mn[0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      3 [0;31m    """
[0m[0;32m      4 [0;31m    [0mFunción[0m [0mpara[0m [0mvalidar[0m [0msi[0m [0mun[0m [0mnúmero[0m [0mentero[0m [0mpositivo[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      5 [0;31m    [0mes[0m [0mun[0m [0mnúmero[0m [0mde[0m [0mAmstrong[0m[0;34m[0m[0;34m[0m[0m
[0m
ipdb> c
> [0;32m/Users/gerardoduran/Dropbox (Personal)/Analysic-Nabla/proyectos/cursos/intermediate-python/files/lec03/numeric.py[0m(23)[0;36mis_a

## Evaluando Desempeño de Código

### `%time`

In [30]:
from numpy.linalg import eigvalsh, det
from numpy.random import seed

In [162]:
np.set_printoptions(suppress=True, precision=3, linewidth=200)
seed(314159)
A = np.random.randn(50,50)
A

array([[ 0.21 ,  1.31 , -0.878, ...,  0.543,  1.225, -0.881],
       [-0.096,  0.381, -1.061, ...,  0.66 , -0.65 , -0.173],
       [ 1.835, -1.037, -0.573, ...,  0.165,  2.769, -0.763],
       ...,
       [ 0.38 ,  1.117, -1.203, ...,  0.429,  0.979,  0.68 ],
       [ 0.616,  0.485, -0.569, ...,  0.493,  1.302,  0.882],
       [-0.394,  1.251, -0.355, ..., -0.222,  0.138, -0.642]])

In [163]:
%%time
det(A)

CPU times: user 361 µs, sys: 344 µs, total: 705 µs
Wall time: 6.67 ms


-1.3064225294089122e+32

In [164]:
%%time
np.prod(eigvals(A)).real

CPU times: user 773 µs, sys: 16 µs, total: 789 µs
Wall time: 778 µs


-1.3064225294089345e+32

### `%timeit`

In [165]:
%%timeit
det(A)

24.4 µs ± 926 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [166]:
%%timeit
np.prod(eigvals(A)).real

482 µs ± 18.2 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


#### Eligiendo número de loops

In [167]:
%%timeit -n 10
det(A)

30.2 µs ± 4.89 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [168]:
%%timeit -n 10
np.prod(eigvals(A)).real

526 µs ± 22 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


#### Eligiendo número de rondas por loop

In [169]:
%%timeit -r 10
det(A)

27.3 µs ± 921 ns per loop (mean ± std. dev. of 10 runs, 10000 loops each)


In [170]:
%%timeit -r 10
np.prod(eigvals(A)).real

477 µs ± 16.6 µs per loop (mean ± std. dev. of 10 runs, 1000 loops each)


#### Eligiendo número de rondas y loops

In [171]:
%%timeit -r 10 -n 20
det(A)

32.3 µs ± 10.7 µs per loop (mean ± std. dev. of 10 runs, 20 loops each)


In [172]:
%%timeit -r 10 -n 20
np.prod(eigvals(A)).real

514 µs ± 37.5 µs per loop (mean ± std. dev. of 10 runs, 20 loops each)


In [178]:
%config IPKernelApp.extensions = ["line_profiler"]

## Esquema de códigio: línea por línea

```
ipython profile create
```

Modificamos el archivo `~/.ipython/profile_default/ipython_config.py`

```
## A list of dotted module names of IPython extensions to load.
c.TerminalIPythonApp.extensions = ['line_profiler']
```

In [6]:
%load_ext line_profiler

In [4]:
import numpy as np
from numpy.linalg import inv

def pseudoinverse(phi):
    phi_inv = phi.T @ phi
    phi_inv = inv(phi_inv)
    phi_inv = phi_inv @ phi.T
    return phi_inv

def projection(phi, v):
    phi_inv = pseudoinverse(phi)
    projection = phi @ phi_inv @ v
    return projection

def random_projection(M, N, random_state=None):
    np.random.seed(random_state)
    phi = np.random.randn(N, M)
    v = np.random.randn(N, 1)
    # Projection from vector v onto hyperplane phi
    return projection(phi, v)

In [None]:
%lprun -u 1 -f pseudoinverse -f projection random_projection(1_000, 50_000)

```
Timer unit: 1 s

Total time: 1.12307 s
File: <ipython-input-7-953830b0dddf>
Function: pseudoinverse at line 4

Line #      Hits         Time  Per Hit   % Time  Line Contents
==============================================================
     4                                           def pseudoinverse(phi):
     5         1          0.4      0.4     31.7      phi_inv = phi.T @ phi
     6         1          0.0      0.0      2.5      phi_inv = inv(phi_inv)
     7         1          0.7      0.7     65.8      phi_inv = phi_inv @ phi.T
     8         1          0.0      0.0      0.0      return phi_inv

Total time: 506.198 s
File: <ipython-input-7-953830b0dddf>
Function: projection at line 10

Line #      Hits         Time  Per Hit   % Time  Line Contents
==============================================================
    10                                           def projection(phi, v):
    11         1          1.1      1.1      0.2      phi_inv = pseudoinverse(phi)
    12         1        505.1    505.1     99.8      projection = phi @ phi_inv @ v
    13         1          0.0      0.0      0.0      return projection
```

<h2 style="color:crimson">Ejercicios</h2>

## Referencias
1. https://ipython.readthedocs.io/en/stable/interactive/magics.html
2. https://docs.python.org/3/library/pdb.html
3. McKinney, Wes. [Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython](https://www.oreilly.com/library/view/python-for-data/9781491957653/). O'Reilly Media, Inc., 2018.