![logo](../files/misc/logo.png)
<h1 style="color:#872325">Debugging and Profiling</h1>

A medida que vamos trabajando con código cada vez más complejo, la probabilidad de erroes lógicos y cuellos de botella en el procesamietno de nuestros datos se incrementa de igual manera.

Python cuenta con varias herramientas para combatir estos tipos de problemas.

## `pdb`

El módulo `pdb` (Python Debugger) define un *debugger* interactivo para programas en python. Este tipo de herramientas nos ayudan a analizar nuestro código y poder detectar más facilmente los errores de nuestros programas.

In [193]:
import pdb

Una vez importado, hacemos uso de `pdb` dentro de un programa con `pdb.set_trace()`. Esta función pausa el programa en la línea deseada e inicia el debugger.

**Comandos de navegación PDB** ([fuente](https://web.stanford.edu/class/physics91si/2013/handouts/Pdb_Commands.pdf))

* `(l)ist`: muestra 11 líneas alrededor de la línea actual
* `(w)here`: muestra el archivo y la línea actual del programa
* `(n)ext`: ejecuta la línea actual
* `(s)tep`: ingresa a la función dentro de la línea actual
* `(r)eturn`: (dentro de una función), corre el progama hasta encontrar el `return` de la función actual
* `(c)ontinue`: corre el programa hasta encontrar un *trace* o *breakpoint*

In [198]:
values = []
for i in range(10):
    if i % 2 == 0:
        pdb.set_trace() # <--- Selección de un "breakpoint"
        values.append(i ** 2)

> <ipython-input-198-4c0292c576ae>(5)<module>()
-> values.append(i ** 2)
(Pdb) print("Llegado a un breakpoint; el programa pausa")
Llegado a un breakpoint; el programa pausa
(Pdb) l
  1  	values = []
  2  	for i in range(10):
  3  	    if i % 2 == 0:
  4  	        pdb.set_trace() # <--- Selección de un "breakpoint"
  5  ->	        values.append(i ** 2)
[EOF]
(Pdb) print("Con 'n' ejecutamos la línea actual y pausamos al siguiente paso")
Con 'n' ejecutamos la línea actual y pausamos al siguiente paso
(Pdb) n
> <ipython-input-198-4c0292c576ae>(2)<module>()
-> for i in range(10):
(Pdb) l
  1  	values = []
  2  ->	for i in range(10):
  3  	    if i % 2 == 0:
  4  	        pdb.set_trace() # <--- Selección de un "breakpoint"
  5  	        values.append(i ** 2)
[EOF]
(Pdb) print("Con 'c' el programa corre hasta encontrar un breakpoint")
Con 'c' el programa corre hasta encontrar un breakpoint
(Pdb) c
> <ipython-input-198-4c0292c576ae>(5)<module>()
-> values.append(i ** 2)
(Pdb) l
  1  	values =

BdbQuit: 

<h2 style="color:teal">Ejemplo</h2>

Un número entero positivo es conocido como un número de Amstrong de orden $n$ si

$$
    \alpha_1\alpha_2\ldots\alpha_n = \sum_{i=1}^n \alpha_i^n = \alpha_1 ^ n + \alpha_2 ^ n + \ldots + \alpha_n ^ n
$$

Por ejemplo, el número 153 es un número de Amstrong de orden 3 ya que $153 = 1^3 + 5 ^3  + 3 ^ 3$

Se quiere escribir un programa que regrese todos los números Amstrong dentro de un rango $[a, b]$. Hasta ahora se tiene el el siguiente programa:

```python
def is_amstrong(n):
    """
    Función para validar si un número entero positivo
    es un número de Amstrong
    
    parameters
    ----------
    n: int
        número a validar si es Amstrong
       
    Returns
    -------
    Bool:
        True si 'n' es Amstrong. Falso de otra manera
    """
    numbers = []
    total_sum = 0
    # Obtenemos cada dígito del número
    for ni in str(n):
        numbers.append(ni)
    
    for ni in numbers:
        total_sum = ni
    
    validation = True if total_sum == n else False
    return validation
    
def amstrong_between(a, b):
    """
    Función para encontrar todos los números
    amstrong entre un rango a, ..., b
    
    Parameters
    ----------
    a: int
        cota inferior a evaluar
    b: int
        cota superior a evaluar
    
    Returns
    -------
    list:
        elementos entre a, ... ,b que sean número de Amstrong
    """
    amstrong_numbers = []
    for i in range(a, b + 1):
        if is_amstrong(a):
            amstrong_numbers.append(i)
    
    return amstrong_numbers
```

Usando `pdb`, arregla el programa anterior para regresar todos los números Amstrong de $a$ a $b$.

## Evaluando Desempeño de Código

### `%time`

In [30]:
from numpy.linalg import eigvalsh, det
from numpy.random import seed

In [162]:
np.set_printoptions(suppress=True, precision=3, linewidth=200)
seed(314159)
A = np.random.randn(50,50)
A

array([[ 0.21 ,  1.31 , -0.878, ...,  0.543,  1.225, -0.881],
       [-0.096,  0.381, -1.061, ...,  0.66 , -0.65 , -0.173],
       [ 1.835, -1.037, -0.573, ...,  0.165,  2.769, -0.763],
       ...,
       [ 0.38 ,  1.117, -1.203, ...,  0.429,  0.979,  0.68 ],
       [ 0.616,  0.485, -0.569, ...,  0.493,  1.302,  0.882],
       [-0.394,  1.251, -0.355, ..., -0.222,  0.138, -0.642]])

In [163]:
%%time
det(A)

CPU times: user 361 µs, sys: 344 µs, total: 705 µs
Wall time: 6.67 ms


-1.3064225294089122e+32

In [164]:
%%time
np.prod(eigvals(A)).real

CPU times: user 773 µs, sys: 16 µs, total: 789 µs
Wall time: 778 µs


-1.3064225294089345e+32

### `%timeit`

In [165]:
%%timeit
det(A)

24.4 µs ± 926 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [166]:
%%timeit
np.prod(eigvals(A)).real

482 µs ± 18.2 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


#### Eligiendo número de loops

In [167]:
%%timeit -n 10
det(A)

30.2 µs ± 4.89 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [168]:
%%timeit -n 10
np.prod(eigvals(A)).real

526 µs ± 22 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


#### Eligiendo número de rondas por loop

In [169]:
%%timeit -r 10
det(A)

27.3 µs ± 921 ns per loop (mean ± std. dev. of 10 runs, 10000 loops each)


In [170]:
%%timeit -r 10
np.prod(eigvals(A)).real

477 µs ± 16.6 µs per loop (mean ± std. dev. of 10 runs, 1000 loops each)


#### Eligiendo número de rondas y loops

In [171]:
%%timeit -r 10 -n 20
det(A)

32.3 µs ± 10.7 µs per loop (mean ± std. dev. of 10 runs, 20 loops each)


In [172]:
%%timeit -r 10 -n 20
np.prod(eigvals(A)).real

514 µs ± 37.5 µs per loop (mean ± std. dev. of 10 runs, 20 loops each)


In [178]:
%config IPKernelApp.extensions = ["line_profiler"]

## Esquema de códigio: línea por línea

```
ipython profile create
```

Modificamos el archivo `~/.ipython/profile_default/ipython_config.py`

```
## A list of dotted module names of IPython extensions to load.
c.TerminalIPythonApp.extensions = ['line_profiler']
```

In [6]:
%load_ext line_profiler

In [4]:
import numpy as np
from numpy.linalg import inv

def pseudoinverse(phi):
    phi_inv = phi.T @ phi
    phi_inv = inv(phi_inv)
    phi_inv = phi_inv @ phi.T
    return phi_inv

def projection(phi, v):
    phi_inv = pseudoinverse(phi)
    projection = phi @ phi_inv @ v
    return projection

def random_projection(M, N, random_state=None):
    np.random.seed(random_state)
    phi = np.random.randn(N, M)
    v = np.random.randn(N, 1)
    # Projection from vector v onto hyperplane phi
    return projection(phi, v)

In [None]:
%lprun -u 1 -f pseudoinverse -f projection random_projection(1_000, 50_000)

<h2 style="color:crimson">Ejercicios</h2>