**Notas para contenedor de docker:**

Comando de docker para ejecución de la nota de forma local:

nota: cambiar `<ruta a mi directorio>` por la ruta de directorio que se desea mapear a `/datos` dentro del contenedor de docker.

```
docker run --rm -v <ruta a mi directorio>:/datos --name jupyterlab_numerical -p 8888:8888 -p 8786:8786 -p 8787:8787 -d palmoreck/jupyterlab_numerical:1.1.0
```

password para jupyterlab: `qwerty`

Detener el contenedor de docker:

```
docker stop jupyterlab_numerical
```


Documentación de la imagen de docker `palmoreck/jupyterlab_numerical:1.1.0` en [liga](https://github.com/palmoreck/dockerfiles/tree/master/jupyterlab/numerical).

---

Esta nota utiliza métodos vistos en [1.5.Integracion_numerica](https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/master/temas/I.computo_cientifico/1.5.Integracion_numerica.ipynb)

Documentación de [cython](https://cython.org/): 

* [Basic Tutorial](https://cython.readthedocs.io/en/latest/src/tutorial/cython_tutorial.html)

* [Source Files and Compilation](https://cython.readthedocs.io/en/latest/src/userguide/source_files_and_compilation.html)

* [Compiling with a Jupyter Notebook](https://cython.readthedocs.io/en/latest/src/userguide/source_files_and_compilation.html#compiling-with-a-jupyter-notebook)


**La siguiente celda muestra el modo de utilizar el comando magic de `%pip` para instalar paquetes desde jupyterlab.** Ver [liga](https://ipython.readthedocs.io/en/stable/interactive/magics.html#built-in-magic-commands) para magic commands.

Instalamos cython:

In [1]:
%pip install -q --user cython

You should consider upgrading via the 'pip install --upgrade pip' command.[0m
Note: you may need to restart the kernel to use updated packages.


La siguiente celda reiniciará el kernel de **IPython** para cargar los paquetes instalados en la celda anterior. Dar **Ok** en el mensaje que salga y continuar con el contenido del notebook.

In [2]:
import IPython
app = IPython.Application.instance()
app.kernel.do_shutdown(True)

{'status': 'ok', 'restart': True}

# Cython y el por qué compilar a código de máquina

De las opciones más sencillas que tenemos a nuestra disposición para resolver bottlenecks en nuestro programa es hacer que nuestro código haga menos trabajo. ¿Cómo podemos hacer esto? <- compilando nuestro código a código de máquina para que el código en Python ejecute menos instrucciones. 

**¿Por qué puede ser lenta la ejecución de un bloque de código en Python (o en algún otro lenguaje tipo intérprete*)?** La verificación de tipo de datos (si son `int`, `double` o `string`), los objetos temporales que se crean por tipo de dato (un objeto tipo `int` en Python tiene asociado un objeto de alto nivel con el que interactuamos pero que causa overhead) y las llamadas a funciones de alto nivel (por ejemplo las que ayudan a almacenar al objeto en memoria) son tres de las fuentes que hacen a Python (y a otro lenguaje tipo intérprete como `R` o `Matlab`) lento. También otras fuentes que responden la pregunta son:

* Desde el punto de vista de la memoria de la máquina, el número de referencias a un objeto y las copias entre objetos. 

* No es posible vectorizar un cálculo sin el uso de extensiones (por ejemplo paquetes como `numpy`).

*Ver [liga](https://en.wikipedia.org/wiki/Interpreter_(computing)) para revisar lo que es un lenguaje tipo intérprete.

Un paquete para resolver lo anterior es Cython que requiere que escribamos en un lenguaje híbrido entre Python y C. Si bien a l@s integrantes de un equipo de desarrollo que no saben C éste cambio reducirá la velocidad de desarrollo, en la práctica si se tiene un bottleneck que no ha podido resolverse con herramientas como el cómputo en paralelo o vectorización, se recomienda utilizar Cython para regiones pequeñas del código y resolver el bottleneck del programa. 

Cython es un compilador que convierte *type-annotated Python* y *C like* (instrucciones escritas en Python pero en una forma tipo lenguaje C) en un módulo compilado que funciona como una extensión de Python. Este módulo puede ser importado como un módulo regular de Python utilizando `import`. 

Además Cython tiene ya un buen tiempo en la comunidad (2007 aprox.), es altamente usado y es de las herramientas preferidas para código tipo *CPU-bound* (un gran porcentaje del código es uso de CPU vs uso de memoria o I/O). También soporta a la [API OpenMP](https://www.openmp.org/) que veremos en el capítulo de cómputo en paralelo para aprovechar los múltiples cores o CPU's de una máquina.

Para ver más historia de Cython ir a la referencia 1. de esta nota o a la [liga](https://en.wikipedia.org/wiki/Cython).

# ¿Qué tipo de ganancias en velocidad podemos esperar al usar Cython?

* Código en el que se tengan muchos loops (por ejemplo ciclos `for`) en los que se realizan operaciones matemáticas típicamente no vectorizadas o que no pueden vectorizarse*. Esto es, códigos en los que las instrucciones son básicamente sólo Python sin utilizar paquetes externos. Además, si en el ciclo las variables no cambian de su tipo (por ejemplo de `int` a `float`) entonces es una blanco perfecto para ganancia en velocidad al compilar a código de máquina.

*Si tu código de Python llama a operaciones vectorizadas vía `numpy` podría ser que no se ejecute más rápido tu código después de compilarlo.

* No esperamos tener un *speedup* después de compilar para llamadas a librerías externas (por ejemplo a expresiones regulares, operaciones con `string`s o a una base de datos). Programas que tengan alta carga de I/O también es poco probable que muestren ganancias significativas.

En general es poco probable que tu código compilado se ejecute más rápido que un código en C "bien aceitado" y también es poco probable que se ejecute más lento. Es muy posible que el código C generado desde tu Python pueda alcanzar las velocidades de un código escrito en C, a menos que la persona que programó en C tenga un gran conocimiento de formas de hacer que el código de C se ajuste a la arquitectura de la máquina sobre la que se ejecutan los códigos.

**No olvidar:** es importante fijar de forma aproximada el tiempo objetivo que se desea alcanzar para un código que escribamos. Si bien el perfilamiento y la compilación son herramientas para resolver los bottlenecks, debemos tomar en cuenta el tiempo objetivo fijado y ser práctic@s en el desarrollo, no podemos por siempre estar optimizando nuestro código.

# Ejemplo

Cython puede utilizarse vía un script `setup.py` que compila un módulo pero también puede utilizarse en `IPython` vía un comando `magic`.

In [1]:
import math
import time
from scipy.integrate import quad

## Vía un script `setup.py`

Para este caso requerimos tres archivos:

1) El código escrito en Python que será compilado en un archivo con extensión `.pyx`.

2) Un archivo `setup.py` que contiene las instrucciones para llamar a Cython y cree el módulo compilado.

3) El código escrito en Python que importará el módulo compilado (puede pensarse como nuestro `main`).

1) Función a compilar en un archivo `.pyx`:

In [3]:
%%file Rcf_cython.pyx
def Rcf(f,a,b,n): #Rcf: rectángulo compuesto para f
    """
    Compute numerical approximation using rectangle or mid-point method in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Rcf (float) 
    """
    h_hat=(b-a)/n
    nodes=[a+(i+1/2)*h_hat for i in range(0,n)]
    sum_res=0
    for node in nodes:
        sum_res=sum_res+f(node)
    return h_hat*sum_res


Writing Rcf_cython.pyx


2) Archivo `setup.py` que contiene las instrucciones para el build:

In [4]:
%%file setup.py
from distutils.core import setup
from distutils.extension import Extension
from Cython.Distutils import build_ext
setup(cmdclass = {'build_ext': build_ext},
      ext_modules = [Extension("Rcf_compiled", 
                               ["Rcf_cython.pyx"])]
     )

Writing setup.py


Compilar desde la línea de comandos:

In [5]:
%%bash
python3 setup.py build_ext --inplace #inplace para compilar el módulo en el directorio
                                     #actual

running build_ext
cythoning Rcf_cython.pyx to Rcf_cython.c
building 'Rcf_compiled' extension
creating build
creating build/temp.linux-x86_64-3.6
x86_64-linux-gnu-gcc -pthread -DNDEBUG -g -fwrapv -O2 -Wall -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -fPIC -I/usr/include/python3.6m -c Rcf_cython.c -o build/temp.linux-x86_64-3.6/Rcf_cython.o
x86_64-linux-gnu-gcc -pthread -shared -Wl,-O1 -Wl,-Bsymbolic-functions -Wl,-Bsymbolic-functions -Wl,-z,relro -Wl,-Bsymbolic-functions -Wl,-z,relro -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 build/temp.linux-x86_64-3.6/Rcf_cython.o -o /datos/MNO_desde_2018/ramas_repo/mno-master/temas/I.computo_cientifico/Rcf_compiled.cpython-36m-x86_64-linux-gnu.so


  tree = Parsing.p_module(s, pxd, full_module_name)


**Notas:** 

* La compilación debe hacerse cada vez que se modifica el código de la función `Rcf` del archivo `Rcf_cython.pyx` o cambia el `setup.py`.

* Obsérvese en el directorio donde se encuentra la nota que se generó un archivo `Rcf_cython.c`.

3) Importar módulo compilado y ejecutarlo:

In [6]:
f=lambda x: math.exp(-x**2) #using math library

In [7]:
import Rcf_compiled

In [8]:
n=10**6
start_time = time.time()
aprox=Rcf_compiled.Rcf(f,0,1,n)
end_time = time.time()


In [9]:
aprox

0.746824448872663

In [10]:
secs = end_time-start_time
print("Rcf tomó",secs,"segundos" )

Rcf tomó 0.29076671600341797 segundos


**Recuérdese** revisar el error relativo:

In [11]:
def err_relativo(aprox, obj):
    return math.fabs(aprox-obj)/math.fabs(obj) #obsérvese el uso de la librería math

In [12]:
obj, err = quad(f, 0, 1)
err_relativo(aprox,obj)

4.2320570799153987e-07

**Ejercicio:** investigar por qué se tiene un error relativo del orden de $10^{-7}$ y no de mayor precisión como se verá más abajo con el archivo `Rcf_cython2.pyx`.

In [13]:
%timeit -n 5 -r 10 Rcf_compiled.Rcf(f,0,1,n)

305 ms ± 26.2 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


**Obs:** El error relativo anterior es más grande del que se obtenía anteriomente, por ello se utilizará el módulo `cythonize` (haciendo pruebas e investigando un poco se obtuvo la precisión de antes).

In [14]:
%%file Rcf_cython2.pyx
def Rcf(f,a,b,n): #Rcf: rectángulo compuesto para f
    """
    Compute numerical approximation using rectangle or mid-point method in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Rcf (float) 
    """
    h_hat=(b-a)/n
    nodes=[a+(i+1/2)*h_hat for i in range(0,n)]
    sum_res=0
    for node in nodes:
        sum_res=sum_res+f(node)
    return h_hat*sum_res


Writing Rcf_cython2.pyx


In [15]:
%%file setup2.py
from distutils.core import setup
from Cython.Build import cythonize

setup(ext_modules = cythonize("Rcf_cython2.pyx", 
                              compiler_directives={'language_level' : 3})
     )
#es posible que la solución del ejercicio anterior tenga que ver con el Warning
#y uso de la directiva language_level

Writing setup2.py


In [16]:
%%bash
python3 setup2.py build_ext --inplace

Compiling Rcf_cython2.pyx because it changed.
[1/1] Cythonizing Rcf_cython2.pyx
running build_ext
building 'Rcf_cython2' extension
x86_64-linux-gnu-gcc -pthread -DNDEBUG -g -fwrapv -O2 -Wall -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -fPIC -I/usr/include/python3.6m -c Rcf_cython2.c -o build/temp.linux-x86_64-3.6/Rcf_cython2.o
x86_64-linux-gnu-gcc -pthread -shared -Wl,-O1 -Wl,-Bsymbolic-functions -Wl,-Bsymbolic-functions -Wl,-z,relro -Wl,-Bsymbolic-functions -Wl,-z,relro -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 build/temp.linux-x86_64-3.6/Rcf_cython2.o -o /datos/MNO_desde_2018/ramas_repo/mno-master/temas/I.computo_cientifico/Rcf_cython2.cpython-36m-x86_64-linux-gnu.so


In [17]:
import Rcf_cython2

In [18]:
n=10**6
start_time = time.time()
aprox=Rcf_cython2.Rcf(f,0,1,n)
end_time = time.time()


In [19]:
aprox

0.7468241328124773

In [20]:
secs = end_time-start_time
print("Rcf tomó",secs,"segundos" )

Rcf tomó 0.3181641101837158 segundos


Revisar error relativo:

In [21]:
err_relativo(aprox,obj)

6.71939731300312e-14

## Vía el comando magic `%cython`

Este comando se ocupa de escribir el archivo `.pyx`, compilarlo con `setup.py` e importarlo en el *notebook*. Ver [cythonmagic](https://ipython.org/ipython-doc/2/config/extensions/cythonmagic.html).

In [22]:
%load_ext Cython

In [23]:
%%cython
def Rcf(f,a,b,n): #Rcf: rectángulo compuesto para f
    """
    Compute numerical approximation using rectangle or mid-point method in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Rcf (float) 
    """
    h_hat=(b-a)/n
    nodes=[a+(i+1/2)*h_hat for i in range(0,n)]
    sum_res=0
    for node in nodes:
        sum_res=sum_res+f(node)
    return h_hat*sum_res


In [24]:
n=10**6
start_time = time.time()
aprox=Rcf(f,0,1,n)
end_time = time.time()

In [25]:
secs = end_time-start_time
print("Rcf tomó",secs,"segundos" )

Rcf tomó 0.32102036476135254 segundos


In [26]:
err_relativo(aprox,obj)

6.71939731300312e-14

In [28]:
%timeit -n 5 -r 10 Rcf(f,0,1,n)

301 ms ± 15.8 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


# Cython Annotations para analizar un bloque de código

Cython tiene una opción de *annotation* que generará un archivo con extensión `.html` que se puede visualizar en jupyterlab o en un browser.

Cada línea puede ser expandida haciendo un doble click que mostrará el código C generado. Líneas más amarillas refieren a más llamadas en la máquina virtual de Python (por máquina virtual de Python entiéndase la maquinaria que utiliza Python para traducir el lenguaje [bytecode](https://en.wikipedia.org/wiki/Bytecode) ), mientras que líneas más blancas significan "más código en C y no Python". El objetivo es remover la mayor cantidad de líneas amarillas posibles (pues típicamente son costosas en tiempo y si las líneas están dentro de loops son todavía más costosas) y terminar con códigos cuyas annotations sean lo más blancas posibles. Concentra tu atención en las líneas que son amarillas y están dentro de los loops, no pierdas tu tiempo en líneas amarillas que están fuera de loops y que no causan una ejecución lenta (para identificar esto perfila tu código).

## Vía línea de comando:

In [29]:
%%bash
$HOME/.local/bin/cython -a Rcf_cython.pyx

  tree = Parsing.p_module(s, pxd, full_module_name)


Ver archivo creado: `Rcf_cython.html`

## Vía comando de magic y flag `-a`:

In [30]:
%%cython?

[0;31mDocstring:[0m
::

  %cython [-a] [-+] [-3] [-2] [-f] [-c COMPILE_ARGS]
              [--link-args LINK_ARGS] [-l LIB] [-n NAME] [-L dir] [-I INCLUDE]
              [-S SRC] [--pgo] [--verbose]

Compile and import everything from a Cython code cell.

The contents of the cell are written to a `.pyx` file in the
directory `IPYTHONDIR/cython` using a filename with the hash of the
code. This file is then cythonized and compiled. The resulting module
is imported and all of its symbols are injected into the user's
namespace. The usage is similar to that of `%%cython_pyximport` but
you don't have to pass a module name::

    %%cython
    def f(x):
        return 2.0*x

To compile OpenMP codes, pass the required  `--compile-args`
and `--link-args`.  For example with gcc::

    %%cython --compile-args=-fopenmp --link-args=-fopenmp
    ...

To enable profile guided optimisation, pass the ``--pgo`` option.
Note that the cell itself needs to take care of establishing a suitable
profile when

In [None]:
%%cython -a
def Rcf(f,a,b,n): #Rcf: rectángulo compuesto para f
    """
    Compute numerical approximation using rectangle or mid-point method in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Rcf (float) 
    """
    h_hat=(b-a)/n
    nodes=[a+(i+1/2)*h_hat for i in range(0,n)]
    sum_res=0
    for node in nodes:
        sum_res=sum_res+f(node)
    return h_hat*sum_res

<img src="https://dl.dropboxusercontent.com/s/0fjkhg66rl0v2n0/output_cython_1.png?dl=0" heigth="500" width="500">


**Nota:** la imagen anterior es un screenshot que generé ejecutando la celda anterior. 

**Obs:** para este ejemplo la línea $18$ es muy amarilla y está dentro del loop. Recuérdese de la nota [1.6.Perfilamiento_Python.ipynb](https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/master/temas/I.computo_cientifico/1.6.Perfilamiento_Python.ipynb) que es una línea en la que se gasta parte del tiempo total de ejecución del código. 

Una primera opción que tenemos es crear los nodos para el método de integración dentro del loop y separar el llamado a la *list comprehension* `nodes=[a+(i+1/2)*h_hat for i in range(0,n)]`:

In [None]:
%%cython -a
def Rcf2(f,a,b,n): #Rcf: rectángulo compuesto para f
    """
    Compute numerical approximation using rectangle or mid-point method in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Rcf (float) 
    """
    h_hat=(b-a)/n
    sum_res=0
    for i in range(0,n):
        x=a+(i+1/2.0)*h_hat
        sum_res+=f(x)
    return h_hat*sum_res


<img src="https://dl.dropboxusercontent.com/s/d5atbbiivsh2mgk/output_cython_2.png?dl=0" heigth="500" width="500">


**Nota:** la imagen anterior es un screenshot que generé ejecutando la celda anterior. 

In [41]:
n=10**6
start_time = time.time()
aprox=Rcf2(f,0,1,n)
end_time = time.time()

In [42]:
secs = end_time-start_time
print("Rcf2 tomó",secs,"segundos" )

Rcf2 tomó 0.4055826663970947 segundos


In [43]:
err_relativo(aprox,obj)

6.71939731300312e-14

In [44]:
%timeit -n 5 -r 10 Rcf2(f,0,1,n)

328 ms ± 40.5 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


**Obs:** para este ejemplo las líneas $17$ y $18$ son muy amarillas y están dentro del loop. Además son líneas que involucran tipos de datos que no cambiarán en la ejecución de cada loop. Nos enfocamos a hacerlas más blancas... Una primera opción es **declarar los tipos de objetos** que están involucrados en el loop utilizando la sintaxis `cdef`:

In [None]:
%%cython -a
def Rcf3(f,double a,double b,unsigned int n): #obsérvese la declaración de los tipos
    """
    Compute numerical approximation using rectangle or mid-point method in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Rcf (float) 
    """
    cdef unsigned int i #obsérvese la declaración de los tipos
    cdef double x,sum_res, h_hat #obsérvese la declaración de los tipos
    h_hat=(b-a)/n
    sum_res=0
    for i in range(0,n):
        x=a+(i+1/2.0)*h_hat
        sum_res+=f(x)
    return h_hat*sum_res

<img src="https://dl.dropboxusercontent.com/s/ttxyxbkbmtxptdt/output_cython_3.png?dl=0" heigth="500" width="500">

**Nota:** la imagen anterior es un screenshot que generé ejecutando la celda anterior. 

In [46]:
n=10**6
start_time = time.time()
aprox=Rcf3(f,0,1,n)
end_time = time.time()

In [48]:
secs = end_time-start_time
print("Rcf3 tomó",secs,"segundos" )

Rcf3 tomó 0.2263948917388916 segundos


In [49]:
err_relativo(aprox,obj)

6.71939731300312e-14

In [50]:
%timeit -n 5 -r 10 Rcf3(f,0,1,n)

225 ms ± 18.3 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


**Obs:** al definir tipos, éstos sólo serán entendidos por Cython y **no por Python**. Cython utiliza estos tipos para convertir el código de Python a objetos de C, éstos objetos no tienen que convertirse de vuelta a objetos de Python. Entonces perdemos flexibilidad pero ganamos velocidad.

Y podemos bajar más el tiempo al definir la función que será utilizada:

In [None]:
%%cython -a
import math
def Rcf4(double a,double b,unsigned int n): #Rcf: rectángulo compuesto para f
    """
    Compute numerical approximation using rectangle or mid-point method in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Rcf (float) 
    """
    cdef unsigned int i
    cdef double x,sum_res, h_hat
    h_hat=(b-a)/n
    sum_res=0
    for i in range(0,n):
        x=a+(i+1/2.0)*h_hat
        sum_res+=math.exp(-x**2)
    return h_hat*sum_res

<img src="https://dl.dropboxusercontent.com/s/a5upwaoveixxuza/output_cython_4.png?dl=0" heigth="500" width="500">


**Nota:** la imagen anterior es un screenshot que generé ejecutando la celda anterior. 

In [52]:
n=10**6
start_time = time.time()
aprox=Rcf4(0,1,n)
end_time = time.time()

In [53]:
secs = end_time-start_time
print("Rcf4 tomó",secs,"segundos" )

Rcf4 tomó 0.07600998878479004 segundos


In [54]:
err_relativo(aprox,obj)

6.71939731300312e-14

In [55]:
%timeit -n 5 -r 10 Rcf4(0,1,n)

78 ms ± 5.76 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


**Obs:** estamos ganando velocidad pues el compilador de C `gcc` puede optimizar funciones de bajo nivel para operar en los bytes que están asociados a las variables y no realiza llamadas a la máquina virtual de Python. 

**Ejercicios**

1. Realiza el análisis con las herramientas revisadas en esta nota para las reglas del trapecio y de Simpson de  la nota [1.5.Integracion_numerica](https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/master/temas/I.computo_cientifico/1.5.Integracion_numerica.ipynb).


In [1]:
%pip install -q --user cython

You should consider upgrading via the 'pip install --upgrade pip' command.[0m
Note: you may need to restart the kernel to use updated packages.


In [2]:
import IPython
app = IPython.Application.instance()
app.kernel.do_shutdown(True)

{'status': 'ok', 'restart': True}

In [1]:
import math
import time
import numpy as np
from scipy.integrate import quad

# Solución para la regla del trapecio

## Usamos Cython Vía un script `setup.py`

1) Función a compilar en un archivo `.pyx`:

In [3]:
%%file Tcf_cython.pyx
import numpy as np
def Tcf(f,a,b,n): #Tcf: trapecio compuesto para f
    """
    Compute numerical approximation using trapezoidal rule in 
    an interval.
    Nodes are generated via numpy
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Tcf (float) 
    """
    h=b-a
    nodes=np.linspace(a,b,n+1)
    sum_res=sum(f(nodes[1:-1]))
    return h/(2*n)*(f(nodes[0])+f(nodes[-1])+2*sum_res)

Writing Tcf_cython.pyx


2) Archivo `setupTcf.py` que contiene las instrucciones para el build:

In [4]:
%%file setupTcf.py
from distutils.core import setup
from distutils.extension import Extension
from Cython.Distutils import build_ext
setup(cmdclass = {'build_ext': build_ext},
      ext_modules = [Extension("Tcf_compiled", 
                               ["Tcf_cython.pyx"])]
     )

Writing setupTcf.py


Compilar desde la línea de comandos:

In [5]:
%%bash
python3 setupTcf.py build_ext --inplace #inplace para compilar el módulo en el directorio
                                     #actual

running build_ext
cythoning Tcf_cython.pyx to Tcf_cython.c
building 'Tcf_compiled' extension
creating build
creating build/temp.linux-x86_64-3.6
x86_64-linux-gnu-gcc -pthread -DNDEBUG -g -fwrapv -O2 -Wall -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -fPIC -I/usr/include/python3.6m -c Tcf_cython.c -o build/temp.linux-x86_64-3.6/Tcf_cython.o
x86_64-linux-gnu-gcc -pthread -shared -Wl,-O1 -Wl,-Bsymbolic-functions -Wl,-Bsymbolic-functions -Wl,-z,relro -Wl,-Bsymbolic-functions -Wl,-z,relro -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 build/temp.linux-x86_64-3.6/Tcf_cython.o -o /home/jovyan/ejercicios-perfilamiento-y-compilacion-gzarazua/Tcf_compiled.cpython-36m-x86_64-linux-gnu.so


  tree = Parsing.p_module(s, pxd, full_module_name)


3) Importar módulo compilado y ejecutarlo:

In [6]:
f=lambda x: np.exp(-x**2) #using numpy library

In [7]:
import Tcf_compiled

In [8]:
n=10**6
start_time = time.time()
aprox=Tcf_compiled.Tcf(f,0,1,n)
end_time = time.time()

In [9]:
aprox

0.7468241328123836

In [10]:
secs = end_time-start_time
print("Tcf tomó",secs,"segundos")

Tcf tomó 0.41162776947021484 segundos


Ahora revisamos el error relativo:

In [12]:
def err_relativo(aprox, obj):
    return math.fabs(aprox-obj)/math.fabs(obj) #obsérvese el uso de la librería math

In [13]:
obj, err = quad(f, 0, 1)
err_relativo(aprox,obj)

5.827441917471732e-14

In [14]:
%timeit -n 5 -r 10 Tcf_compiled.Tcf(f,0,1,n)

274 ms ± 15.3 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


In [16]:
%%file Tcf_cython2.pyx
import numpy as np
def Tcf2(f,a,b,n): #Rcf: trapecio compuesto para f
    """
    Compute numerical approximation using trapezoidal rule in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Tcf (float) 
    """
    h=b-a
    nodes=np.linspace(a,b,n+1)
    sum_res=sum(f(nodes[1:-1]))
    return h/(2*n)*(f(nodes[0])+f(nodes[-1])+2*sum_res)

Writing Tcf_cython2.pyx


In [17]:
%%file setup2Tcf.py
from distutils.core import setup
from Cython.Build import cythonize

setup(ext_modules = cythonize("Tcf_cython2.pyx", 
                              compiler_directives={'language_level' : 3})
     )
#es posible que la solución del ejercicio anterior tenga que ver con el Warning
#y uso de la directiva language_level

Writing setup2Tcf.py


In [18]:
%%bash
python3 setup2Tcf.py build_ext --inplace

Compiling Tcf_cython2.pyx because it changed.
[1/1] Cythonizing Tcf_cython2.pyx
running build_ext
building 'Tcf_cython2' extension
x86_64-linux-gnu-gcc -pthread -DNDEBUG -g -fwrapv -O2 -Wall -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -fPIC -I/usr/include/python3.6m -c Tcf_cython2.c -o build/temp.linux-x86_64-3.6/Tcf_cython2.o
x86_64-linux-gnu-gcc -pthread -shared -Wl,-O1 -Wl,-Bsymbolic-functions -Wl,-Bsymbolic-functions -Wl,-z,relro -Wl,-Bsymbolic-functions -Wl,-z,relro -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 build/temp.linux-x86_64-3.6/Tcf_cython2.o -o /home/jovyan/ejercicios-perfilamiento-y-compilacion-gzarazua/Tcf_cython2.cpython-36m-x86_64-linux-gnu.so


In [19]:
import Tcf_cython2

In [20]:
n=10**6
start_time = time.time()
aprox=Tcf_cython2.Tcf2(f,0,1,n)
end_time = time.time()

In [21]:
aprox

0.7468241328123836

Y vemos que el tiempo baja:

In [23]:
secs = end_time-start_time
print("Tcf tomó",secs,"segundos")

Tcf tomó 0.28656673431396484 segundos


Revisamos error relativo:

In [25]:
err_relativo(aprox,obj)

5.827441917471732e-14

# Ahora usamos Cython Annotations para analizar un bloque de código

## Vía línea de comando:

In [26]:
%%bash
$HOME/.local/bin/cython -a -3 Tcf_cython2.pyx

## Vía comando de magic y flag `-a`:

Intentamos bajar el tiempo definiendo los tipos de variables: 

In [27]:
%load_ext Cython

In [28]:
%%cython -a
import numpy as np
def Tcf3(f,double a,double b,int n): #Tcf: trapecio compuesto para f
    """
    Compute numerical approximation using trapezoidal rule in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Tcf (float) 
    """
    cdef double h=b-a,sum_res
    nodes=np.linspace(a,b,n+1)
    sum_res=sum(f(nodes[1:-1]))
    return h/(2*n)*(f(nodes[0])+f(nodes[-1])+2*sum_res)

<img src="https://dl.dropboxusercontent.com/s/vr6fdwp9g3m1dac/Tcf3.png?dl=0" heigth="1000" width="2000">

**Nota:** la imagen anterior es un screenshot que generé ejecutando la celda anterior. 

In [29]:
n=10**6
start_time = time.time()
aprox=Tcf3(f,0,1,n)
end_time = time.time()

In [30]:
aprox

0.7468241328123836

Y vemos que ya no tenemos todas las líneas con amarillo fuerte

In [35]:
secs = end_time-start_time
print("Tcf3 tomó",secs,"segundos" )

Tcf3 tomó 0.29035258293151855 segundos


Revisamos error relativo:

In [33]:
err_relativo(aprox,obj)

5.827441917471732e-14

In [34]:
%timeit -n 5 -r 10 Tcf3(f,0,1,n)

257 ms ± 10.3 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


Lo cual es menor que nuestro tiempo inicial:

In [14]:
%timeit -n 5 -r 10 Tcf_compiled.Tcf(f,0,1,n)

274 ms ± 15.3 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


Intentamos bajar el tiempo anterior evaluando los nodos para el método de integración dentro del loop y calculando la suma. Además, definimos la función que será utiizada

In [36]:
%%cython -a
import math
import numpy as np
def Tcf4(double a,double b,int n): #Tcf: trapecio compuesto para f
    """
    Compute numerical approximation using trapezoidal rule in 
    an interval.
    Nodes are generated via formula: x_i = a+(i+1/2)h_hat for i=0,1,...,n-1 and h_hat=(b-a)/n
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Tcf (float) 
    """
    cdef unsigned int i
    cdef double h=b-a,sum_res=0
    for i in range(1,n):
        sum_res+=math.exp(-(i/n)**2)
    return h/(2*n)*(math.exp(-a**2)+math.exp(-b**2)+2*sum_res)

<img src="https://dl.dropboxusercontent.com/s/btfls8yaaz6xxw1/Tcf4.png?dl=0" heigth="1000" width="2000">



**Nota:** la imagen anterior es un screenshot que generé ejecutando la celda anterior. 

In [37]:
n=10**6
start_time = time.time()
aprox=Tcf4(0,1,n)
end_time = time.time()

In [38]:
aprox

0.7468241328123836

Y vemos que el tiempo disminuye drásticamente:

In [39]:
secs = end_time-start_time
print("Tcf4 tomó",secs,"segundos")

Tcf4 tomó 0.09252023696899414 segundos


Revisamos error relativo:

In [40]:
err_relativo(aprox,obj)

5.827441917471732e-14

Y vemos que el tiempo mejoró drásticamente con respecto a Tcf3 y la inicial:

In [41]:
%timeit -n 5 -r 10 Tcf4(0,1,n)

100 ms ± 12.4 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


In [34]:
%timeit -n 5 -r 10 Tcf3(f,0,1,n)

257 ms ± 10.3 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


In [14]:
%timeit -n 5 -r 10 Tcf_compiled.Tcf(f,0,1,n)

274 ms ± 15.3 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


# Solución para la regla de Simpson

## Usamos Cython Vía un script setup.py

1) Función a compilar en un archivo `.pyx`:

In [2]:
%%file Scf_cython.pyx
import numpy as np
def Scf(f,a,b,n): #Scf: Simpson compuesto para f
    """
    Compute numerical approximation using composed Simpson rule in 
    an interval.
    Nodes are generated via numpy
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Scf (float) 
    """
    h=b-a
    nodes=np.linspace(a,b,n+1) #nodes: array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. ])
    sum_res_par=sum(f(nodes[1:-1][1::2])) #tomamos los pares array([0.2, 0.4, 0.6, 0.8])
    sum_res_impar=sum(f(nodes[1:-1][::2])) #tomamos los impares array([0.1, 0.3, 0.5, 0.7, 0.9])
    return h/(3*n)*(f(nodes[0])+f(nodes[-1])+2*sum_res_par+4*sum_res_impar)

Writing Scf_cython.pyx


2) Archivo `setupScf.py` que contiene las instrucciones para el build:

In [3]:
%%file setup.py
from distutils.core import setup
from distutils.extension import Extension
from Cython.Distutils import build_ext
setup(cmdclass = {'build_ext': build_ext},
      ext_modules = [Extension("Scf_compiled", 
                               ["Scf_cython.pyx"])]
     )

Writing setup.py


Compilar desde la línea de comandos:

In [4]:
%%bash
python3 setup.py build_ext --inplace

running build_ext
cythoning Scf_cython.pyx to Scf_cython.c
building 'Scf_compiled' extension
creating build
creating build/temp.linux-x86_64-3.6
x86_64-linux-gnu-gcc -pthread -DNDEBUG -g -fwrapv -O2 -Wall -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -fPIC -I/usr/include/python3.6m -c Scf_cython.c -o build/temp.linux-x86_64-3.6/Scf_cython.o
x86_64-linux-gnu-gcc -pthread -shared -Wl,-O1 -Wl,-Bsymbolic-functions -Wl,-Bsymbolic-functions -Wl,-z,relro -Wl,-Bsymbolic-functions -Wl,-z,relro -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 build/temp.linux-x86_64-3.6/Scf_cython.o -o /home/jovyan/ejercicios-perfilamiento-y-compilacion-gzarazua/Scf_compiled.cpython-36m-x86_64-linux-gnu.so


  tree = Parsing.p_module(s, pxd, full_module_name)


In [5]:
f=lambda x: np.exp(-x**2) #using numpy library

In [7]:
import Scf_compiled

In [8]:
n=10**6
start_time = time.time()
aprox=Scf_compiled.Scf(f,0,1,n)
end_time = time.time()

In [9]:
aprox

0.7468241328124223

In [10]:
secs = end_time-start_time
print("Scf tomó",secs,"segundos" )

Scf tomó 0.31358885765075684 segundos


Ahora revisamos el error relativo:

In [11]:
def err_relativo(aprox, obj):
    return math.fabs(aprox-obj)/math.fabs(obj) #obsérvese el uso de la librería math

In [12]:
obj, err = quad(f, 0, 1)
err_relativo(aprox,obj)

6.392347001308277e-15

In [13]:
%timeit -n 5 -r 10 Scf_compiled.Scf(f,0,1,n)

272 ms ± 16.4 ms per loop (mean ± std. dev. of 10 runs, 5 loops each)


In [14]:
%%file Scf_cython2.pyx
import numpy as np
def Scf(f,a,b,n): #Scf: Simpson compuesto para f
    """
    Compute numerical approximation using composed Simpson rule in 
    an interval.
    Nodes are generated via numpy
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Scf (float) 
    """
    h=b-a
    nodes=np.linspace(a,b,n+1) #nodes: array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. ])
    sum_res_par=sum(f(nodes[1:-1][1::2])) #tomamos los pares array([0.2, 0.4, 0.6, 0.8])
    sum_res_impar=sum(f(nodes[1:-1][::2])) #tomamos los impares array([0.1, 0.3, 0.5, 0.7, 0.9])
    return h/(3*n)*(f(nodes[0])+f(nodes[-1])+2*sum_res_par+4*sum_res_impar)

Writing Scf_cython2.pyx


In [15]:
%%file setup2.py
from distutils.core import setup
from Cython.Build import cythonize

setup(ext_modules = cythonize("Scf_cython2.pyx", 
                              compiler_directives={'language_level' : 3})
     )

Writing setup2.py


In [16]:
%%bash
python3 setup2.py build_ext --inplace

Compiling Scf_cython2.pyx because it changed.
[1/1] Cythonizing Scf_cython2.pyx
running build_ext
building 'Scf_cython2' extension
x86_64-linux-gnu-gcc -pthread -DNDEBUG -g -fwrapv -O2 -Wall -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -fPIC -I/usr/include/python3.6m -c Scf_cython2.c -o build/temp.linux-x86_64-3.6/Scf_cython2.o
x86_64-linux-gnu-gcc -pthread -shared -Wl,-O1 -Wl,-Bsymbolic-functions -Wl,-Bsymbolic-functions -Wl,-z,relro -Wl,-Bsymbolic-functions -Wl,-z,relro -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 build/temp.linux-x86_64-3.6/Scf_cython2.o -o /home/jovyan/ejercicios-perfilamiento-y-compilacion-gzarazua/Scf_cython2.cpython-36m-x86_64-linux-gnu.so


In [17]:
import Scf_cython2

In [18]:
n=10**6
start_time = time.time()
aprox=Scf_cython2.Scf(f,0,1,n)
end_time = time.time()

In [19]:
aprox

0.7468241328124223

Y vemos que el tiempo baja:

In [20]:
secs = end_time-start_time
print("Scf tomó",secs,"segundos" )

Scf tomó 0.27831411361694336 segundos


Checamos que el error relativo no se deteriora

In [21]:
err_relativo(aprox,obj)

6.392347001308277e-15

# Ahora usamos Cython Annotations para analizar un bloque de código

## Vía línea de comando:

In [22]:
%%bash
$HOME/.local/bin/cython -a Scf_cython.pyx

  tree = Parsing.p_module(s, pxd, full_module_name)


## Vía comando de magic y flag `-a`:

Intentamos bajar el tiempo definiendo los tipos de variables: 

In [23]:
%load_ext Cython

In [25]:
%%cython -a
import numpy as np
def Scf2(f,double a,double b,unsigned int n): #Scf: Simpson compuesto para f
    """
    Compute numerical approximation using composed Simpson rule in 
    an interval.
    Nodes are generated via numpy
    Args:
        f (lambda expression): lambda expression of integrand
        a (int): left point of interval
        b (int): right point of interval
        n (int): number of subintervals
    Returns:
        Scf (float) 
    """
    cdef double h
    h=b-a
    nodes=np.linspace(a,b,n+1) #nodes: array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. ])
    sum_res_par=sum(f(nodes[1:-1][1::2])) #tomamos los pares array([0.2, 0.4, 0.6, 0.8])
    sum_res_impar=sum(f(nodes[1:-1][::2])) #tomamos los impares array([0.1, 0.3, 0.5, 0.7, 0.9])
    return h/(3*n)*(f(nodes[0])+f(nodes[-1])+2*sum_res_par+4*sum_res_impar)

**Nota:** la imagen anterior es un screenshot que generé ejecutando la celda anterior. 

In [26]:
n=10**6
start_time = time.time()
aprox=Scf2(f,0,1,n)
end_time = time.time()

In [27]:
aprox

0.7468241328124223

In [39]:
secs = end_time-start_time
print("Scf2 tomó",secs,"segundos" )

Scf2 tomó 0.2819342613220215 segundos


**Referencias**

1. M. Gorelick, I. Ozsvald, High Performance Python, O'Reilly Media, 2014.


Otras referencias:

* http://okigiveup.net/an-introduction-to-cython/