# Accelerant el càlcul científic

## Vectoritzant càlculs

Existeixen version vectoritzades de moltes funcions a la llibreria *numpy*. La idea es fer de cop la mateixa operació a tots els elements d'un vector de dades. Veiem un exemple del llibre *Programming for Computations - Python* de S. Linge and H.P. Langtangen. El codi utilitzat al llibre el teniu disponible a https://github.com/slgit/prog4comp_2:

In [6]:
import timeit
from integration_methods_vec import midpoint as midpoint_vec
from midpoint import midpoint
from numpy import exp
v = lambda t: 3*t**2*exp(t**3)

In [9]:
t = timeit.Timer('midpoint(v, 0, 1, 1000000)', \
setup='from __main__ import midpoint, v')
time_midpoint = t.timeit(10)
print('Time, midpoint: {:g} seconds'.format(time_midpoint))

Time, midpoint: 38.7778 seconds


In [12]:
t = timeit.Timer('midpoint_vec(v, 0, 1, 1000000)', \
setup='from __main__ import midpoint_vec, v')
time_midpoint_vec = t.timeit(10)
print('Time, midpoint vec: {:g} seconds'.format(time_midpoint_vec))
print('Efficiency factor: {:g}'.format(time_midpoint/time_midpoint_vec))

Time, midpoint vec: 1.81642 seconds
Efficiency factor: 21.3484


Com veieu vectoritzat el programa va 20 vegades més ràpid. Veiem en detall els canvis:

A la versió no vectoritzada de la funció (a l'arxiu *midpoint.py*) el que fem és un bucle per tots els elements del vector de dades:

```python
def midpoint(f, a, b, n):
    h = (b-a)/n
    f_sum = 0
    for i in range(0, n, 1):
        x = (a + h/2.0) + i*h
        f_sum = f_sum + f(x)
    return h*f_sum
	
```

A la versió vectoritzada de la funció (a l'arxiu *integration_methods_vec.py*) el que fem és operar de cop sobre tots els elements del vector de dades:
```python
from numpy import linspace, sum

def midpoint(f, a, b, n):
    h = (b-a)/n
    x = linspace(a + h/2, b - h/2, n)
    return h*sum(f(x))
```

## Utilitzant *Cython*

A *Jupyter Notebook Tricks for Data Science that Enhance your efficiency*, disponible a https://codeburst.io/jupyter-notebook-tricks-for-data-science-that-enhance-your-efficiency-95f98d3adee4, veiem un exemple de com utilitzar *Cython* per accelerar el càlcul a *jupyter* compilant una versió en llenguatge C de les funcions que més temps triguen en executar-se:

In [18]:
def fib1(n):
    a, b = 0,1
    while b < n:
        a, b = b, a + b

In [20]:
%load_ext Cython

In [21]:
%%cython
def fib2(n):
    a, b = 0,1
    while b < n:
        a, b = b, a + b

In [22]:
%timeit fib1(1000)
%timeit fib2(1000)

2.64 µs ± 9.78 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
1.01 µs ± 9.76 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


Hem reduit el temps a un 40% només afegint la paraula clau `%%cython`, que fa que la cel·la sigui traduïda i compilada amb el llenguatge C. 

Si coneixem aquest llenguatge podem modificar una mica la funció per que la traducció al llenguatge C sigui més natural, explicitant els tipus de variable i evitant operacions alienes al llenguatge C:

In [23]:
%%cython
def fib3(int n):
    cdef int b = 1
    cdef int a = 0
    cdef int t = 0
    while b < n:
        t = a
        a = b
        b = t + b

In [24]:
%timeit fib3(1000)

109 ns ± 0.0403 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


Ara la reducció respecte al programa original és brutal! Va 27 vegades més ràpid!

## Utilitzar un petit cluster d'ordinadors per fer computació paral·lela

Podem trobar a la Internet molts projectes que utilitzen diferents ordinadors per formar un *cluster* de computació en paral·lel, fins-i-tot amb Raspberry Pi (veure, per exemple, https://projects.raspberrypi.org/en/projects/build-an-octapi).

Jo mateix em trobo desenvolupant un petit cluster de vuit Orange Pi One, encara més barates que les Raspberry Pi i igual de potents. Quan el projecte estigui acabat afegiré la documentació i les meves conclusions. Només us puc dir que, per ara, les proves són molt satisfactòries, tenin en compte que la despesa és inferior als 200 €.

In [1]:
from IPython.display import FileLink, FileLinks
FileLinks('.', recursive=False)