# M1SD TP01 Performance Python

## Exercice 1 produit terme à terme

In [1]:
import numpy as np
import random as rd
from numba import jit
from numba import vectorize, float64

La fonction `prod_1` calcul terme à terme le produit de deux listes python à l'aide de la méthode standard `zip`.

In [13]:
def prod_1(tabx, taby):
    '''
    input : tabx et taby deux iterables sur des valeurs numeriques
    output : res liste des produits terme a terme de tabx et taby
    '''
    res = [a * b for a,b in zip(tabx, taby)]
    return res

Les listes `l_A` et `l_B` contiennent chacune 1 000 000 valeurs numériques générées aléatoirement.

In [3]:
l_A = [rd.random() for i in range(1_000_000)]
l_B = [rd.random() for i in range(1_000_000)]

1. Mesurer le temps de restitution de l'exécution de `prod_1` sur `l_A`et `l_B`

In [14]:
%timeit prod_1(l_A,l_B)

# %time calcule le temp une fois
# %timeit exécute le code plusieurs fois et donne le temp moyen

62.5 ms ± 896 μs per loop (mean ± std. dev. of 7 runs, 10 loops each)


2. Créer les numpy array `v_A` et `v_B` correspondant respectivement aux liste `l_A` et `l_B` et mesurer les temps de restitution de prod_1 sur `v_A` et `v_B`

In [6]:
v_A = np.array(l_A)
v_B = np.array(l_B)

%timeit prod_1(v_A,v_B)

# On voit que le temps d'exécution avec le tableau numpy était plus long, 
# probablement parce qu'il utilise un calcul natif avec une bibliothèque externe

142 ms ± 681 μs per loop (mean ± std. dev. of 7 runs, 10 loops each)


3. Mesurer le temps de restitution du produit scalaire natif de numpy sur `v_A` et `v_B`

In [None]:
%timeit v_A*v_B

# En utilisant uniquement Numpy, le résultat du calcul est beaucoup plus efficace

2.16 ms ± 74 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


4. Utiliser `numba` pour compiler `prod_1` à la volée

In [7]:
@jit
def prod_1(tabx, taby):
    '''
    input : tabx et taby deux iterables sur des valeurs numeriques
    output : res liste des produits terme a terme de tabx et taby
    '''
    res = [a * b for a,b in zip(tabx, taby)]
    return res

# objectif de jit : convertir la fonction python en langage machine pour travailler 
# plus efficacement
# jit teste la conversion et, en cas d'échec, calcul avec python
# njit teste la conversion et, en cas d'échec, affiche un message d'erreur

5. Mesurer les temps de restitution de cette première version (attention au temps de génération du code) sur `l_A` et `l_B` puis sur `v_A` et `v_B`.

In [9]:
%timeit prod_1(l_A,l_B)

%timeit prod_1(v_A,v_B)

# Après avoir compilé la fonction, le résultat avec les listes était plus lent
# Cependant, le calcul de la fonction utilisant des tableaux était plus rapide

1.51 s ± 5.06 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
31.1 ms ± 1.2 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


6. Utiliser numba pour faire de `prod_1` une Ufunc

In [10]:
@vectorize([float64(float64, float64)])
def prod_1(a, b):
    '''
    input : tabx et taby deux iterables sur des valeurs numeriques
    output : res liste des produits terme a terme de tabx et taby
    '''
    # res = [a * b for a,b in zip(tabx, taby)]
    return a*b

# Il a fallu changer la fonction pour qu'elle fonctionne uniquement avec des scalaires

7. Mesurer les temps de restitution de cette nouvelle version  sur `v_A` et `v_B`.

In [12]:
%timeit prod_1(v_A,v_B)

# La vectorisation a rendu le calcul de la fonction avec des tableaux aussi 
# efficace que le calcul utilisant le produit scalaire natif de Numpy

2.2 ms ± 100 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)
