# TP Complexité algorithmique

**Objectif :** Dans ce TP, vous allez vérifier exprimentalement les complexités que vous avez abordées dans la leçon.

Pour cela vous allez mesurer des temps d'exécution de divers algorithmes.  
Il va falloir observer le temps d'exécution en fonction de la taille des données en entrée.

## Mesurer le temps d'éxécution d'une portion de code.

La librairie `timeit` permet de mesurer le temps d'exécution d'un code Python. Pour cela, le code doit être répété un grand nombre de fois pour avoir une mesure pertinente. C'est ce que fait la librairie timeit: répéter le code pour mesurer son temps d'exécution

Le premier argument est le fragment de code dont on mesure le temps.
Le deuxième argument : `setup` est un fragment de code exécuté une seule fois.
`t.repeat(repeat=1000,number=1)` est la répétition du code spécifié dans `Timer`, le code est éxécuté repeat (ici 1000) fois.

Nous prendrons la valeur minimale des temps obtenus


In [5]:
import timeit
t=timeit.Timer('sin(1.2)',setup='from math import sin')
min(t.repeat(repeat=1000,number=1))

#répète sin(1.2) 1000 fois et prend le plus petit temps d'execution

1.5500000927204383e-07

In [6]:
# On peut vérifier que passer à 10000 exécution ne change pas *beaucoup* le temps d'exécution moyen.
t=timeit.Timer('sin(1.2)',setup='from math import sin')
#CODE A COMPLETER
min(t.repeat(repeat=10000,number=1))
#répète sin(1.2) 10000 fois et prend le plus petit temps d'execution

1.549999808503344e-07

Testons la vitesse de la fonction `max` qui renvoie le maximum d'une liste.   
Dans la cellule ci-dessous, vous allez afficher le temps mis par la fonction `max` sur une liste de 50 nombres aléatoires.  

Puis dans la cellule suivante, afficher le temps mis par la fonction `max` sur une liste de 500 nombres aléatoires.  

In [12]:
# on configure la liste utilisée (ce code sera exécuté une seule fois.)
setup = '''
from random import randint
L = [randint(1,50) for i in range(50)]
'''
# Mesure du temps
t=timeit.Timer('max(L)',setup=setup)
temps = min(t.repeat(repeat=10000,number=1))
print(temps)

1.0379999935139494e-06


In [11]:
# Compléter cette cellule pour afficher le temps d'éxécution sur une liste de 500 éléments.

setup = '''
from random import randint
L = [randint(1,50) for i in range(500)]
'''
# Mesure du temps
t=timeit.Timer('max(L)',setup=setup)
temps = min(t.repeat(repeat=10000,number=1))
print(temps)

8.143000002291956e-06


Lors du passage d'une liste de 50 éléments à 500 éléments, le temps à été multiplié par **Votre réponse ici**  
Expliquez ci-dessous pourquoi c'est cohérent avec le cours.  
**Votre réponse ici**

## Mesurer le temps d'une fonction à plusieurs paramètres.

Pour mesurer le temps d'exécution d'une `fonction` `f` il faut la passer en argument à Timer avec ses arguments.

Il y a plusieurs méthodes. La plus simple est de faire appel à la méthode partial de la librairie de programmation fonctionnelle functools qui permet de transformer la fonction f et ses paramètres en une nouvelle fonction avec moins de paramètres.

Dans l'exemple, on transforme l'addition en une addition avec la constante 2.

In [None]:
from functools import partial
def addition(x,y):
    return x+y

add2=partial(addition,2)
##add2 est une fonction d'un seul paramètre.
print(add2(4))

Au moyen de partial, on peut fournir une fonction à Timer.
On construit alors une liste des mesures du temps d'exécution.

In [None]:
# On va stocker les temps d'exécution dans la liste temps
temps = []
for i in range(5):
    # Pour chaque valeur i de 0 à 4 on exécute add2(i) puis on mesure le temps moyen d'exécution
    mesure=timeit.Timer(partial(add2,i))
    t=min(mesure.repeat(repeat=10000,number=1))
    # on ajoute ce temps à la liste temps
    temps.append(t)

print(temps)
# Constatez ci-dessous que la liste temps est constituée de 5 temps d'exécution relativements proches.

## Application au calcul de moyenne.

Ci dessous, compléter le code de la fonction moyenne


In [None]:
def moyenne(L):
    """
    Entrée : L liste de flottants
    Sortie : un flottant qui est la moyenne de la liste L
    """
    # Votre code ici

In [None]:
# Tests de la fonction moyenne
assert moyenne([1,2,3,4]) == 2.5
assert moyenne([1,2,3,4,5,6]) == 3.5

On construit une liste `L` de 100 entiers tirés au hasard entre 1 et 10 000 :

In [None]:
from random import randint
# Première mesure avec une liste de taille 100
L = [randint(1,10001) for i in range(100)]
mesure=timeit.Timer(partial(moyenne,L))
t=min(mesure.repeat(repeat=10000,number=1))
print(t)

# Seconde mesure avec une liste de taille 1000
###################
# Votre code ici
###################

# Troisième mesure avec une liste de taille 10000
###################
# Votre code ici  #
###################

9.999894245993346e-08


Codez la fonction `randlist` ayant :
- en entrée : un entier $n$;
- en sortie : une liste de taille $n$ constitués d'entier aléatoires entre 1 et 100.

On rappelle que `randint(a,b)`renvoie un entier aléatoire entre $a$ et $b$.

In [None]:
def randlist(n):
    ###################
    # Votre code ici  #
    ###################

SyntaxError: unexpected EOF while parsing (<ipython-input-50-a580a6eea595>, line 4)

Ci-dessous, nous allons contituer deux listes `x` et `y` contenant respectivement :
- la taille des données en entrée (ici la longueur de la liste);
- le temps d'exécution de la fonction `moyenne` sur ces entrées.

Prennez le temps de chercher à comprendre ce que font chaques instructions avant d'exécuter le code.

In [None]:
x,y=[],[]
for i in range(1,1000,10):
    mesure=timeit.Timer(partial(moyenne,randlist(i)))
    t = min(mesure.repeat(repeat=100,number=1))
    x.append(i)
    y.append(t)

# Combien de fois la fonction moyenne est-elle appelée dans un tour de boucle
# Réponse : 100 (repeat)

Et ci-dessous, voici le code permettant d'afficher la courbe de y en fonction de x, c'est à dire le temps d'exécution en fonction de la taille des entrées.

Le code n'est pas à savoir reproduire à partir de rien, mais il faudra sans doute l'adapter à d'autre exemples par la suite de ce TP. Donc prennez le temps de chercher à comprendre les instructions.

In [13]:
# Exécutez deux fois cette cellule si le graphique ne s'affiche pas.
import matplotlib.pyplot as plt
plt.rcParams.update({'font.size': 12})
fig = plt.figure(figsize=(10, 10))
plt.plot(x,y,marker='o',label = 'Moyenne de liste')
plt.xlabel('taille n')
plt.ylabel('temps de calcul en secondes [s]')
plt.legend(loc='upper left')
plt.grid()
plt.show()

NameError: name 'x' is not defined

<Figure size 1000x1000 with 0 Axes>

Complétez :

On constate que la représentation graphique est **Votre réponse ici**

Expliquez en quoi cela est cohérent avec le cours.

**Votre réponse ici**

## Parcours séquentielle d'une liste de liste



Dans cette partie, vous allez analyser la vitesse d'exécution d'un code qui parcours une liste de liste.

Codez,ci-dessous, une fonction `randlistlist` ayant :
- en entrée : un entier $n$;
- en sortie : une liste de liste de taille $n \times n$ constitués d'entier aléatoires entre 1 et 100.

In [None]:
def randlistlist(n):
    ###################
    # Votre code ici  #
    ###################

In [None]:
t = randlistlist(10)
assert (len(t),len(t[0])) == (10,10)

Codez,ci-dessous, une fonction `double` ayant :
- en entrée : une liste L de liste de taille $n \times n$;
- en sortie : une liste de liste de taille $n \times n$ constitués des doubles des éléments de L .

In [None]:
def double(L):
    """
    L est une liste de liste d'entiers
    """
    ###################
    # Votre code ici  #
    ###################

In [None]:
L = [[1,2],[3,4],[5,6]]
assert double(L) == [[2,4],[6,8],[10,12]]

Ci-dessous, nous allons contituer deux listes x et y contenant respectivement :
- la taille des données en entrée ;
- le temps d'exécution de la fonction `double` sur ces entrées.

Prennez le temps de chercher à comprendre ce que font chaques instructions avant d'exécuter le code.


In [None]:
x,y=[],[]
for i in range(1,100,10):
    mesure=timeit.Timer(partial(double,randlistlist(i)))
    t=min(mesure.repeat(repeat=100,number=1))
    x.append(i)
    y.append(t)

In [None]:
import matplotlib.pyplot as plt
plt.rcParams.update({'font.size': 12})
fig = plt.figure(figsize=(10, 10))
plt.plot(x,y,marker='o',label = 'Parcours de listes de listes')
plt.xlabel('taille n')
plt.ylabel('temps de calcul en secondes [s]')
plt.legend(loc='upper left')
plt.grid()
plt.show()

Complétez :

On constate que la représentation graphique est **Votre réponse ici**

Expliquez en quoi cela est cohérent avec le cours.

**Votre réponse ici**

## Algorithmes de recherche dans une liste triée.

Dans cette partie, nous allons comparer des algorithmes de recherche dans des listes.
Un algorithme "naïf" et l'algorithme de dichotomie.

### Algorithme naïf

Codez,ci-dessous, une fonction `gene_liste_triee` ayant :
- en entrée : un entier $n$ positif;
- en sortie : une liste de taille $n$ de nombres aléatoire (entre 1 et 100) **triée dans l'odre croissant**.

Le code `L.sort()` permet de trier une liste L en place (c'est à dire que L sera triée sans avoir besoin de réaliser une affectation).

In [None]:
def gene_liste_triee(n :int):
    """
    Entrée : n est un entier, c'est la taille de la liste en sortie
    Sortie : L est une liste d'entiers positifs triée par ordre croissant.
    """
    ###################
    # Votre code ici  #
    ###################

Codez,ci-dessous, une fonction `recherche_naif` ayant :
- en entrée : une liste $L$ de taille $n$ triée dans l'ordre croissant et $c$ un entier.
- en sortie : un booléen indiquant l'élément $c$ est dans la liste $L$.

In [None]:
def recherche_naif(L,c):
    """
    Entrée : L est une liste d'entiers positifs triée par ordre croissant et c est un entier
    Sortie : un booléen qui indique si c est dans la liste L
    """
    ###################
    # Votre code ici  #
    ###################

Ci dessous, codez l'algorithme de recherche dichotomique comme vu en cours.

In [None]:
def recherche_dichotomique(L : list,c : float):
    """
    L est une liste triée dans l'odre croissant
    Retourne un booléen indiquant si l'élément c est dans la liste L
    """
    ###################
    # Votre code ici  #
    ###################

In [None]:
L = [2,3,5,7,11,13,17,19,23]
assert recherche_naif(L,23) == True
assert recherche_naif(L,25) == False
assert recherche_naif(L,0) == False

In [None]:
L = [2,3,5,7,11,13,17,19,23]
assert recherche_dichotomique(L,23) == True
assert recherche_dichotomique(L,25) == False
assert recherche_dichotomique(L,0) == False

Ci-dessous, nous allons contituer deux listes x et y contenant respectivement :
- la taille des données en entrée (ici la longueur de la liste;
- le temps d'exécution de la fonction `recherche_naif` sur ces entrées.

Prennez le temps de chercher à comprendre ce que font chaques instructions avant d'exécuter le code.


In [None]:
x,y=[],[]
for i in range(1,1000,10):
    mesure=timeit.Timer(partial(recherche_naif,gene_liste_triee(i),42))
    t=min(mesure.repeat(repeat=100,number=1))
    x.append(i)
    y.append(t)

In [None]:
plt.rcParams.update({'font.size': 12})
fig = plt.figure(figsize=(10, 10))
plt.plot(x,y,'-bo',label = 'Recherche naïve')
plt.xlabel('taille n')
plt.ylabel('temps de calcul en secondes [s]')
plt.legend(loc='upper left')
plt.grid()
plt.show()

Ci-dessous, nous allons contituer deux listes x et **z** contenant respectivement :
- la taille des données en entrée (ici la longueur de la liste);
- le temps d'exécution de la fonction `recherche_dichotomique` sur ces entrées.

Prennez le temps de chercher à comprendre ce que font chaques instructions avant d'exécuter le code.


In [None]:
x,z=[],[]
for i in range(1,1000,10):
    testTimer=timeit.Timer(partial(recherche_dichotomique,gene_liste_triee(i),42))
    t=min(testTimer.repeat(repeat=10000, number=1))
    x.append(i)
    z.append(t)

In [None]:
plt.rcParams.update({'font.size': 12})
fig = plt.figure(figsize=(10, 10))
plt.plot(x,z,'-ro',label = 'Recherche dichotomique')
plt.xlabel('taille n')
plt.ylabel('temps de calcul en secondes [s]')
plt.legend(loc='upper left')
plt.grid()
plt.show()

Et enfin, affichons le temps d'exécution sur un même graphique.

In [None]:
plt.rcParams.update({'font.size': 12})
fig = plt.figure(figsize=(10, 10))
plt.plot(x,y,'--bo',label = 'Recherche naïve')
plt.plot(x,z,'--ro',label = 'Recherche dichotomique')
plt.xlabel('taille n')
plt.ylabel('temps de calcul en secondes [s]')
plt.legend(loc='upper left')
plt.grid()
plt.show()

Que constatez vous ? Est ce cohérent avec la leçon, pourquoi ?

**Votre réponse ici**

## Pour les plus rapides :

Codez,ci-dessous, une fonction `tri_perso` ayant :
- en entrée : une liste L de taille $n$ constituée d'entiers positifs;
- en sortie : la liste L triée par ordre croissant.

Puis, en vous inspirant des parties précédentes, mesure le temps d'exécution en fonction de la taille de la liste.

Afficher le graphique temps d'exécution en fonction de la taille de la liste

En déduire la compléxité de votre algorithme, puis prouvez le.