<!-- dom:TITLE: Chapitre 4 : Complexité algorithmique -->
# Chapitre 4 : Complexité algorithmique
<!-- dom:AUTHOR: Ahmed Ammar at Institut Préparatoire aux Études Scientifiques et Techniques, Université de Carthage. -->
<!-- Author: -->  
**Ahmed Ammar**, Institut Préparatoire aux Études Scientifiques et Techniques, Université de Carthage.


Date: **Jan 8, 2021**

<!-- TOC: on -->

In [65]:
from time import time 
# sinon "from time import clock" pour certeines versions Python
print(time())

1610377020.0772257


# Introduction

**Exercice :** Écrire en python une fonction qui prend en argument une chaîne de caractères et détermine si le caractère 'a' est présent dans la chaîne (on retourne soit `True` soit `False`).

Analysons plusieurs solutions :

1. Première solution :

In [63]:
def contienta1(chaine) :
    k=0
    N = len(chaine)
    result = False
    while (result == False and k < N):
        if chaine[k] == 'a' :
            result = True
        k=k+1
    return result

In [66]:
t1 = time()
print(contienta1("ahmed"))
t2 = time()
print(t2 - t1)


True
0.0012042522430419922


2. Deuxième solution :

In [17]:
def contienta2(chaine) :
    for i in range(len(chaine)):
        if chaine[i] == 'a' :
            return True
    return False

In [67]:
t1 = time()
print(contienta2("ahmed"))
t2 = time()
print(t2 - t1)


True
0.0036509037017822266


3. Troisième solution :

In [19]:
def contienta3(chaine) :
    n = chaine.count('a')
    return bool(n)

In [68]:
t1 = time()
print(contienta3("ahmed"))
t2 = time()
print(t2 - t1)


True
0.004728794097900391


4. Quatrième solution :

In [36]:
def contienta4(chaine) :
    return ('a' in chaine)

In [74]:
t1 = time()
print(contienta4("ahmed"))
t2 = time()
print(t2 - t1)


True
0.0007836818695068359


**Quelques questions :**

* que remarquez vous concernant cet exercice ?

* Le code le plus court ! Est-il meilleur ?

* Comment peut-on désigner le meilleur code parmi ces quatre solutions ?

**Définition :**

* La complexité d’un problème mathématique $P$ est une mesure de la quantité de ressources nécessaires à la résolution du problème $P$.

* Cette mesure est basée sur une estimation du nombre d’opérations de base effectuées par l’algorithme en fonction de la taille des données en entrée de l’algorithme.

* Généralement, pour le même problème P, on peut trouver plusieurs algorithmes ($Alg_1$ , $Alg_2$ , .., $Alg_n$).

* L’objectif de la complexité est d’évaluer **le coût d’exécution** de chaque algorithme afin de choisir le meilleur.

# Calcul du coût
Le temps d’exécution d’un programme **dépend fortement** de la machine qui l’exécute, du langage dans lequel il est écrit et de l’algorithme sous-jacent. Pour des données de grandes tailles, l’algorithme est la cause déterminante du temps d’exécution d’un programme. Des méthodes rationnelles permettent de calculer le coût d’un programme exprimé en nombre d’opérations élémentaires exécutées par la machine afin d’obtenir le résultat final. Généralement, ce nombre est fonction de la taille $n$ des données à traiter.

Le coût se calcule comme suit :
* Coût d’une opération élémentaire $op = 1$;

* Coût d'une séquence de $k$ instructions $p_1$ ; $p_2$ ; ... $p_k = \sum_{i = 1}^{k} coût(p_i)$ ;

* Coût d'une structure conditionnelle simple `if c: p else : q` <= $coût(c) + max(coût(q),coût(p))$;

* Coût d'une structure conditionnelle complète `if c_1: p_1 elif c_2 : p_2 ... elif c_k : p_k else : p_k+1` = $(\sum_{i = 1}^k coût(c_i)) + \max\limits_{1 \le i \le k+1} coût(p_i)$;

* Coût d'une boucle `for i in iterable : p_i` = $\sum_{i \in iterable} coût(pi)$;

* Coût d'une boucle `while c : p` est le plus difficile à exprimer (*nombre d'itérations non connu à priori*) $\rightarrow$ **majorer** le nombre de répétitions $\rightarrow$  $NombreRépétitions*(coût(c)+ coût(p)) + 1 * coût(c)$.

**Exemple : Calcul $x^n$ :**

* Approche naïve :

In [7]:
def puiss1(x,n):
    r = 1                  # 1 affectation
    for i in range(n):     # n affectations
        r *= x             # 1 affectation + 1 multiplication
    return r               # 1 retour

Le Coût total = f(n) = 2n + 2.

* Exponentiation rapide :

In [8]:
def puiss2(x,n):
    r= 1                # 1 affectation
    u= x                # 1 affectation
    while n != 0:       # (int(log2(n)) + 1) comparaisons
        if n % 2 == 1:  # 2 = modulo + comparaison
            r*= u       # 2 = multiplication + affectation
        u*= u           # 2 = multiplication + affectation
        n//= 2          # 2 = division + affectation
    return r            # 1 retour

Le Coût total = f(n) = 9 E[log2(n)]+ 3.

# Complexité asymptotique
La complexité asymptotique consiste à estimer l’ordre de grandeur du nombre d’opérations effectuées par un programme sans effectuer un décomptage minutieux. Cette complexité est exprimée en **Grand-O** (notation de Landau).

Soit $f$, $g$ : $\mathbb{N} \rightarrow \mathbb{R}_+^*$  deux fonctions. $f(n)$ est dite $O(g(n)) \Rightarrow f$ est dominée par $g$ quand $n \rightarrow + \infty$.

* $f(n)$ est $O(g(n))$ et $c$ une constante, alors :

 * $c + f(n)$ est aussi $O(g(n))$;

 * $c \times f(n)$ est aussi $O(g(n))$.

 * Les facteurs constants sont ignorés dans le calcul de la complexité asymptotique.


* $f_1(n)$ est $O(g_1(n))$ et $f_2(n)$ est $O(g_2(n))$, alors :

 * $f_1(n)$ + $f_2(n)$ est $O(g_1(n) + g_2(n))$;

 * $f_1(n) \times f_2(n)$ est $O(g_1(n) \times g_2(n))$.


* $f_1(n)$ est $O(f_2(n))$ et $f_2(n)$ est $O(f_3(n))$ , alors :

 * $f_1(n)$ est $O(f_3(n))$.


# Classes de complexité asymptotique

<!-- dom:FIGURE:[figures/table.png, width=700 frac=0.9] -->
<!-- begin figure -->

<p></p>
<img src="figures/table.png" width=700>

<!-- end figure -->


**Exemples :**

* $4*n + 100000000$ est $O(n)$.

* $100*n^2 + n^{10} + 300000*n$ est $O(n^{10})$.

* $2^n +n^{1000000} $ est $O(2^n)$.

* $2^n + n!$ est $O(n!)$.