##### Dichotomie et complexité 

# Activité débranchée : jeu du nombre mystère

**Objectif du jeu** : trouver avec le moins de questions possibles, le nombre mystère choisi par son partenaire.

**Mise en place** :
- Se mettre en binôme
- S'asseoir dos à dos
- Prendre une fiche "number hunt"(sorted).
- Choisir un nombre à faire deviner et le noter sur la fiche
- Noter le nombre à chercher sur la fiche.
- A tour de rôle :
    * demander : Quel est le nombre de la case ( à définir) ? par exemple "quel est le nombre de la case cercle en pointillé" ?
    * noter la réponse
- Continuer jusqu'à ce que chaque personne ait trouvé sa solution.
- Noter le nombre de questions posées.

**Mise en commun** :
Chaque fiche contenait une liste de 31 nombres.   
Parmi les élèves de la classe, 
- Combien a-t-il fallu de questions en moyenne pour trouver la bonne réponse ?
- Quelle est la technique pour poser le moins de questions possibles ?
- Cette technique s'applique-t-elle si la liste des nombres n'est pas triée en ordre croissant ?
- Cette technique s'applique-t-elle si la liste des nombres est triée en ordre décroissant ?
- Combien faudrait-il de questions en moyenne pour une liste de 62 nombres ?

# Définitions

## Dichotomie

Le mot dichotomie vient du grec ancien διχοτομία, dikhotomia (« division en deux parties »).

## Recherche dichotomique

En algorithmique, la méthode de dichotomie fait partie des méthodes dites 
[*diviser pour régner*](https://fr.wikipedia.org/wiki/Diviser_pour_r%C3%A9gner_(informatique)) .  (en anglais "divide and conquer").  
Le principe de la recherche dichotomique (en anglais "binary search") est la généralisation du jeu précédent.  
L'objectif est de définir un algorithme de recherche efficace d'une valeur cible (arbitrairement choisie à l'avance) présente dans cette **liste triée**.  

<span style = "border: solid red;"> Attention ! La recherche dichotomique ne fonctionne que sur une liste **TRIEE**.</span>

# Algorithme de la recherche dichotomique

Pour trouver une valeur cible dans une **liste triée** :

- On se place au milieu de la liste.
- On regarde si la valeur sur laquelle on est placée est inférieure ou supérieure à la valeur cherchée.
- On ne considère maintenant que la bonne moitié de la liste qui nous intéresse.
- On continue jusqu'à trouver la valeur cherchée (ou pas)

Comprendre le principe de la méthode de recherche dichotomique est simple mais savoir la programmer est plus difficile.  
Pour des raisons d'efficacité, nous allons garder intacte notre liste de travail et simplement faire évoluer les indices qui déterminent le début et la fin de notre liste.

## Exemple
On cherche par recherche dichotomique si la valeur 14 est dans la liste triée :  
L = [2,3,6,7,11,14,18,19,24]

**1er cas : Si l'élément recherché est bien dans la liste :**
![06_glouton-liste_dicho.svg](attachment:06_glouton-liste_dicho.svg)

On cherche par recherche dichotomique si la valeur 15 est dans la liste triée :
L = [2,3,6,7,11,14,18,19,24]

---
**2ème cas : Si l'élément recherché n'est PAS dans la liste :**
![06_glouton-absent_liste_dicho.svg](attachment:06_glouton-absent_liste_dicho.svg)

# Applications
## Recherche d'appartenance

Compléter la fonction `appartient_dichotomique` qui prend en paramètre une liste Python `ma_liste` et une valeur `cible`. Cette fonction renvoie `True` si `cible` est dans `ma_liste` et `False` sinon.

In [1]:
def appartient_dichotomique(ma_liste, cible):
    indice_debut = 0
    indice_fin = len(ma_liste) - 1

    while indice_debut <= indice_fin:
        indice_centre = (indice_debut + indice_fin) // 2
        valeur_centrale = ma_liste[indice_centre]

        if valeur_centrale == cible:
            return True
        elif valeur_centrale < cible:
            indice_debut = indice_centre + 1
        else:
            indice_fin = indice_centre - 1

    return False

In [2]:
# Tests
valeurs = [2, 3, 6, 7, 11, 14, 18, 19, 24]
assert appartient_dichotomique(valeurs, 14)
assert appartient_dichotomique(valeurs, 2)
assert appartient_dichotomique(valeurs, 24)
assert not appartient_dichotomique([1, 3, 6, 9, 10], 7)
assert not appartient_dichotomique(valeurs, 2000)

Compléter le tableau d'évolution des variables pour :
`cible`= 9 et `ma_liste` = [1, 3, 6, 9]

|indice_debut|indice_fin|indice_debut < indice_fin|indice_centre|valeur_centrale|cible|
|:----------:|:--------:|:-----------------------:|:-----------:|:-------------:|:---:|
| 0 | 3 | True | 1 | 3 | 9 |
| 2 | 3 | . | 2 | . |
| . | . | . | . | . |
| . | . | . | . | . |
| . | . | . | . | . |
| . | . | . | . | . |
| . | . | . | . | . |
| . | . | . | . | . |
| . | . | . | . | . |
| . | . | . | . | . |

Compléter le tableau d'évolution des variables pour :
`cible`= 7 et `ma_liste` = [1, 3, 6, 9]

|indice_debut|indice_fin|indice_debut < indice_fin|indice_centre|valeur_centrale|cible|
|:----------:|:--------:|:-----------------------:|:-----------:|:-------------:|:---:|
| 0 | 3 | True | 1 | 3 | 7 |
| 2 | | True | 2 | 6 | |
| 3 | 2 | True | 3 | 9 | |
| | 2 | False | | | |
return False

## Recherche d'indice

Compléter la fonction `recherche_dichotomique` qui prend en paramètre une liste Python `ma_liste` et une valeur `cible`. Cette fonction renvoie son indice si `cible` est dans `ma_liste` et `None` sinon.

In [None]:
def recherche_dichotomique(ma_liste, valeur, cible) :
    indice_debut = 0
    indice_fin = len(ma_liste) - 1

    while indice_debut <= indice_fin:
        indice_centre = (indice_debut + indice_fin) // 2
        valeur_centrale = ma_liste[indice_centre]

        if valeur_centrale == cible:
            return indice_centre
        elif valeur_centrale < cible:
            indice_debut = indice_centre + 1
        else:
            indice_fin = indice_centre - 1

    return None

In [None]:
# Tests
valeurs = [2, 3, 6, 7, 11, 14, 18, 19, 24]
assert recherche_dichotomique(valeurs, 14) == 5
assert recherche_dichotomique(valeurs, 2) == 0
assert recherche_dichotomique(valeurs, 24) == 8
assert recherche_dichotomique([1, 3, 6, 9, 10], 7) is None
assert recherche_dichotomique(valeurs, 2000) is None

# Complexité

Pour traiter un même problème, il existe souvent plusieurs façons de le résoudre donc plusieurs algorithmes.  
L'étude de la complexité d'un algorithme a pour objectif de déterminer l'efficacité de l'algorithme pour le comparer aux autres.  

## Définition

Pour estimer la complexité d'un algorithme, on utilise des critères de comparaison indépendants : du langage de programmation choisi, de l'implémentation et des performances de la machine.
On peut étudier :  
- **le nombre d’opérations élémentaires effectuées** lors de son exécution. On parle alors de **complexité temporelle**,  

ou
- **la place mémoire utilisée** lors de son exécution. On parle alors de **complexité spatiale**.  

Dans la suite, on étudie seulement la complexité temporelle.

La complexité d’un algorithme se calcule en tenant compte de la taille des données d’entrée. En effet, trier une liste de 3 éléments est naturellement plus court que trier une liste de 1000 éléments. La notion de taille des données est intrinsèque au problème ́etudié. La complexité sea donc donnée en fonction de la taille *n* des données.    
Le temps d’exécution pour une entrée particulière est le nombre d’opérations ́elémentaires, ou "étapes" effectuées (nombre de comparaisons, nombre d’opérations arithmétiques, nombre d’affectations, etc.). On considère que chaque instruction a un temps d’exécution constant. Pour calculer la complexité d’un algorithme, il s’agit alors d’additionner le temps d’exécution des instructions de l’algorithme en fonction de la taille des données. On se contente d’avoir un ordre de grandeur par excès de cette complexité en considérant généralement le cas le plus défavorable.


## Exemple 
Chercher le nombre d'opérations élémentaires de cet algorithme qui recherche le minimum `mini`  dans un tableau, non vide, de longueur n.

début  
&nbsp;&nbsp;  mini ← t [0]  
&nbsp;&nbsp;  pour i allant de 1 à n  
&nbsp;&nbsp;&nbsp;&nbsp;  si t[i] < mini  
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;  mini ← t[i]  
&nbsp;&nbsp;  fin pour  
&nbsp;&nbsp;  renvoyer mini  
fin  


## Ordre de grandeur de complexité
Pour catégoriser les algorithmes nous aurons recours à des classes de complexité. Des algorithmes appartenant à
une même classe seront alors considérés comme de complexité équivalente. Cela signifiera que l’on considérera
qu’ils ont la même efficacité. (cela est approximativement vrai si on regarde les temps d’exécution pour des données de grandes tailles).
<div class="alert alert-danger"> 
Voici les catégories de complexités de référence par ordre croissant de temps d’exécution :
 <li>
    <ul>$1 $: complexité constante </ul>
    <ul>$log2(n)$ complexité logarithmique </ul>
    <ul>$n$ complexité linéaire </ul>
    <ul>$n log_2(n)$ complexité quasi-linéaire </ul>
    <ul>$n^2$ complexité quadratique </ul>
    <ul>$n^p$ avec p > 2 complexité polynomiale </ul>
    <ul>$2^n$ complexité exponentielle </ul>
    <ul>$n!$ complexité factorielle </ul>
 </li>
</div>

>Le graphe ci-dessous représente :
* en abscisse : la quantité de données à traiter (la taille de la liste à trier)
* en ordonnée : le nb d'opérations ou itérations à effectuer (donc une idée du temps d'exécution)
![comparaison_complexite.svg](attachment:comparaison_complexite.svg)

## Coût algorithmique de la dichotomie
On  considére que la complexité est due au nombre d'étapes nécessaires pour obtenir le résultat. 
Quel est le pire des cas de recherche dichotomique d'une valeur dans une liste triée ?


Combien d'étapes (au maximum) sont-elles nécessaires pour arriver à la fin de l'algorithme ?
Imaginons que la liste initiale possède 8 valeurs. Après une étape, il ne reste que 4 valeurs à traiter. Après 2 étapes, il ne reste plus  que ...


| taille de la liste     | 4 | 8 | 16 | 32 | 64 | 128 | $2^N$ |
|------------------------|---|---|----|----|----|-----|-------|
| recherche dichotomique<br>nb d'étapes | ... | 4 | .  | .  | .  | .  | . |

Une mesure de la complexité est donc le nombre $k$ tel que $2^k = n$

Nous n'allons pas rentrer dans les détails, mais il faut savoir qu'il existe une fonction mathématique (réciproque de la fonction qui à $x$ associe $2^x$ ) qui permet de résoudre ce problème :
la fonction "logarithme en base 2" notée $log_2$

>Le nombre d'itérations d'une recherche dichotomique est de l'ordre de **log<sub>2</sub>(N)** où `N = len(L)`.

<div class="alert alert-danger"> 
    <b>Le coût algorithmique de la dichotomie est logarithmique : O( log<sub>2</sub>(N) )</b>
    On rencontrera parfois la notation $O(\log_2(n))$.

Le $O$ se prononce "grand O" (la lettre)

Cette complexité est bien meilleure qu'une complexité linéaire. Le nombre d'opérations à effectuer est très peu sensible à la taille des données d'entrée, ce qui en fait un algorithme très efficace.

⚠️ 🌵 Attention cependant, n'oubliez pas que dans le cas de la recherche dichotomique, <font color="red"><b>le tableau doit être trié !</b></font>
</div>

Exécuter le code suivant.


In [3]:
from timeit import timeit

def dicho(tableau: list, x: int) -> bool :
    """
    :param tableau: une liste d'entiers triés par ordre croissant
    :param x: de type int
    :returns: bool : True si x est dans tableau, False sinon

    >>> dicho([1, 3, 4, 9], 4)
    True
    >>> dicho([1, 3, 4, 9], 11)
    False
    """
    deb = 0
    fin = len(tableau) - 1
    mil = (deb + fin) // 2

    while deb <= fin :

        if tableau[mil] ==  x:
            return True
        elif tableau[mil] < x:
            deb = mil + 1
        else :
            fin = mil - 1
        mil = (deb + fin) // 2
    return False

tailles = [500, 2500, 12500, 62500]

# tref est le temps de calcul pour une liste de taille 100
liste_ref = [i for i in range(100)]
tref = timeit("dicho(liste_ref, -1)", number = 1000, globals = globals())
print("n = 100 -> tref = ",round(tref, 6))

for n in tailles :
    print("n =", n, end='')
    tab = [i for i in range(n)]
    # Calcul du temps pour des listes triées de tailles n
    t = timeit("dicho(tab, -1)", number = 1000, globals = globals())

    print('\t-> temps = ',round(t, 6), '\t x', round(t/tref, 2) )
    tref = t


n = 100 -> tref =  0.002637
n = 500	-> temps =  0.003577 	 x 1.36
n = 2500	-> temps =  0.00544 	 x 1.52
n = 12500	-> temps =  0.007142 	 x 1.31
n = 62500	-> temps =  0.007378 	 x 1.03


Que remarque-t-on?
<details>
    <summary><em>Cliquer pour voir la réponse</em> </summary>
    A chaque étape, n est multilié par 5, et on voit dans le tableau que le temps est multiplié par un nombre très inférieur à 5.  
    </details>

Issu d'un cours de : Auteurs : Gilles Lassus, Jean-Louis Thirot et Mireille Coilhac