## Recherche dichotomique dans un tableau trié &ndash; Fiche élève

### Sommaire
[**1. Introduction**](#introduction)  
[**2. Mise en oeuvre**](#mise-en-oeuvre)  
[**3. Terminaison**](#terminaison)   
[**4. Efficacité**](#efficacite)  
[**5. Correction**](#correction) 

### 1. Introduction<a id="introduction"></a>
La façon la plus simple de chercher une valeur dans une liste est de parcourir un à un les éléments de la liste (on parle de *parcours séquentiel*) et de comparer ces éléments à la valeur recherchée. Si cette valeur n'est pas dans la liste ou si elle est présente une seule fois à la fin de la liste, il est nécessaire de parcourir toute la liste. Le coût de cette recherche séquentielle est donc de l'ordre de $n$ où $n$ est la taille de la liste : on parle de coût linéaire (en $n$).

Il est possible de faire mieux en utilisant la **recherche dichotomique** (aussi appelée **recherche par dichotomie**) <span style="color: red;">lorsque la liste est triée</span>. Cette méthode de recherche a été formalisée en 1946 dans un article de [John Mauchly](https://fr.wikipedia.org/wiki/John_William_Mauchly), un physicien américain qui a co-conçu l'[ENIAC](https://fr.wikipedia.org/wiki/ENIAC), un des premiers ordinateurs.

Voir la présentation jointe (fichier ``exemples_introduction_recherche_dichotomique.pdf``) à ce notebook.

La recherche dichotomique utilise le principe [&laquo; diviser pour régner &raquo;](https://fr.wikipedia.org/wiki/Diviser_pour_r%C3%A9gner_(informatique)) (*divide and conquer* en anglais) qui consiste en trois étapes :
- diviser : le problème initial (ici, la recherche d'un élément dans une liste triée) est divisé en sous-problèmes ;
- régner : chacun des sous-problèmes est résolu ;
- combiner : trouver une solution au problème initial à partir des solutions des sous-problèmes.

### 2. Mise en oeuvre<a id="mise-en-oeuvre"></a>

##### <span style="color:blue">Exercice 1</span>
<span style="color:blue">1. Écrire (en pseudo-code) l'algorithme de recherche par dichotomie.</span>

**Algorithme de recherche par dichotomie**   
Entrées : un entier ``elt`` et une liste triée d'entiers ``liste[1..n]``   
Sortie : ``Vrai`` si l'entier ``elt`` appartient à la liste ``liste[1..n]``, ``Faux`` sinon   

<pre><code>
début &larr; 1
fin &larr; n
trouvé &larr; Faux
tant que début &leq; fin et non trouvé faire :
    milieu &larr; (début + fin) // 2
    si milieu = elt alors :
        trouvé &larr; Vrai
    sinon :
        si milieu < elt alors :
            début &larr; milieu + 1
        sinon :
            fin &larr; milieu - 1
renvoyer trouvé
</code></pre>

<span style="color:blue">2. Écrire, en Python, une fonction <code>recherche_dichotomique(elt, liste)</code> qui prend en paramètres un entier <code>elt</code> et une liste triée d'entiers <code>liste</code>, et qui utilise la recherche dichotomique pour renvoyer <code>True</code> si l'entier <code>elt</code> se trouve dans la liste, <code>False</code> sinon.</span>

In [None]:
# À vous de jouer !
def recherche_dichotomique(elt, liste):
    """ Utilise la recherche dichotomique pour rechercher un élément dans une liste triée.
    - Entrées : un entier elt et une liste triée d'entiers liste
    - Sortie : True si l'entier elt fait partie de la liste, False sinon
    """
    pass

# À essayer
liste = [2, 3, 5, 8, 10, 12, 15, 20, 31]
recherche_dichotomique(10, liste)

##### <span style="color:blue">Exercice 2</span>
<span style="color:blue">Modifier la fonction précédente afin qu'elle renvoie une position (un indice) de l'élément cherché lorsque celui-ci est présent et ``None`` dans le cas contraire.</span>

In [None]:
# À vous de jouer !
def recherche_dichotomique_indice(elt, liste):
    """ Utilise la recherche dichotomique pour rechercher un élément dans une liste triée.
    - Entrées : un entier elt et une liste triée d'entiers liste
    - Sortie : une position de l'entier cherché lorsque celui-ci est présent et None dans 
    le cas contraire
    """
    pass

# À essayer
liste = [2, 3, 5, 8, 10, 12, 15, 20, 31]
recherche_dichotomique_indice(10, liste)

### 3. Terminaison<a id="terminaison"></a>
**Rappel. &ndash;** Pour prouver qu'une boucle conditionnelle de type ```tant que``` se termine, on peut chercher un entier naturel qui décroît (strictement) à chaque passage dans la boucle. Cette quantité (entière) s'appelle un variant de boucle.

##### <span style="color:blue">Exercice 3</span>
<span style="color:blue">Prouver la terminaison de l'algorithme de recherche par dichotomie à l'aide d'un variant de boucle.</span>

### 4. Efficacité<a id="efficacite"></a>
Pour mesurer l'efficacité de la recherche dichotomique, on peut s'intéresser au nombre de valeurs de la liste qui ont été examinées : il s'agit du nombre d'itérations de la boucle ``tant que``. 

Plaçons-nous dans le pire des cas, lorsque la valeur cherchée n'apparaît pas dans la liste triée. Prenons l'exemple d'un tableau de taille $100$ :     
- À la première itération, on va se restreindre à une liste de taille environ $50$.
- À la deuxième itération, on va se restreindre à une liste de taille environ $25$.
- À la troisième itération, on va se restreindre à une liste de taille environ $12$.
- Et ainsi de suite...  

Au total, on ne fera jamais plus de $7$ itérations. On peut retrouver cette valeur maximale $7$ en cherchant **la plus petite valeur de n telle que $2^n$ dépasse $100$ (la taille de la liste)** :

- $2^6 = 64$ et $2^7 = 128$ : cette valeur est bien égale à $7$.

##### <span style="color:blue">Exercice 4</span>
<span style="color:blue">1. Avec la recherche dichotomique, combien d'itérations sont suffisantes pour rechercher un élément dans une liste triée d'un million d'éléments ?</span>   
<span style="color:blue">2. Comparer avec une recherche séquentielle.</span>

**À retenir. &ndash;** La **recherche dichotomique** permet de rechercher une valeur dans une liste triée. Le principe consiste à **diviser par deux** à chaque fois la taille de la liste dans laquelle s'effectue la recherche. Cet algorithme est **très efficace**. Il ne faut que quelques dizaines de comparaisons élémentaires pour chercher un élément donné dans une liste (triée) en contenant des milliards.

Essayer par exemple le code suivant :

In [None]:
def recherche_sequentielle(elt, liste):
    trouve = False
    i = 0
    while (not trouve) and (i < len(liste)):
        if liste[i] == elt:
            trouve = True
        i += 1
    return trouve

In [None]:
from random import randint
from time import *

# Une liste de dix millions d'entiers compris entre 1 et 1 000 000 000 (un milliard)
L = [randint(1, 10 ** 9) for _ in range(10 ** 7)]

# Tri de la liste
L.sort() # rappel : la liste L est modifiée !

# Un entier choisi au hasard entre 1 et 1 000 000 000
elt = randint(1, 10 ** 9)

In [None]:
# Temps mis pour rechercher l'entier n avec un parcours séquentiel
debut = perf_counter()
recherche_sequentielle(elt, L)
fin = perf_counter()
print(f"Temps mis avec un parcours séquentiel : {round(fin - debut, 2)} s.")

# Temps mis pour rechercher l'entier n avec la recherche dichotomique
debut = perf_counter()
recherche_dichotomique(elt, L)
fin = perf_counter()
print(f"Temps mis avec la recherche dichotomique : {round(fin - debut, 6)} s.")

### 5. Correction<a id="correction"></a>

**Algorithme de recherche par dichotomie**   
Entrées : un entier ``elt`` et une liste triée d'entiers ``liste[1..n]``   
Sortie : ``Vrai`` si l'entier ``elt`` appartient à la liste ``liste[1..n]``, ``Faux`` sinon   

<pre><code>
début &larr; 1
fin &larr; n
trouvé &larr; Faux
tant que (non trouvé) et début &le; fin faire :
    milieu &larr; (début + fin) // 2
    si liste[milieu] = elt alors :
        trouvé &larr; Vrai
    sinon :
        si liste[milieu] &gt; elt alors :
            fin &larr; milieu - 1
        sinon :
            début &larr; milieu + 1
renvoyer trouvé
</code></pre>
Il faut comprendre que :   
- l'algorithme renvoie ``Vrai`` uniquement lorsque la valeur recherchée a été trouvée (évident car l'instruction <code>trouvé &larr; Vrai</code> n'est exécutée que lorsque l'égalité <code>liste[milieu] = elt</code> est vérifiée) ;
- lorsque l'algorithme renvoie ``Faux``, la valeur recherchée n'est pas présente dans le tableau.   

*Remarque : l'algorithme ne cherche jamais à accéder à la liste en dehors de ses bornes car on a toujours <code>début &le; milieu &le; fin</code>.*

Pour prouver le second point, on utilise l'invariant de boucle suivant : 
<p style="text-align : center">la valeur recherchée <code>elt</code> ne peut se trouver que dans <code>liste[début..fin]</code></p>

On vérifie alors deux choses :
- cet invariant est vrai avant d'entrer dans la boucle (évident car, avant la boucle, ``début`` vaut ``1`` et ``fin`` vaut ``n``) ;
- à chaque passage dans la boucle, l'invariant est préservé.