# Recherche dichotomique dans un tableau trié

Cette méthode, vous la connaissez probablement tous !

En tous cas, vous la connaissez si vous avez joué au __jeu qui consiste à trouver un nombre entre 1 et 100__ à l'aide des réponses __"plus" ou "moins"__. 

Par exemple, vous avez commencé par proposer 50. Si on vous répond, "c'est plus", vous proposez 75 puis si l'on vous répond "c'est moins" vous proposez 62... 

Vous êtes alors en train d'effectuer une recherche dichotomique !

Faire __une recherche dichotomique, c'est chercher une valeur dans un tableau trié en prenant, à chaque étape, le milieu de l'ensemble des valeurs possibles pour éliminer la moitié des possibilités__.

> __Remarque :__ une recherche dichotomique n'a de sens que si elle est effectuée dans un __tableau trié__.

## La méthode dichotomique, pas à pas

Soit une liste d'objets déjà triés. On recherche un objet en particulier.

- On choisit dans la liste l'__objet médian__ (une moitié des objets est avant, l'autre moitié est après).
- On __compare l'ojet médian à l'objet recherché__. Trois cas sont alors possibles :
  - si on a trouvé l'objet cherché alors c'est fini.
  - si l'objet recherché est placé avant l'objet médian alors on recommence avec cette première partie de la liste.
  - si l'objet recherché est placé après l'objet médian alors on recommence avec cette seconde partie de la liste.
- __On répète__ cette démarche jusqu'à ce qu'au bout d'un certain nombre d'essais :
  - soit on a trouvé l'objet cherché.
  - soit il n'est pas dans la liste.
  
## La méthode dichotomique, par l'exemple

Admettons que l'on recherche si la valeur 35 est présente ou non dans le tableau trié suivant : `[5, 7, 12, 14, 23, 27, 35, 40, 41, 45]`

Les étapes de recherches sont schématisées ci-dessous, avec :

- __`deb`__, l'indice qui marque le __début de la zone de recherche__.
- __`fin`__, l'indice qui marque la __fin de la zone de recherche__.
- __`mil`__, l'indice __médian entre le début et la fin de la zone__ de recherche : `mil` est le résultat du calcul de la valeur entière de la moyenne entre `deb` et `fin` : `(deb + fin) // 2`

![Exemple de recherche dichotomique](recherche_dichotomique.png)


Si vous préférez, voici une autre __représentation de cette recherche, sous la forme d'un arbre__ :

![Exemple de recherche dichotomique](recherche_dichotomique_arbre.png)

## Algorithme de la recherche dichotomique

    VARIABLE
        tab : tableau d'entiers trié
        nb_recherche, debut, fin, milieu : nombres entiers
        
    DEBUT
        debut ← 0
        fin ← longueur(tab) - 1
        TANT_QUE debut ⩽ fin
            milieu ← (debut + fin) // 2
            SI tab[milieu] = nb_recherche
                 RENVOYER VRAI
            SINON
                SI nb_recherche > tab[milieu]
                    debut ← milieu + 1
                SINON
                    fin ← milieu - 1
                FIN_SI
            FIN_SI
        FIN_TANT_QUE
        RENVOYER FAUX
    FIN
    
> __Remarque :__ cet algorithme est organisé sur une __structure itérative__. Il est également __possible de créer un algorithme dichotomique récursif__, mais cette méthode est réservée au programme de terminale.

## Le recherche dichotomique avec Python

En vous aidant de l'algorithme précédent, __créer la fonction `dichotomie(tab, nb_recherche)`__ qui a pour objet de __rechercher la valeur `nb_recherche` dans le tableau trié `tab`__.

Si la valeur est présente, la fonction devra __renvoyer le booléen__ `True`, sinon le booléen `False`.

> __Remarque :__ bien entendu, il est très fortement conseillé de garder l'habitude de documenter chaque fonction par un docstring.

In [None]:
def dichotomie(tab, nb_recherche):
    '''
    Vérifie la présence d'une valeur dans un tableau trié
    
    Entrées : tableau d'entiers trié
              entier à rechercher dans le tableau
    Sortie : booléen caractérisant la présente de l'entier
             recherché dans le tableau (True => l'entier est trouvé)
    '''
    debut = 0
    fin = len(tab) - 1
    
    while debut <= fin:
        milieu = (debut + fin) // 2
        if tab[milieu] == nb_recherche:
            return True
        else:
            if nb_recherche > tab[milieu]:
                debut = milieu + 1
            else:
                fin = milieu - 1
                
    return False

### Test de la fonction à postériori

__Tester votre fonction__ plusieurs fois sur les tableaux aléatoires ci-dessous :

In [None]:
from random import randint

tableau_entiers = [randint(1, 50) for _ in range (20)]
tableau_entiers.sort()

print(tableau_entiers)
print(12 in tableau_entiers)          # Permet de vérifier notre algo
print(dichotomie(tableau_entiers, 12))

### Vérification de la fonction par assertions

Ajouter des __assertions sur la post-condition__ de votre fonction.

Autrement dit, il faut vérifier avec l'opérateur `in` que notre fonction va bien renvoyer le booléen correct.

> __Indice complémentaire au besoin dans le notebook de correction :__ juste avant de renvoyer un booléen, on peut insérer une assertion pour vérifier si `nb_recherche in tableau_entiers`.

In [None]:
tableau_entiers = [randint(1, 50) for _ in range (20)]
tableau_entiers.sort()
print(tableau_entiers)

def dichotomie(tab, nb_recherche):
    '''
    Vérifie la présence d'une valeur dans un tableau trié
    
    Entrées : tableau d'entiers trié
              entier à rechercher dans le tableau
    Sortie : booléen caractérisant la présente de l'entier
             recherché dans le tableau (True => l'entier est trouvé)
    '''
    debut = 0
    fin = len(tab) - 1
    
    while debut <= fin:
        milieu = (debut + fin) // 2
        if tab[milieu] == nb_recherche:
            assert nb_recherche in tableau_entiers, "Erreur, \
            le nombre recherché n'est pas dans le tableau,\
            pourtant notre fonction renvoie True"
            return True
        else:
            if nb_recherche > tab[milieu]:
                debut = milieu + 1
            else:
                fin = milieu - 1
                
    assert nb_recherche not in tableau_entiers, "Erreur, \
            le nombre recherché est bien dans le tableau,\
            pourtant notre fonction renvoie False"
    return False

print(dichotomie(tableau_entiers, 12))

## Prouver la terminaison de l'algorithme dichotomique

Cet algorithme comprenant une __boucle TANT QUE__, il est légitime de se poser la question de sa terminaison.

Nous devons donc trouver un __variant de boucle__ qui terminera à coup sûr cette boucle TANT QUE.

Classiquement, nous pouvons chercher un variant ayant potentiellement les caractéristiques suivantes :

 - c'est un __entier positif__.
 - __strictement décroissant__ à chaque itération de boucle.
 - __terminant la boucle__ lorsque sa valeur devient nulle ou négative.

> __Remarques :__
- il existe des exceptions à ces caractéristiques classiques. Par exemple, avec un flottant qui va croire jusqu'à une valeur limite qui terminera la boucle.
- dans le cas présent de notre algorithme dichotomique, la sortie de boucle se fera lorsque le variant, un entier, devient strictement négatif.

Un tel __variant__ existe et... c'est __à vous de le trouver !__

La condition de sortie de la boucle étant `debut <= fin`, on sortira dès que `debut > fin`, autrement dit dès que `fin - debut < 0`.

La valeur __`fin - debut` fera donc un excellent variant__ pour notre boucle !

Le variant étant trouvé, il ne reste plus qu'à __prouver la terminaison de l'algorithme__ :

- initialement la valeur `fin - debut` est égale à la longueur du tableau. A condition d'avoir un tableau non vide, __le variant est est donc bien un entier positif__.
- comment varie le variant lors d'une itération de boucle quelconque ?
  - si la valeur cherchée est égale à la valeur médiane, la boucle se termine immédiatement.
  - si la valeur cherchée est inférieure à la valeur médiane de la zone de recherche, la valeur __`fin` diminuera__.
  - si la valeur cherchée est supérieure à la valeur médiane de la zone de recherche, la valeur __`debut` augmentera__.
  - dans les deux derniers cas, la valeur __`fin - debut` sera strictement décroissante__.
- __la valeur `fin - debut`__, initialement positive et strictement décroissante, __atteindra donc nécessairement une valeur négative__, condition suffisante pour sortir de la boucle TANT QUE (la condition `debut <= fin` devenant fausse).

CQFD...

## Complexité de l'algorithme dichotomique

Nous avons vu précédement que l'algorithme naïf de recherche d'un nombre dans une liste triée avait, dans le pire des cas, une complexité linéaire O(n). 

L'algorithme dichotomique est de complexité O(Log(n)), c'est beaucoup beaucoup mieux !

## Application ludique
### A vous de jouer

Concevoir le jeu suivant :

L'ordinateur choisit aléatoirement un nombre compris entre 0 et 100.

L'utilisateur va essayer de le deviner le plus rapidement possible, avec l'aide de l'ordinateur qui devra obligatoirement dire si le nombre choisi par l'utilisateur est plus petit, égal ou plus grand que le nombre tiré au sort. 

In [None]:
from random import randint

nb_a_trouver = randint(0, 100)
nb_essais = 1
nb_choisi = int(input("Choisir un nombre entre 0 et 100 : "))

while nb_choisi != nb_a_trouver:
    nb_essais += 1
    if nb_choisi <= nb_a_trouver:
        nb_choisi = int(input("Trop petit !\nChoisir un nombre entre 0 et 100 : "))
    else:
        nb_choisi = int(input("Trop grand !\nChoisir un nombre entre 0 et 100 : "))
print(f"Bravo ! Tu as trouvé en {nb_essais} essais !")

### A l'ordinateur de jouer

Vous avez dû remarquer que la première application n'est qu'une mise en jambe : il était inutile d'utiliser un algorithme dichotomique !

Il en sera autrement pour la version suivante, à intégrer dans ue fonction :

- A vous, utilisateur humain, de saisir un nombre entre 0 et 100.
- L'ordinateur doit trouver ce nombre en un nombre de tentatives minimal.
- Votre programme doit renvoyer le nombre de propositions qu'il a dû faire avant de trouver votre nombre mystère.

In [None]:
def jeu_dicho(nb_a_trouver, nb_max):
    '''
    Simule un jeu où l'ordinateur doit trouver un nombre choisi
    par un utilisateur entre 0 et nb_max.
    La procédure affiche en 
    
    Entrée : entier à trouver
             entier correspondant à la valeur maximale possible
    Sortie : entier correspondant au nombre de coups nécessaires à la victoire
    '''
    nb_essais = 0
    debut = 0
    fin = nb_max
    
    while debut <= fin:
        nb_essais += 1
        nb_choisi = (debut + fin) // 2
        if nb_choisi == nb_a_trouver:
            return nb_essais
        else:
            if nb_choisi < nb_a_trouver:
                debut = nb_choisi + 1
            else:
                fin = nb_choisi - 1

coups = jeu_dicho(int(input("Choisir un nombre entre 0 et 100 : ")), 100)
print(f"Bravo ! Tu as trouvé en {coups} essais !")

### Etude de complexité temporelle (approfondissement)
#### Répétition automatique sur 100 parties

Utiliser et / ou modifier votre fonction pour : 

- simuler une saisie automatique et aléatoire du nombre mystère.
- répéter 100 parties en mémorisant le score obtenu à chaque fois.
- faire la moyenne des résultats obtenus sur les 100 parties.

In [None]:
from random import randint

nb_parties = 100
score = 0

for _ in range(nb_parties):
    score += jeu_dicho(randint(0, 100), 100)
    
print(f"En moyenne, il a fallu {round(score / nb_parties)} essais pour trouver")

#### Répétition sur des tableaux de taille différentes

Modifier votre programme pour : 

- répéter à chaque fois 100 parties pour :
  - un nombre compris entre 0 et 100
  - un nombre compris entre 0 et 1_000
  - un nombre compris entre 0 et 10_000
  - un nombre compris entre 0 et 100_000
  - un nombre compris entre 0 et 1_000_000
- faire la moyenne des résultats obtenus sur les 10 parties, pour chacune des situations.

In [None]:
from random import randint

nb_parties = 100
nb_max = 100
score = 0

for _ in range(5):
    for _ in range(nb_parties):
        score += jeu_dicho(randint(0, nb_max), nb_max)
    nb_max *= 10
    print(f"\nPour trouver une valeur entre 0 et {nb_max} ...")
    print(f"   ...il a fallu en moyenne {round(score / nb_parties)} essais.")

#### Analyse des résultats

D'après les résultats obtenus, pouvez-vous exclure l'hypothèse d'une complexité d'ordre 0(n) ?

Si vous avez le temps, comparer votre algorithme avec un autre algorithme, de recherche naïve, basée sur le parcours linéaire du tableau (dans notre jeu, cela consiste donc simplement à tester tous les nombres, du zéro jusqu'au dernier).

## Que retenir ?
### À minima...

- Une recherche dichotomique ne peut se faire que sur un tableau trié.
- Une recherche dichotomique consiste à systématiquement découper la zone de recherche en deux jusqu'à trouver (ou non) la valeur cherchée :
  - La zone de recherche est délimitée par un indice de début et un indice de fin.
  - On teste si la valeur médiane de cette valeur de recherche est égale à la valeur cherchée.
  - Tant que l'on n'a pas trouvé la valeur cherchée, on restreint la zone de recherche en déplaçant l'indice de début ou l'indice de fin.
  - Si, à l'issue de ces redécoupages successifs, la zone de recherche se réduit à une seule valeur et qu'on a toujours pas trouvé la valeur cherchée, c'est que la valeur est absente du tableau.
- Le variant permettant de prouver la terminaison de l'algorithme est la valeur `fin - debut`.
  
### Au mieux...

- Savoir démontrer la terminaison de l'algorithme dichotomique.
- Comprendre la correction de l'algorithme dichotomique.
- Savoir utiliser des assertions pour vérifier l'algorithme.
- La complexité d'un algorithme dichotomique est de O(Log(n)).

---
[![Licence CC BY NC SA](https://licensebuttons.net/l/by-nc-sa/3.0/88x31.png "licence Creative Commons CC BY-NC-SA")](http://creativecommons.org/licenses/by-nc-sa/3.0/fr/)
<p style="text-align: center;">Auteur : David Landry, Lycée Clemenceau - Nantes</p>
<p style="text-align: center;">D'après des documents partagés par...</p>
<p style="text-align: center;"><a  href=http://www.monlyceenumerique.fr/index_nsi.html#premiere>JC. Gérard, T. Lourdet, J. Monteillet, P. Thérèse, sur le site monlyceenumerique.fr</a></p>