# Recherche dichotomique

## Principe

La **dichotomie** est un mot d'origine greque qui signifie "diviser en deux".

La recherche d'une valeur par dichotomie dans un tableau peut être facilitée si celui-ci est trié. Dans ce cas, on divise successivement le tableau en 2 jusqu'à atteindre la valeur cherchée.

### Algorithme

Voici une écriture de l'algorithme de recherche dichotomique dans un **tableau trié** :

- `t` désigne un tableau trié
- `v` est la valeur cherchée dans le tableau
- `a`, `b` et `m` sont les indices de position des valeurs dans le tableau.

```
# a et b sont les indices de la première et dernière valeur du tableau t
a = 0
b = dimension(t) (nombre d'éléments - 1)

tant que a <= b:
    m (a+b)//2 (m est l'indice de la valeur médiane du tableau t)
    si v < t[m]:
        b=m-1 (v se trouve dans la première moitié du tableau t entre les indices 0 et m-1)
    
    sinon si v > t[m]:
        a = m+1  (v se trouve dans la seconde moitié du tableau entre les indices m+1 et b)

    sinon:
        la valeur est trouvée et a pour indice m

# on sort de la boucle, la valeur n'est pas trouvée
```

### Remarque

En python, cet algorithme peut s'écrire sous forme d'une fonction qui renvoie un booléen : `True` si la valeur est dans le tableau, `False` sinon.

### Exemple

Soit `t=[5, 9, 12, 14, 15, 16, 19, 20, 23, 25]` un tableau trié. On cherche la valeur 12.

- `a = 0` et `b = 9` donc `a < b`, on entre dans la boucle tant que ;
- on calcule la valeur de l'indice situé au milieu du tableau: `m = (0+9)//2 = 4`;
- La valeur cherchée `12 < t[4] = 15` donc la valeur cherchée est entre les indices `a = 0` et `b = m-1 = 3`.

![dicho_1.png](attachment:dicho_1.png)

- `a = 0` et `b = 3` donc `a < b`, on reste dans la boucle tant que;
- on calcule la valeur de l'indice situé entre les indices 0 et 3: `m = (0+3)//2 = 1`;    
- La valeur cherchée `12 > t[1] = 9` donc la valeur cherchée est entre les indices `a = m+1 = 2` et `b = 3`.

![dicho_2.png](attachment:dicho_2.png)

- `a = 2` et `b = 3` donc `a < b`, on reste dans la boucle tant que;
- on calcule la valeur de l'indice situé entre les indices 2 et 3: `m = (2+3)//2 = 2`;
- La valeur cherchée `12 = t[2]` donc la valeur est trouvée en indice 2.

![dicho_3.png](attachment:dicho_3.png)

## Terminaison de l'algorithme

### Variant de boucle

On appelle **variant de boucle** une quantité entière qui:

- doit être positive ou nulle pour rester dans la boucle;
- décroit strictement à chaque itération

Si on trouve une telle quantité dans une boucle while, celle-ci se termine.


### Preuve de la terminaison

1. Dans l'algorithme de **recherche par dichotomie**, le variant de boucle est donné par le test `a < b` ce qui revient à vérifier que `b - a > 0`.

   Le nombre `b - a` est strictement positif dans la boucle `while`.


2. Vérifions que le nombre `b - a` décroît:

- soit c'est l'indice `a` qui augmente et donc le nombre `b - a` diminue;
- soit c'est le nombre `b` qui diminue et donc le nombre `b - a` diminue.

En conclusion, le nombre `b - a` est un variant de boucle positif qui décroit, assurant la terminaison de la boucle `while`.

## Complexité de l'algorithme

La recherche dichotomique s'applique sur une liste triée de nombres. 

Au départ, on compare le nombre cherché N avec la valeur du nombre M situé au milieu de la liste. 

- S'il est inférieur, N<M, alors on cherche le nombre N dans la première moitié de liste. 
- S'il est supérieur, N>M, alors on cherche le nombre N dans la seconde moitié de liste. 

On recommence le processus en divisant chaque sous-liste jusqu'à obtenir une liste d'un nombre dans le pire des cas.

### Exemple

Pour une liste de 20 nombres, en supposant le pire des cas, c'est à dire que le nombre n'est pas dans la liste.

On cherche successivement dans un liste de longueur 20, puis une liste de longueur 9, puis de longueur 4, puis une liste de longueur 2 ou une liste à 1 élément.

Cela implique, dans le pire des cas, 4 comparaisons (4 itérations de la boucle while).

![dicho_4.png](attachment:dicho_4.png)

### Cas général

Supposons un tableau trié de dimension n (c'est à dire avec n nombres) :

Soit p le nombres de comparaisons nécessaires dans le pire des cas. Alors : $2^{p} \leqslant n$ donc $log(2^{p}) \leqslant log(n)$ donc $p \times log(2) \leqslant log(n)$ donc $p \leqslant \dfrac{log(n)}{log(2)}$

donc $p$ est inférieur ou égal à $log_{2}(n)$.

La complexité de l'lgorithme de recherche dichotomique est logarithmique : $O(log_{2}(n))$.

### Remarques

1. Pour un tableau de 100 nombres, $p$ sera proche de $log_{2}(100)\approx 6,64$, donc dans le pire des cas, on pourra déterminer si le nombre est dans la liste ou non en 7 tours de boucle `while`.
2. Pour un tableau trié de 1 million de nombres, le nombre maximum de tours de boucle sera de l'ordre de $log_{2}(n) \approx 20$, soit 20 tours de boucles.
3. On peut comparer les complexités des algorithmes : $O(\log_{2}(n)) < O(n) < O(n^2)$


In [1]:
from math import log2

In [3]:
log2(100)

6.643856189774724

In [6]:
log2(1E6)

19.931568569324174