 # <center>Recherche dichotomique </center>

## Introduction

Voici une première liste de prénoms. Votre mission est très simple : regardez la liste, et chronométrez le temps qu'il vous faut pour dire si votre prénom est dans la liste ou pas.  
N'hésitez vraiment pas à jouer le jeu ! Trouvez un moyen de vous chronométrer, car il va servir à nouveau ensuite.
![L1.png](attachment:L1.png)
Vous avez mesuré votre temps ? Alors notez le quelque part et recommencez avec la liste suivante (cette fois, les prénoms sont triés par ordre alphabétique).


Voici une deuxième liste de prénoms. Même mission !
![L2.png](attachment:L2.png)

Vos deux temps sont-ils les mêmes ?

### Visionnez cette vidéo :
https://pixees.fr/un-algorithme-efficace-la-dichotomie/

## Généralités

Des volumes importants de données sont susceptibles d’être traitées par les ordinateurs. Des algorithmes efficaces sont alors
nécessaires pour réaliser ces opérations comme, par exemple, la sélection et la récupération des données. Les algorithmes de
recherche entrent dans cette catégorie. Leur rôle est de déterminer si une donnée est présente et, le cas échéant, d’en indiquer sa position, pour effectuer des traitements annexes. La recherche d’une information dans un annuaire illustre cette idée. On cherche si telle personne est présente dans l’annuaire afin d’en déterminer l’adresse. Plus généralement, c’est l’un des mécanismes principaux des bases de données : à l’aide d’un identifiant, on souhaite retrouver les informations correspondantes.  

Dans cette famille d’algorithmes, la recherche dichotomique permet de traiter efficacement des données représentées dans un
tableau de façon ordonnée.


## Présentation de l'algorithme

### Approche naïve
Une première façon de rechercher une valeur dans un tableau est d’effectuer une recherche naïve à l’aide d’un parcours de tableau, que l’on peut programmer ainsi :


#### Ecrire l'algorithme en pseudo-code : 

```
fonction recherche_naive(tab, val)
Recherche une valeur donnée dans un tableau trié.
Entrée : Un tableau trié tab de n composantes, val un élément du même type que les composantes de tab.
Sortie : L’indice qui indique l’emplacement de la première occurence de val dans tab, -1 si val est absente.

DEBUT FONCTION

POUR chaque indice i de tab FAIRE
   
   SI tab[i] == val ALORS
       renvoyer i
   FIN SI
 
renvoyer -1
   
FIN POUR

FIN FONCTION
```

In [None]:
def recherche_naive(tab, val):
    '''
    Recherche une valeur donnée dans un tableau trié.
    Entrée : Un tableau trié tab de n composantes, val un élément du même type que les composantes de tab.
    Sortie : L’indice qui indique l’emplacement de la première occurence de val dans tab, -1 si val est absente.
    '''
    
    for i in range(len(tab)):
        if tab[i] == val:
            return i
    return -1

tab_entiers = [1, 3, 5, 6, 8, 11, 13, 14, 14, 17, 19, 21, 23]
index_val = recherche_naive(tab_entiers, 8)
print(index_val)

Ici, on renvoie un entier positif ou nul en cas de succés, qui correspond à une position de la valeur recherchée dans la tableau, et -1 en cas d’échec.

### Calculons la complexité de cet algorithme

```python
def recherche_naive(tab, val): 
    for i in range(len(tab)):   n itérations : len(tab)
        if tab[i] == val:       1 comparaison : 1
            return i
    return -1
# suite du programme
```
Calcul de la complexité :
T(n) = n * 1 = n ; donc **T(n) = O(n)**

Comme tout algorithme ayant cette forme, la complexité est **linéaire** : le temps de recherche double lorsque la longueur de la liste double.

### Approche par dichotomie

L’idée centrale de cette approche repose sur l’idée de réduire de moitié l’espace de recherche à chaque étape : on regarde la valeur du milieu et si ce n’est pas celle recherchée, on sait qu’il faut continuer de chercher dans la première moitié ou dans la seconde. Plus précisément, en tenant compte du caractère trié du tableau, il est possible d’améliorer l’efficacité d’une telle recherche de façon conséquente en procédant ainsi :
1. On détermine l’élément m au milieu du tableau.
2. Si m est la valeur recherchée, on s’arrête avec un succés.
3. Sinon, deux cas sont possibles :  
 - si m est plus grand que la valeur recherchée, comme la tableau est trié, cela signifie qu’il suffit de continuer à chercher dans la première moitié du tableau.
 - sinon, il suffit de chercher dans la deuxième moitié.
4. On répète cela jusque avoir trouvé la valeur recherchée, ou bien avoir réduit l’intervalle de recherche à un intervalle vide, ce qui signifie que la valeur recherchée n’est pas présente.  

À chaque étape, on coupe l’intervalle de recherche en deux, et on en choisit une moitié. On dit que l’on procède par dichotomie, du grec dikha (en deux) et tomos (couper).


#### Algorithme en pseudo-code : 

```
fonction recherche_dichotomique(tab, val)
Recherche une valeur donnée dans un tableau trié.
Entrée : Un tableau trié tab de n composantes, val un élément du même type que les composantes de tab.
Sortie : L’indice qui indique l’emplacement de la première occurence de val dans tab, -1 si val est absente.

DEBUT FONCTION

debut ← 0
fin ← taille du tableau - 1

TANT QUE debut ≤ fin FAIRE
    
    milieu ← (debut + fin) // 2        # division entière
    
    SI tab[milieu] = val ALORS         # on a trouvé val dans le tableau, à la position milieu
        renvoyer milieu
    SINON SI tab[milieu] > val ALORS   # on va donc chercher entre debut et milieu - 1
        fin ← milieu - 1
    SINON 
        debut ← milieu + 1             # on a tab[milieu] < val, on va chercher entre milieu + 1 et fin
    FIN SI
   
   renvoyer -1                         # on est sorti de la boucle sans trouver val

FIN TANT QUE

FIN FONCTION
```

#### Réalisez l'implémentation de l'algorithme en Python :

In [2]:
from tutor import tutor

def recherche_dichotomique(tab, val):
    '''

    '''


valeurs = [1, 3, 5, 6, 8, 11, 13, 14, 14, 17, 19, 21, 23]
indice_val = recherche_dichotomique(valeurs, 8)
print(indice_val)

tutor()

4


##### Exécution de l'algorithme pour val = 8 :


![dicho.png](attachment:dicho.png)

##### Un deuxième exemple d'exécution du même algorithme : expliquez-le !
![](img/dicho_1.png)

![dicho_1.png](attachment:dicho_1.png)

##### Explications : 
La valeur recherchée n'est pas dans le tableau, fin devient inférieur à debut, on sort de la boucle while, la fonction renvoie -1.

#### Exercice
Voici une liste de 12 entiers : [-5, -2, 0, 1, 2, 5, 8, 9, 14, 21, 52, 100].  
1. On cherche l’entier 1 . Réaliser l'exécution comme vu précédemment.  

![tab_exe.PNG](attachment:tab_exe.PNG)

2. Combien d'étapes faut-il dans le pire des cas ?  
Trouver le nombre d’étapes maximales revient à déterminer en combien d’itérations on obtient un tableau de taille 1 qui contient ou pas la valeur recherchée.  

Au départ, on a n valeurs. A chaque itération, on divise la taille de la liste par 2. On cherche donc un entier x tel que :  
  
<center>$n(1/2)^x ≤ 1$ ce qui équivaut à $n ≤ 2^x$ </center>  
<center>Si $n = 12$ ; $2^x ≥ 12$  </center> 
<center>$2^3 = 8$ et $2^4 = 16$ </center>   
  
Il faut donc 4 étapes pour savoir si la valeur est présente ou non.


### Analyse de l'algorithme

#### Complexité

Supposons que l’on doive effectuer une recherche dans un tableau trié contenant 174 valeurs (un annuaire, par exemple). En procédant par dichotomie, on regarde la valeur au milieu et suivant la cas, on s’arrête ou l’on continue la recherche dans l’une des deux moitiés restantes. En négligeant la valeur supprimée, les moitiés contiennent chacune 174/2 = 87 valeurs. La fois suivante, si l’on n’a pas trouvé la valeur recherchée, on continue de sélectionner l’une des moitiés de ce qui reste, qui contiennent 43 ou 44 valeurs.  

Le processus se poursuit jusqu’à n’avoir au plus qu’une valeur :  

![iterations.png](attachment:iterations.png)

Pour pouvoir majorer le nombre maximum d’itérations, si le tableau contient $n$ valeurs, et si on a un entier $x$ tel que $n$ ≤ $2^x$, alors puisque qu’à chaque itération, on sélectionne une moitié de ce qui reste, au bout d’une itération, une moitié de tableau aura au plus $2^x / 2 = 2^{x−1}$ éléments, un quart aura au plus $2^{x−2}$ et au bout de $k$ itérations, la taille de ce qui reste à étudier est de taille au plus $2^{x−k}$.  
En particulier, si l’on fait $x$ itérations, il reste au plus $2^{x−x} = 1$ valeur du tableau à examiner. On est sûr de s’arrêter cette fois-ci.  

On a donc montré que si l’entier $x$ vérifie $n ≤ 2^x$, alors l’algorithme va effectuer au plus $x$ itérations.  
La plus petite valeur est obtenue pour :  
<center> $x = log_2(n)$</center>

Ainsi, la complexité de la fonction est de l’ordre du logarithme de la longueur de la liste : $T(n) = O(log_2(n))$  

*Remarque :*
Quand on écrit un nombre $n$ en puissance de 2 (par exemple $256 = 2^9$), la puissance est
appelée logarithme en base 2 de $n$ et on la note $log_2(n)$.

#### Pour s’assurer que le programme ci-dessus fonctionne correctement, il faut se poser deux questions importantes :  

1. Le programme renvoie-t-il bien un résultat ? Comportant une boucle non bornée, est-on sûr d’en sortir à un moment donné ?
2. La réponse renvoyée par le programme est-elle correcte ? Ici, il y a deux sortes de réponses : soit on a obtenu -1, auquel cas la valeur recherchée n'est pas présente dans le tableau ; soit on a obtenue un entier positif ou nul qui correspond à la position de la valeur recherchée dans le tableau (ou, en cas de répétition, l’une des positions).  

#### Preuve de terminaison

L’algorithme se termine-t-il, quelles que soient les données fournies (respectant la précondition : données triées)? Il faut s’assurer que la boucle «Tant que» ne conduit pas à un nombre inﬁni d’itérations. Intuitivement, la taille du tableau dans lequel on cherche val est divisée par 2 à chaque étape. Si on n’a pas trouvé l’élément val entretemps, à la ﬁn, la taille du tableau dans lequel on cherche vaut 1.
L’algorithme se termine donc après un nombre ﬁni d’itérations.




#### Correction du programme
L’algorithme permet-il de déterminer si un élément est présent ou non, quelles que soient les données fournies (respectant la précondition)?  
L’élément val, s’il est présent dans le tableau, se trouve à chaque étape entre les indices debut et fin.  
Cette propriété est vraie à l’étape d’initialisation lorsqu’on affecte la valeur 0 à debut et la valeur n-1 à fin, puis, à chaque étape de l’algorithme, grâce au choix de la partie du tableau dans laquelle on va effectuer la prochaine recherche.   Comme l’algorithme se termine, il permet bien de déterminer si un élément est présent ou non dans le tableau.



#### Exercice 1 :  
Combien de valeurs sont examinées lors d'un appel à recherche_dichotomique([0,1,1,2,3,5,8,13,21], 7) ?

Réponse : 

#### Exercice 2 :
Modifier la fonction recherche_dichtomique pour afficher le nombre total de tours de boucle effectués par l'algorithme. Lancer le programme sur des tableaux de tailles différentes (100, 1000, etc) et observer les nombres de de tors affichés. On pourra par exemple chercher la valeur 1 dans un tableau ne contenant que des 0, ce qui correspond au pire des cas.

In [None]:
# copier coller la fonction recherche_dichtomique et la modifier

#### Exercice 3 :
Ecrire une fonction nb_tours(n) qui renvoie le plus petit entier k tel quel $2^k > n$, c'est à dire le nombre maximal de valeurs examinées par la recherche dichotomiques dans un tableau de taille n.  
On peut par exemple diviser n par 2 tant de n > 0, en comptant le nombre de divisions effectuées.