# Recherche dichotomique

On rappelle les algorithmes de recherche dichotomique :

Itératif :

In [1]:
def recherche_dichotomique(tableau, element):
    g = 0
    d = len(tableau) - 1
    while g <= d and tableau[g] <= element <= tableau[d]:
        m = (g + d) // 2
        if tableau[m] == element:
            return True
        elif tableau[m] < element:
            g = m + 1
        else:
            d = m - 1
    # La recherche n'a rien donné
    return False

Récursif :

In [2]:
def recherche_dichotomique_rec(tableau, element, g, d):
    if g > d:
        # La "largeur" de la zone de recherche est négative: 
        # La recherche a été infructueuse
        return False
    else:
        # On sait que g <= d: la "largeur" de la zone est positive ou nulle
        # (nulle = il ne reste plus qu'un seul élément)
        m = (g + d) // 2
        if tableau[m] == element:
            return True
        elif tableau[m] < element :
            return recherche_dichotomique_rec(tableau, element, m + 1, d)
        else:
            return recherche_dichotomique_rec(tableau, element, g, m - 1)

def recherche_dichotomique_rec_Final(tableau, element):
    return recherche_dichotomique_rec(tableau, element, 0, len(tableau) - 1)

---
### Exercice 1

Combien de valeurs sont examinées lors de l'appel (récursif ou non) à `recherche_dichotomique([0, 1, 1, 2, 3, 5, 8, 13, 21], 7)` ?

#### Corrigé:

Le plus simple pour répondre à une telle question (tout en justifiant la réponse) est de **simuler** l'algorithme à la main:

| Étape | g | d | m | t[m] |
|:-----:|:-:|:-:|:-:|:----:|
| 0     | 0 | 8 | 4 | 3    |
| 1     | 5 | 8 | 6 | 8    |
| 2     | 5 | 5 | 5 | 5    |
| 3     | 6 | 5 |   |      |


On constate que 3 valeurs du tableau sont examinées (colonne de droite), ce qui équivaut à dire que la boucle a tourné 3 fois.

---
### Exercice 2

Donner un exemple de recherche dichotomique où le nombre de valeurs examinées est exactement 4.

#### Corrigé:

* Il suffit de construire un tableau de taille $8 = 2^3$ ne contenant que des zéros, et de rechercher une valeur qui n'est pas dans le tableau, par exemple 1. Le nombre d'étapes sera alors égal au plus petit entier strictement supérieur à  $\log_2(16) = 3$, c'est-à-dire 4 (voir exercice suivant pour une démonstration);
* Si on veut un exemple où la valeur à recherche **est** dans le tableau, c'est un tout petit peu plus difficile. Le nombre de valeurs à examiner est (dans le pire des cas) le plus petit entier supérieur ou égal à $\log_2(N)$. 
$$
3 \leqslant \log_2(N) < 4 \quad\Longleftrightarrow\quad
8 \leqslant N < 16
$$

  On peut donc prendre $N = 8$, et par exemple
  ```python
  t = list(range(8))
  ```

  Rechercher la valeur 16 prend alors exactement 4 étapes, comme le montre la simulation suivante:
  

  | Valeurs examinées (t[m]) |  g |  d |  m | t[m] |
  |:-----:|:--:|:--:|:--:|:----:|
  | 1     | 0  | 7 | 3  | 3    |
  | 2     | 4  | 7 | 5 | 5   |
  | 3     | 6 | 7 | 6 | 6   |
  | 4     | 7 | 7 | 7 | 7   |
  
  On verra avec l'exercice suivant que toutes les autres recherches fructueuses prendraient au plus 3 étapes.

---
### Exercice 3

1. Modifier l'implémentation récursive pour qu'elle renvoie le nombre de valeurs examinées pour trouver (ou non) la valeur dans le tableau.

In [3]:
def recherche_dicho_rec(tableau, but, g, d):
    """
    Renvoie le nombre de valeurs examinées dans 'tableau'
    """
    if g > d:
        return 0
    else:
        m = (g + d) // 2
        if tableau[m] == but:
            return 1
        elif tableau[m] < but:
            return 1 + recherche_dicho_rec(tableau, but, m + 1, d)
        else:
            return 1 + recherche_dicho_rec(tableau, but, g, m - 1)

def recherche_dicho(tableau, but):
    return recherche_dicho_rec(tableau, but, 0, len(tableau) - 1)

2. Testez votre implémentation sur des tableaux aléatoires de tailles différentes (10, 100, 1000) et des valeurs à rechercher aléatoire: calculez le nombre minimal, maximal et moyen d'appels récursifs dans chaque situation.

In [4]:
N = 8
t = [i+1 for i in range(N)]
print("t =", t)
for i in range(N+1): 
    # La dernière valeur n'est PAS dans le tableau
    print(f"i={i+1} -> {recherche_dicho(t, i+1)} valeurs examinées")

t = [1, 2, 3, 4, 5, 6, 7, 8]
i=1 -> 3 valeurs examinées
i=2 -> 2 valeurs examinées
i=3 -> 3 valeurs examinées
i=4 -> 1 valeurs examinées
i=5 -> 3 valeurs examinées
i=6 -> 2 valeurs examinées
i=7 -> 3 valeurs examinées
i=8 -> 4 valeurs examinées
i=9 -> 4 valeurs examinées


#### Étude statistique:

In [5]:
from random import randint
from math import log2

N = 1000 # taille du tableau
M = 1000 # Nombre de simulations

mini = int(log2(N) + 1)
maxi = -1
somme = 0
for _ in range(M):
    # On crée un tableau aléatoire
    t = [randint(-N, N) for _ in range(N)]
    # ... qui doit être trié
    t.sort()
    
    but = t[randint(0, N-1)] # on veut une valeur qui EST dans le tableau
    # Pour les valeurs qui ne sont pas dans le tableau, le temps de recherche
    # sera toujours le même (voir cours), cela fausserait la moyenne.
    nbr = recherche_dicho(t, but)
    if nbr < mini:
        mini = nbr
    if nbr > maxi:
        maxi = nbr
    somme += nbr
    
print(f"Temps minimal = {mini}")
print(f"Temps moyen = {somme / M}")
print(f"Temps maximal = {maxi}")


Temps minimal = 1
Temps moyen = 8.491
Temps maximal = 10


---
### Exercice 4

1. Écrivez une fonction `nombre_de_tours(N)` qui calcule le plus petit entiers $k$ tel que $2^k > n$, c'est-à-dire le nombre maximal d'appels récursifs qu'effectuera la recherche dichotomique.

In [6]:
def nombre_de_tours(N):
    k = 0
    p = 1 # p = 2**k tout au long de l'algorithme
    while p <= N:
        p = p * 2
        k = k + 1
    return k

In [7]:
nombre_de_tours(10)

4

2. Utilisez la fonction `log2` de la librairie maths pour obtenir le même résultat par un calcul direct plutôt qu'un algorithme itératif.

  Remarque: avec votre calculatrice, la fonction $\log_2$ n'existe pas. Vous pouvez cependant l'obtenir grâce à la fonction logarithme népérien (étudiée en Terminale en spécialité mathématiques):
  
  $$\log_2(x) = \frac{\ln(x)}{\ln(2)}, \forall x > 0$$

In [8]:
from math import log2
N = 10
int(log2(N)) + 1 # Int donne l'entier inférieur ou égal à log2(N)

4

---
### Exercice 5

1. Combien d'étape au maximum sont nécessaire pour gagner à "Plus petit --- plus grand" avec une recherche entre 1 et 100 ?

#### Corrigé:
C'est exactement 7, puisque $2^7 = 128 > 100$. Joueur de manière optimale à ce jeu consiste à suivre un algorithme de recherche dichotomique, l'indication "plus petit" ou "plus grand" nous disant quelle est la moitié à conserver à chaque étape.

2. Écrivez une version de ce jeu _à l'envers_: c'est vous qui choisissez un nombre (sans tricher), et l'ordinateur doit le deviner en jouant de manière optimale.

In [None]:
g = 1
d = 100
victoire = False
while g <= d and not victoire:
    m = (g + d) // 2
    print(f"Je propose le nombre {m}")
    
    consigne = ""
    while consigne not in list("vpg"):
        consigne = input("Victoire (v), plus petit (p) ou plus grand (g) ?")
    
    if consigne == "v":
        print("Yay !")
        victoire = True
    elif consigne == "p":
        d = m - 1
    else:
        g = m + 1
        
if not victoire:
    print("Curieux, j'aurai dû trouver la réponse normalement... Un bug ?")

Je propose le nombre 50


3. Écrivez une version de ce jeu _à l'endroit_: l'ordinateur choisit un nombre, et c'est à vous de le deviner. Mais l'ordinateur **triche**: il changera le nombre à trouver de façon à rendre le jeu le plus long possible, sans que vos réponses précédentes deviennent invalides (c'est-à-dire que vous n'aurez aucun moyen de savoir si l'ordinateur a triché en examinant la suite des coups).

In [None]:
from random import randint
g = 1
d = 100
while g <= d:
    n = -1
    while n < 0 or n > 100:
        
        try:
            n = int(input("Votre choix (1 <= choix <= 100) ?"))
        except ValueError:
            # Si l'entrée n'est pas un entier, on bloque l'erreur
            n = -1
        
    if n < g:
        print("Sérieux ? Plus GRAND !!!")
    elif n > d:
        print("Sérieux ? Plus PETIT !!!")
    elif  g == d:
        # Il n'y a plus qu'une valeur possible: le joueur a donc gagné
        print("Victoire !")
        g = d + 1 # pour que la boucle s'arrête
    else:
        # g <= n <= d et g < d
        
        # On calcule le nombre de valeurs à gauche et à droite de n,
        # tout en restant entre g et d
        
        nbr_gauche = n - g
        nbr_droite = d - n
        
        if nbr_gauche < nbr_droite:
            # Le côté droit contient plus de valeurs
            print("Plus grand")
            g = n + 1
        elif nbr_gauche > nbr_droite:
            # Le côté gauche contient plus de valeurs
            print("Plus petit")
            d = n - 1
        else:
            # on choisit au hasard, les 2 côtés sont équivalents
            if randint(0, 1) == 0:
                print("Plus grand")
                g = n + 1
            else:
                print("Plus petit")
                d = n - 1

---
### Exercice 6

Donner la séquence des appels récursifs à la fonction `recherche_dichotomique_rec` dans les deux cas suivants:

```python
>>> recherche_dichotomique([0, 1, 1, 2, 3, 5, 8, 13, 21], 12)
>>> recherche_dichotomique([0, 1, 1, 2, 3, 5, 8, 13, 21], 13)
```

On utilise une version modifiée de la fonction récursive, qui affiche la liste de ses paramètres en début de fonction. Évidemment, il faudrait aussi être capable de simuler ces appels à la main lors d'une épreuve écrite !

In [None]:
def recherche_dicho_rec(tableau, but, g, d):
    print(f"recherche_dicho_rec({tableau}, {but}, {g}, {d})")
    
    if g > d:
        return 0
    else:
        m = (g + d) // 2
        if tableau[m] == but:
            return 1
        elif tableau[m] < but:
            return 1 + recherche_dicho_rec(tableau, but, m + 1, d)
        else:
            return 1 + recherche_dicho_rec(tableau, but, g, m - 1)

def recherche_dicho(tableau, but):
    return recherche_dicho_rec(tableau, but, 0, len(tableau) - 1)

In [None]:
recherche_dicho([0, 1, 1, 2, 3, 5, 8, 13, 21], 12)

Remarquons qu'il y a ici 4 appels récursifs, mais le dernier n'examine aucune valeur puisque $7 > 6$. Le nombre de valeurs examinées renvoyé par la fonction est donc bien 3, et pas 4.

In [None]:
recherche_dicho([0, 1, 1, 2, 3, 5, 8, 13, 21], 13)

---
### Exercice 7

> Cet exercice ne concerne pas la recherche dichotomique, mais est une variation sur le principe de "diviser pour régner" en algorithmique.

Dans cet exerice, nous allons manipuler une image au format `jpeg`. Pour cela, nous allons utiliser la librairie PIL (Python Image Library), de la manière suivante:

In [None]:
from PIL import Image
im = Image.open("joconde.jpg")
largeur, hauteur = im.size
px = im.load()
im.show()

1. Pour cela, vous implémenterez une fonction `rotation_rec(px, x, y, t)` qui effectuera une rotation de la portion carrée (de côté $t$) de l'image comprise entre les pixels de coordonnées $(x, y)$ et $(x + t - 1, y + t - 1)$. Cette fonction ne renvoie aucune valeur, mais modifie le tableau `px` en place. On suppose que `t` est une puissance de 2 (ce qui est le cas pour l'image de la joconde fournie avec ce TP).

In [None]:
def rotation_rec(px, x, y, t):
    t = t // 2
    # On tourne (récursivement) les 4 sous-images si t > 1:
    if t > 1:
        rotation_rec(px, x, y, t)
        rotation_rec(px, x+t, y, t)
        rotation_rec(px, x, y+t, t)
        rotation_rec(px, x+t, y+t, t)
    
    # On fait ensuite pivoter ces 4 sous-images.
    for i in range(t):
        for j in range(t):
            a, b, c, d = px[x+i, y+j], px[x+i, y+t+j], px[x+t+i, y+t+j], px[x+t+i, y+j]
            px[x+i, y+j], px[x+i, y+t+j], px[x+t+i, y+t+j], px[x+t+i, y+j] = d, a, b, c

2. Écrivez aussi la fonction d'appel `rotation(px, t)` qui effectue une rotation de l'image toute entière.

In [None]:
def rotation(px, t):
    rotation_rec(px, 0, 0, t)

In [None]:
from PIL import Image
im = Image.open("joconde.jpg")
largeur, hauteur = im.size
assert largeur == hauteur
px = im.load()
rotation(px, largeur)
im.show()

3. Modifiez votre appel récursif pour qu'il s'arrête systématiquement au bout de `d` appels (`d` étant un entier positif ou nul). Lorsque l'on sera à la condition d'arrêt `d == 0`, on se contentera de déplacer les sous-carrés, mais sans effectuer de nouvel appel récursif.

  Cette variation permet d'appeler une première fois avec `d = 1` puis d'afficher l'image, pour ensuite recommencer (depuis l'image initiale) avec `d = 2`, et ainsi de suite. Vous pourrez ainsi voir la succession des étapes de l'algorithme.

In [None]:
def rotation_rec(px, x, y, t, d):
    t = t // 2
    # On tourne (récursivement) les 4 sous-images si t > 1:
    if t > 1 and d > 0:
        rotation_rec(px, x, y, t, d-1)
        rotation_rec(px, x+t, y, t, d-1)
        rotation_rec(px, x, y+t, t, d-1)
        rotation_rec(px, x+t, y+t, t, d-1)
    
    # On fait ensuite pivoter ces 4 sous-images.
    for i in range(t):
        for j in range(t):
            a, b, c, d = px[x+i, y+j], px[x+i, y+t+j], px[x+t+i, y+t+j], px[x+t+i, y+j]
            px[x+i, y+j], px[x+i, y+t+j], px[x+t+i, y+t+j], px[x+t+i, y+j] = d, a, b, c

def rotation(px, t, d):
    rotation_rec(px, 0, 0, t, d)

In [None]:
# from PIL import Image
for d in range(9):
    im = Image.open("joconde.jpg")
    largeur, hauteur = im.size
    assert largeur == hauteur
    px = im.load()
    rotation(px, largeur, d)
    print(f"Étape n°{d + 1}")
    im.show()