# Problèmes de recherche

## Entrées 

- une collection $l$
- une valeur $x$

# Sortie

Vrai si $x$ est présent dans $l$, faux sinon

# Problème de recherche dans une séquence

## Entrées

- $l$ : structure de données séquentielle de $n$ éléments
- $x$ : une valeur
- $a$ et $b$ : deux indices (entiers)

## Hypothèses

- On suppose que l'on peut accéder directement à un élément par son indice compris entre 0 et $n$ - 1
- Si $a \geq b$, on suppose que l'on cherche dans une séquence vide
- Opérateurs de comparaison (```<, >, <=, >=, ==```) sur les éléments
- Dans le cours, on travaillera sur des listes (```list```) python mais on pourrait aussi travailler avec des chaînes de caractères ou des tuples
- _Coût_ de l'algorithme ```==``` nombre de comparaisons entre $x$ et un élément de $l$

## Sortie

Vrai si $x \in l[a:b]$ (b exclus), Faux sinon

## Variante

- Quel est l'indice $i$ tel que $l[i] == x$ ?
- Quel est le plus petit indice ?
- Quel est le plus grand indice ?
- Quels sont tous les indices ?

# Structure séquentielle non triée

## Recherche séquentielle naïve

- Utilisation d'une variable booléenne ```présent``` pour indiquer si $x$ est dans $l$
- Au début, ```présent``` vaut ```False```
- On parcours la liste, si on trouve l'élément, on bascule ```présent``` à ```True```



In [1]:
def recherche_séquentielle_naïve(l, x, a, b):
    présent = False
    for i in range(a, b):
        if x == l[i]:
            présent = True
    return présent

Coût pour une recherche dans une séquence de $n = b - a$ éléments : $n$ comparaisons

## Recherche séquentielle

Même principe que précédemment mais on s'arrête quand on a trouvé l'élément

Version avec une boucle ```while``` :

In [None]:
def recherche_séquentielle(l, x, a, b):
    présent = False
    i = a
    
    while not présent and i < b:
        if x == l[i]:
            présent = True
        i += 1
        
    return présent

Version avec une boucle ```for``` :

In [None]:
def recherche_séquentielle(l, x, a, b):
    for i in range(a, b):
        if x == l[i]:
            return True
    return False

Coût pour une recherche parmi une séquence de $n = b - a$ éléments

- Meilleur des cas : 1 comparaison ($x$ est le premier élément de $l$)
- Pire des cas : $n$ comparaisons ($x$ est le dernier élément de $l$ ou $x$ n'est pas présent dans $l$)

# Structure séquentielle triée

*Hypothèse :* on suppose que la struture est triée par ordre croissant

- Non trié : ```[0, 20, 10, 30, 50, 40]```
- Trié par ordre croissant : ```[0, 10, 20, 30, 40, 50]```
- Trié par ordre décroissant : ```[50, 40, 30, 20, 10, 0]```

## Recherche séquentielle

Même principe que l'algorithme précédent avec ajout d'une condition d'arrêt supplémentaire :

- Si l'élément d'indice $i$ est strictement plus grand que $x$, on s'arrête car $x$ ne peut pas apparaître dans la suite de la séquence

Version avec une boucle ```while``` :

In [None]:
def recherche_séquentielle(l, x, a, b):
    présent = False
    fini = False
    i = a
    
    while not présent and not fini and i < b:
        if x == l[i]:
            présent = True
        elif x < l[i]:
            fini = True
        else:
            i += 1
            
    return présent
            

Version avec une boucle ```for``` :

In [None]:
def recherche_séquentielle(l, x, a, b):
    for i in range(a, b):
        if x == l[i]:
            return True
        elif x < l[i]:
            return False
    return False

Coût pour une recherche parmi une séquence de $n = b - a$ éléments

- Meilleur des cas : 1 comparaison ($x$ est le premier élément de $l$)
- Pire des cas : $n$ comparaisons ($x$ est le dernier élément de $l$ ou $x$ n'est pas présent dans $l$)

## Diviser pour régner

Principe du paradigme :

1. _Diviser_ le problème en problèmes identiques de plus petites tailles
2. _Résoudre_ les sous-problèmes définis
3. _Combiner_ les résultats des sous-problèmes pour répondre au problème initial

## Application à la recherche dans une séquence triée

1. _Diviser_ : on recherche $x$ dans une moitié de la liste (on choisit quelle sous-liste en se comparant à l'élément d'indice médian)
2. _Résoudre_ : on réapplique l'algorithme sur la demi-liste sélectionnée (récursivité)
3. _Combiner_ : on récupère directement le résultat sur le sous-problème (il n'y en a qu'un)


## Définition récursive :

$$
		\text{recherche\_dichotomique}(l, x, a, b) =
		\begin{cases}
		False & \text{si } a \geq b \text{ (la séquence est vide)}	\\
		True & \text{si } a < b \text{ et } x == l[m]  \\
		\text{recherche\_dichotomique}(l, x, a, m) & \text{si } x < l[m] \\
		\text{recherche\_dichotomique}(l, x, m+1, b) & \text{si } x > l[m]
		\end{cases}
		$$

avec $m = \lfloor\frac{a + b - 1}{2}\rfloor$.

## Implémentation récursive :

In [None]:
def recherche_dichotomique(l, x, a, b):
    if a >= b:
        return False
    else:
        m = (a + b - 1) // 2
        if x == l[m]:
            return True
        elif x < l[m]:
            return recherche_dichotomique(l, x, a, m)
        else:
            return recherche_dichotomique(l, x, m+1, b)

## Implémentation itérative :

In [None]:
def recherche_dichotomique(l, x, a, b):
    présent = False
    
    while not présent and a < b:
        m = (a + b - 1) // 2
        if x == l[m]:
            présent = True
        elif x < l[m]:
            b = m
        else:
            a = m + 1
    
    return présent    

## Coût de la recherche dichotomique

- Meilleur des cas : 1 (x == l[(a + b - 1) // 2])
- Dans le pire des cas : environ $\log_2(n) << n$ (pour $n$ grand) ($x$ n'est pas présent dans $l$)

# Quel algorithme de recherche choisir ? 

- Structure non triée : recherche séquentielle en s'arrêtant quand on a trouvé $x$

- Structure triée :

Nombre de comparisons pour différentes valeurs de $n = a - b$

|$n$ | Dichotomie | Séquentielle |
|:---|:---|:---|
|128 | entre 1 et 7 | entre 1 et 128 |
|1024 | entre 1 et 11 | entre 1 et 1024 |
|$10^6$ | entre 1 et 21 | entre 1 et $10^6$ | 

# Exercices

## Exercice 1

Il est possible d'adapter la recherche séquentielle dans un tableau pour retrouver certaines valeurs remarquables : plus grande valeur, plus petite valeur ... Le principe est d'utiliser une variable initialisée soit par une valeur possible, soit par une valeur qui sera toujours moins bonne que ce qui se trouve dans le tableau. Puis, on parcourt le tableau en mettant à jour cette variable si on trouve un meilleur candidat. 

1. Écrivez une fonction qui retourne la plus grande valeur dans un tableau d'entiers.

In [1]:
def plus_grand_tableau (tableau):
    res = tableau[0]
    #print ("res =", res)
    #print("taille du tableau =",len(tableau))
    for i in range (len(tableau)):
        #test = tableau[i]
        #print ("i =",i)
        if tableau[i] > res :
            #print ("La valeur de i",i,"entre dans la boucle")
            res = tableau [i]
            #print (" res dans if =", res)
    return res

print("La valeur la plus grande du tableau est :",plus_grand_tableau([5,3,6,9,8,7,4,4,1,2,35,10,50]))

La valeur la plus grande du tableau est : 50


2. Écrivez une fonction qui retourne l'indice de la plus petite valeur dans un tableau d'entiers. Si le minimum apparaît plusieurs fois, la fonction doit retourner l'indice de la première occurrence.

In [23]:
def plus_grand_tableau (tableau):
    res = tableau[0]
    for i in range (len(tableau)):
        #test = tableau[i] 
        if tableau[i] < res :
            res = tableau[i]
            resindice = i
    return resindice

print("L'itération la plus petite du tableau est :",plus_grand_tableau([5,3,6,9,8,7,4,4,1,2,35,10,50]))

L'itération la plus petite du tableau est : 8



## Exercice 2

Les algorithmes vu en cours travaillent sur des séquences triées par ordre croissant.

1. Réécrivez l'algorithme de recherche séquentielle dans le cas où la liste $l$ est triée en ordre décroissant.

In [None]:
def recherche_séquentielle(l, x, a, b):
    for i in range(a, b):
        if x == l[i]:
            return True
        elif x > l[i]:
            return False
    return False

In [18]:
def est_dans_la_liste_decroissante(x,l):
    comp=0
    while comp<len(l) and x<=l[comp] :
        if x==l[comp]:
            return True
            comp+=1
        return False

2. Réécrivez l'algorithme de recherche dichotomique (version récursive ou itérative) dans le cas où la liste $l$ est triée en ordre décroissant.

In [None]:
def dichoto_decroissante(x,l):
 if x==l[0] or x==l[-1]:
    return True
    a=0
    b=len(l)-1
    while (a+1)<b:
        test=(a+b)//2
        if l[test]==x:
            return True
        if x<l[test]:
            a=test
        if x>l[test]:
            b=test
    return False

## Exercice 3

Les algorithmes vu en cours retournent un booléen qui indique si l'élément recherché est dans la liste ou non. On considère ici des séquences triées par ordre croissant.

1. Adaptez l'algorithme de recherche séquentielle pour qu'il retourne le plus petit indice où se trouve $x$ s'il est présent dans $l$ et la longueur de $l$ sinon.

In [None]:
def recherche_séquentielle(l, x, a, b):
    for i in range(a, b):
        if x == l[i]:
            return True
        elif x > l[i]:
            return False
    return False

In [13]:
def recherche_indice(l,x):
    for i in range (len(l)):
        test = l[i]
        if test == x :
            return i
    return len(l)

print(recherche_indice([4,8,9,7,1,2,3,5,4,6,8],5))

7


2. Adaptez l'algorithme de recherche dichotomique pour qu'il renvoie l'indice de l'élément recherché s'il s'y trouve et la longueur de la liste sinon. Si l'élément apparaît plusieurs fois, on retournera n'importe quel indice parmi les indices possibles.

In [None]:
def recherche_dichotomique(l, x, a, b):
    if a >= b:
        return False
    else:
        m = (a + b - 1) // 2
        if x == l[m]:
            return True
        elif x < l[m]:
            return recherche_dichotomique(l, x, a, m)
        else:
            return recherche_dichotomique(l, x, m+1, b)

## Exercice 4

On considère des listes triées par ordre croissant. En vous basant sur la recherche séquentielle, écrivez une fonction qui prend une liste $l$ en paramètre et qui retourne ```True``` si la liste passée en paramètre est triée par ordre croissant et ```False``` sinon.


*Indication :* cela revient à rechercher s'il y a deux éléments aux indices $i$ et $i+1$ qui ne sont pas rangés dans le bon ordre.

In [39]:
def recherche_sequentielle_v3(l):
    l = l + [""]
    for i in range (len(l)):
        if l[i+1] == [""]:
            return True
        print("l[i =", l[i])
        print("l[i+1 =", l[i+1])
        if l[i] >= l[i+1]:
            return False

print(recherche_sequentielle_v3([3]))

l[i = 3
l[i+1 = 


TypeError: '>=' not supported between instances of 'int' and 'str'

## Exercice 5

Le principe de recherche dichotomique peut s'appliquer dans un contexte autre que la recherche d'un élément dans un tableau. Elle permet par exemple de gagner à coût sûr en un nombre de tentatives borné au jeu "deviner le nombre" ou pour résoudre certaines équations mathématiques. Si on cherche un entier dans un intervalle $[a, b]$, on commence par proposer l'élément médian $m = (a+b)/2$ (arrondi si nécessaire). Si $m$ est le nombre recherché sinon on recommence en ne considérant qu'un des deux intervalle $[a, m-1]$ or $[m+1, b]$ selon que $m$ était plus grand ou plus petit que le nombre recherché. Ainsi, le nombre de tentatives nécessaire est au plus de l'ordre de $\log_2 n$ avec $n$ le nombre d'éléments dans l'intervalle initial. 

*Remarque :* il n'est pas nécessaire ici d'avoir un tableau contenant les chiffres entre 1 et 100. 

Écrivez un programme où l'ordinateur demande un nombre entre 1 et 100 à l'utilisateur et le retrouve en le moins d'étapes possible via une recherche dichotomique.