# TD : Algorithmes de recherche - Correction

## Exercice 1 : Recherche séquentielle

Les deux fonctions ci-dessous implémentent la recherche séquentielle
d’un caractère dans une chaîne. Elles fonctionnent aussi pour la
recherche d'un élément dans une liste.

In [None]:
#Version 1
def appartient1(caractere, ch):
    i = 0
    rep = False
    while i < len(ch):
        if ch[i] == caractere:
            rep = True
        i += 1
    return rep


#Version 2
def appartient2(caractere, ch):
    i = 0
    rep = False
    while i < len(ch) and not rep:
        if ch[i] == caractere:
            rep = True
        i += 1
    return rep


car = "a"
ch = "Super, c'est parfait !"
if appartient1(car, ch):
    print("Le caractère", car, "est dans la chaîne", ch)
else:
    print("Le caractère", car, "n'est pas dans", ch)

Combien de comparaisons (entre caractères) sont effectuées par chaque fonction pour rechercher le caractère `"a"` dans la chaîne `"bbbba"` ? dans la chaîne `"bbabb"` ? dans la chaîne `"abbbb"` ?

**CORRECTION :**


* Nombre de comparaisons pour la recherche du caractère `"a"` dans la chaîne `"bbbba"`:
  * Fonction `appartient1` : 5
  * Fonction `appartient2` : 5
* Nombre de comparaisons pour la recherche du caractère `"a"` dans la chaîne `"bbabb"`:
  * Fonction `appartient1` : 5
  * Fonction `appartient2` : 3
* Nombre de comparaisons pour la recherche du caractère `"a"` dans la chaîne `"abbbb"`:
  * Fonction `appartient1` : 5
  * Fonction `appartient2` : 1

## Exercice 2 : Inclusion

Définir une fonction `inclus` prenant deux chaînes de caractères et retournant `True` si tous les caractères de la première chaîne sont inclus dans la deuxième, et `False` sinon.

In [None]:
##################
#   Correction   #
##################


def inclus(ch1, ch2):
    i = 0
    while i < len(ch1):
        if not appartient2(ch1[i], ch2):
            return False
        i += 1
    return True


c1 = "hello"
c2 = "Il fait beau aujourd'hui"

if inclus(c1, c2):
    print("Tous les caractères de", c1, "sont dans", c2)
else:
    print(c2, "ne contient pas tous les caractères de", c1)

Quelle est la complexité de cette fonction dans le pire des cas ?

**CORRECTION :**


Si les deux chaînes contiennent `n` caractères, alors on fait dans le pire des cas `n` appels à la fonction `appartient2` qui a une complexité linéaire. On a donc une complexité quadratique.

(Si les chaînes contiennent respectivement `n` et `m` caractères, alors la complexité est en `O(nm)`.)

## Exercice 3 : Application de la recherche dichotomique

Soit un tableau de 17 nombres triés :

`tab = [10, 13, 19, 28, 29, 32, 34, 37, 39, 42, 48, 49, 72, 81, 86, 93, 96]`

- Appliquer à la main l’algorithme de dichotomie pour rechercher le nombre 19. Faire un tableau d’évolution des variables `debut`, `milieu` et `fin`.
Combien d'itérations sont faites ?

**CORRECTION :**


Itération | Début | Fin | Milieu
-----------|----------|--------|-------
0 | 0 | 16 | 8
1 | 0 | 7 | 3
2 | 0 | 2 | 1
3 | 2 | 2 | 2

On a 3 itérations au total.

- Faire de même pour le nombre 20.

**CORRECTION :**


itération | debut | fin | milieu
-----------|----------|--------|-------
0 | 0 | 16 | 8
1 | 0 | 7 | 3
2 | 0 | 2 | 1
3 | 2 | 2 | 2
4 | 3 | 2 | 2

On a 4 itérations au total.

- D'une façon générale, quel est le nombre maximal d'itérations fait par un algorthme de recherche par dichotomie ? Quelle est la complexité dans le pire cas de cet algorithme ? Pourquoi ? 

**CORRECTION :**


**Nombre d'itérations**
Dans le pire cas, pour un tableau de taille $n$, il faut faire $\lfloor \log_2(n) + 1 \rfloor$ itérations. Par exemple, il faut au plus 5 itérations pour rechercher une valeur dans un tableau de taille 25.

*Remarque :* Le nombre d'itérations (dans le pire cas) peut s'expliquer de la manière suivante. 
- *Cas où $n$ est une puissance de 2 ($n=2^k$):* si le tableau a une case, alors il n'y a qu'une valeur à regarder (*i.e.*, une itération). Il faut une itération de plus à chaque fois que la taille double. Il faut donc $k+1$ itérations, soit $\log_2(n) + 1$ itérations.



- *Cas général :* la recherche dichotomique se déroulant en au plus $k$ itérations permet de rechercher une valeur dans un tableau trié de taille au plus $2^k-1$. En effet, 
  - vrai pour $k = 1$,
  - Si c'est vrai pour $k$, alors en $k+1$ itérations, on peut faire la recherche sur un tableau pour lequel la recherche dichotomique sur les parties gauche et droite du tableau se fait en au plus $k$ itérations.
  ![alt](img/dicho.svg)
  Les parties gauche et droite ont une taille d'au plus $2^k - 1$ (par hypothèse) donc la taille totale du tableau est : $(2^k-1) + 1 + (2^k-1) = 2^{k+1}-1$.

  Pour un tableau de taille $n$, le nombre d'itérations nécessaires est donc égal au plus petit entier $k$ tel que $n+1 \leq 2^k$, soit $k = \lceil log_2(n+1) \rceil = \lfloor \log_2(n) + 1 \rfloor$.

**Complexité**
Comme le nombre d'opérations élémentaires par itération est borné par une constante, la complexité totale est en $O(\log_2(n))$.

## Exercice 4 : Inclusion avec des chaînes triées

On souhaite définir une fonction `inclus2` prenant deux chaînes
de caractères triées dans l'ordre alphabétique et renvoyant
`True` si tous les caractères de la première sont inclus
dans la deuxième, et `False` sinon. 

Peut-on utiliser le fait que les chaînes soient triées pour
améliorer l'algorithme de l'exercice 2 ?

In [None]:
##################
#   Correction   #
##################


# Comme ch2 est trié, on peut faire une recherche dichotomique
# Comme ch1 est trié :
# - si ch1 comporte plusieurs fois le même caractère, on ne le teste qu'une fois
# - on commence à chercher dans ch2 à l'endroit où on a trouvé le caractère précédent


def recherche_dt_debut(element, tab, debut):
    """Recherche si tab contient element à partir de l'indice début."""
    fin = len(tab) - 1
    milieu = (debut + fin) // 2
    while debut <= fin:
        if element == tab[milieu]:  # on a trouvé l'élément
            return milieu
        elif element < tab[milieu]:
            fin = milieu - 1  # on considère la partie gauche du tableau
        else:
            debut = milieu + 1  # on considère la partie droite du tableau
        milieu = (debut + fin) // 2
    return -1


def inclus2(ch1, ch2):
    j = recherche_dt_debut(ch1[0], ch2, 0)
    i = 1
    while i < len(ch1) and j != -1:
        if ch1[i] != ch1[i - 1]:  # si c'est un caractère différent
            j = recherche_dt_debut(ch1[i], ch2, j)
        i += 1
    if j == -1:
        return False
    return True


c1 = "ehllo"
c2 = "   'Iaaabdefhiijlortuuuu"

if inclus2(c1, c2):
    print("Tous les caractères de", c1, "sont dans", c2)
else:
    print(c2, "ne contient pas tous les caractères de", c1)