***
# IAS1 Cours 11 - Recherche dans une liste et complexité
***

## Sommaire

* <a href="#Objectifs">Objectifs</a>
* <a href="#Introduction">Introduction</a>
* <a href="#Recherche-séquentielle-dans-une-liste-non-triée">Recherche séquentielle dans une liste non triée</a>
* <a href="#Recherche-séquentielle-dans-une-liste-triée">Recherche séquentielle dans une liste triée</a>
* <a href="#Recherche-par-dichotomie">Recherche par dichotomie</a>
* <a href="#Recherche-d'extremums">Recherche d'extremums</a>
* <a href="#Complexité-d'un-algorithme">Complexité d'un algorithme</a>


## Objectifs

- Implémenter un algorithme de recherche séquentielle dans une liste non triée ;
- Programmer un algorithme de recherche séquentielle dans une liste triée ;
- Implémenter un algorithme de recherche par dichotomie ;
- Programmer un algorithme de recherche d'extremums ;
- Comprendre la notation de 'Grand O' ($O$) ;
- Appréhender les consquences de la compléxité algorithmique ;
- Déterminer la complexité d'algorithmes simples.
***

## Introduction

On appelle **recherche associative** le fait que le critère de recherche ne porte que sur la valeur de la clé de l’élément recherché.
La recherche est qualifée de : 
* **positive** lorsque la clé recherchée est présente dans la collection de données ;
* **négative** lorsque la clé recherchée est absente de la collection de données.

Les recherches présentées ici se feront sur des listes. La recherche d'une donnée dans une liste va être conditionnée par la façon dont la liste est ordonnée. En effet, l'algorithme de recherche à utiliser sera différent selon si la liste dans laquelle nous recherchons une donnée est triée ou non.

## Recherche séquentielle dans une liste non triée

Le premier cas abordé est le cas d'une recherche séquentielle dans une liste non triée. On se place sur le premier élément de la liste. Tant qu’il reste des éléments, et que l’élément courant n’est pas x, on avance à l’élément suivant. Si la liste a été parcourue entièrement, la recherche est négative. Elle est positive sinon : l’élément sur lequel on s’est arrêté est celui cherché.

Voyons l'exemple de la recherche d'un élément `x` dans une liste `L` :

In [None]:
def recherche_sequentielle_LNT(L,x):
    
    n = len(L)    
    for element in L: # on itère directement sur la liste
        
        if element == x:
            return True
        
    return False # arrivé à la fin de la liste, l'élément n'est pas présent

print(recherche_sequentielle_LNT([5, 3, 9, 17, 8, 11, 13, 4, 17, 6],13))

## Recherche séquentielle dans une liste triée

Les cas de recherches séquentielles peuvent être améliorés lorsque la liste est triée : il est inutile de continuer la recherche si la valeur cherchée a été dépassée. On se place sur le premier élément de la liste. Tant qu’il reste des éléments, et que l’élément courant n’a pas dépassé x, on avance à l’élément suivant. On a trouvé l’élément si on n’a pas parcouru toute la liste et si l’élément sur lequel on s’est arrêté est x.

Voyons l'exemple de la recherche d'un élément `x` dans une liste `L` :

In [4]:
def recherche_sequentielle_LT(L,x):
    
    n = len(L)
    for element in L: # on itère directement sur la liste
        
        if element == x:
            return True
        if element > x:
            return False
        
    return False # arrivé à la fin de la liste, l'élément n'est pas présent

print(recherche_sequentielle_LT([1, 3, 5, 7, 8, 10, 13, 14, 17, 19],13))

True


## Recherche par dichotomie

La recherche séquentielle impose dans le pire des cas le parcours de l'ensemble des éléments de la liste pour identifier si une valeur y est présente.

Si l'on manipule une **liste triée**, il existe plusieurs algorithmes de recherche plus efficaces que la recherche séquentielle. En effet, ces algortihmes présentent une efficacité accrue du fait qu'ils sont régis par des mécanismes de recherche. Parmi eux, nous aborderons ce semestre l'algorithme de recherche par dichotomie.

Soit une liste `L`, un élément `x` recherché et `m` le milieu de la liste `L` :
- si x = ième(L, m), la recherche est positive ;
- si x < ième(L, m), on poursuit donc la recherche sur la moitié inférieure de la liste L ;
- si x > ième(L, m), on poursuit donc la recherche sur la moitié supérieure de la liste L ;
- si la recherche se termine sur une liste vide, la recherche est négative.

Voyons l'exemple de la recherche d'un élément `x` dans une liste `L` :

In [5]:
def recherche_dichotomique(L, x):
    
    g = 0
    d = len(L) - 1
    
    while g <= d:
        m = (g + d) // 2
        
        if L[m] == x:
            return True
            
        if x < L[m]:
            d = m - 1
                
        else:
            g = m + 1
                
    return False

print(recherche_dichotomique([1, 3, 5, 7, 8, 10, 13, 14, 17, 19],13))

True


## Recherche d'extremums

La recherche d'un minimum ou d'un maximum dans une liste triée revient à récupérer les bornes inférieures et supérieures de la liste, à savoir les extremums de la liste. Nous regarderons doncici la recherche d'un minimum ou d'un maximum dans le cas d'une liste non triée. La démarche de celle-ci identique à la recherhe séquentielle vue précédement, recherche dans laquelle nous viendrons comparer à chaque nouvel élémént visité l'élément le plus petit/grand élément identifié à l'itération i-1.

Voyons l'exemple de la recherche d'extremums dans une liste `L` :

In [5]:
def recherche_min(L):
    
    mini = L[0]
    for element in L:
        
        if element < mini:
            mini=element
        
    return mini 
print(recherche_min([5, 3, 9, 17, 8, 11, 13, 4, 2, 6]))

1


In [6]:
def recherche_max(L):
    
    maxi = L[0]
    for element in L:
        
        if element > maxi:
            maxi=element
        
    return maxi
print(recherche_max([5, 3, 9, 17, 8, 11, 13, 4, 2, 6]))

17


## Complexité d'un algorithme

Il existe souvent plusieurs algorithmes qui permettent d'effectuer la même tâche. Par exemple, dans le cas de la recherche d'une racine d'un polynôme, nous aurons la possibilité d'utiliser la recherche par dichotomie mais également la méthode de Newton ou encore la méthode de Lagrange.

Il donc important de connaitre les performances des algorithmes que nous utilisons, en particulier savoir quels seront les temps de calcul mis en jeu en fonction de la taille du problème traité. La performance d'un algorithme est connue sous le nom de *complexité* d'un algorutihme et nous permet de choisir un algorithme approprié en réponse à un problème donné.

### Complexité et notion de 'Grand O'

On considère un problème de taille $n$ (par exemple dans le cas d'un algorithme qui trie une liste, $n$ représenterait la longueur de la liste). Pour beaucoup d'algorithmes, quand $n$ est grand, nous pouvons exprimer le coût en temps par :

$$
t = C g(n)
$$


où $C$ est une constanteand $g$ est une fonction. Si le coût peut être exprimé ainsi, où $C$ est une constante, alors nous pouvons écrire la notion de 'Grand O' :

$$
t = O(g(n))
$$

Considérons maintenant plusieurs expressions communes de $g(n)$ :

- **Constant** : Pour un algorithme *en temps constant*, nous avons $t = O(1)$. Cela veut dire que le temps de calcul sera *indépendant* de la taille du problème $n$ ;

- **Polynomial** : Pour un algorithme *en temps polynomial*, nous avons :
$$
t = O(n^k)
$$

où $k \ge 1$ est une constante (pas nécéssairement entière). Les cas usuels sont :

    - $O(n)$: Complexité linéaire ;
    - $O(n^2)$: Complexité quadratique ;
    - $O(n^3)$: Complexité cubique.

- **Logarithmique** : Pour un algorithme *en temps logarithmique*, nous avons $t = O(\log n)$.

- **Quasi-linéaire** : Un grand nombre d'algorithmes est *en temps quasi-linéaire* dans lequel nous avons $t = O(n\log n)$.

- **Exponentiel** : Certains algorithmes sont *en temps exponentiel* dans lequel $t = O(c^{n})$, où $c \ge 1$.

### Déterminer la complexité d'un algorithme

Pour déterminer la complexité d'un algorithme, il suffit seulement de compter le nombre d'opérations effectuées par l'algorithme. Par exemple, si l'on considère un tableau `x` de longueur $n$ que l'on multiplie par un réel $a$ :

In [1]:
n = 100000
x = np.random.rand(n)

a = 10.0
for i in range(n):
    x[i] = a*x[i]

Le coût de l'opération ` x[i] = a*x[i]` est $O(1)$ pour chaque `i`, et cela est répété $n$ fois, donc au final le coût est $O(n)$.

Dans le précédent exemple, la complexité de l'algorithme est indépendante de la position initiales des données dans le tableau, la complexité dépend uniquement de la taille du problème $n$ (ie la longueur du tableau). Pour d'autres algorithmes, comme les algorithmes de recherche ou de tri, la complexité de l'algorithme dépend également de la façon dont les données initailes sont ordonnées, par exemple si le tableau est initialement trié ou non. Ainsi, nous pourrons envisager 3 cas lors du calcul de la complexité :

- Pire cas ;
- Cas moyen ;
- Meilleur cas.

Ainsi, quand un algorithme est présenté, les 3 cas de complexité algorithmique sont identifiés en fonction des conditions initiales du problème traité.

## Exercices de TD

Vous pouvez maintenant vous exercer à partir du notebook [TD 11 - Recherche dans une liste et complexité](../TD/TD%2011%20-%20Recherche%20dans%20une%20liste%20et%20complexité.ipynb).