<div class = "alert alert-success">

# Problématique

On dispose d'un texte, sous forme d'une variable de type string, dans lequel on cherche la présence d'un motif (une chaîne de caractères aussi), ainsi que sa position.

On peut alors facilement prolonger pour compter le nombre d'occurences de motif dans le texte.
    
Il s'agit par exemple de chercher dans un brin d'ADN la présence du code qui permet la fabrication d'une protéine particulière.

Cette fonction existe déjà en Python. Il s'agira pour nous de travailler sur certaines notions algorithmiques. Nous allons d'abord envisager la chose sous la forme d'un algorithme "naif", puis nous étudierons l'algorithme de Boyer-Moore, dans une version simplifiée due à Horspool.
</div>
<div class = "alert alert-info">

### Point d'histoire

Robert S. Boyer et J Strother Moore étaient professeurs à l'université du Texas à Austin, en informatique et mathématiques. Ils ont conçu leur algorithme de recherche textuelle en 1977. Ils ont par ailleurs collaboré sur un programme de démontration automatique (Boyer-Moore Theorem Prover ou Nqthm - 1992)<br/>
Son algorithme de recherche textuelle date de 1980.
</div>

# Approche naïve

### Notation

Pour la suite le texte dans lequel on effectue la recherche est identifié par la variable `texte` et le motif cherché par la variable `motif`.<br>
On note `n` la longueur de `texte` et `p` celle de `motif`.<br>
On a évidemment $n \geqslant p$.<br>
On note `i` l'indice de la position de `texte` où on cherche `motif` et `j` l'indice du caractère qu'on compare.

### Principe

Prenons `texte = "abracadabra"` et `motif = "dab"`. Donc `n = 11` et `p = 3`.<br>
Le principe consiste à déplacer une fenêtre de longueur 3 dans `texte`, de gauche à droite depuis l'indice `i=0` jusqu'à l'indice `i=8` et dans chaque fenêtre de comparer les caractères un par un.<br>
En cas de défaut de correspondance, on déplace la fenêtre d'un caractère vers la droite.<br>
En cas de correspondance, on a trouvé une occurence de `motif` à la position `i`.

`i=0`

    i      0 1 2 3 4 5 6 7 8 9 10
    texte |a b r|a c a d a b r a
    motif |d a b|
    j      0 1 2

pas de correspondance -> `i=1`

    i      0 1 2 3 4 5 6 7 8 9 10
    texte  a|b r a|c a d a b r a
    motif   |d a b|
    j        0 1 2

pas de correspondance -> `i=2` ... `i=6`

    i      0 1 2 3 4 5 6 7 8 9 10
    texte  a b r a c a|d a b|r a
    motif             |d a b|
    j                  0 1 2

correspondance -> on a trouvé une occurence à `i=6`

<div class = "alert alert-warning">

### Exercice 1.1

Nous allons coder cette approche naîve en utilisant deux fonctions.

Première fonction :
</div>

In [None]:
def correspondance(texte, motif, i, p):
    """ fonction qui compare les caractères de texte de l'indice i à i+p-1
        avec ceux du motif de l'indice 0 à l'indice p-1
        renvoie ok un booléen qui vaut
            True si tous les caractères correspondent
            False si au moins une paire de caractères sont différents
    """
    pass # à compléter

Pour tester :

In [None]:
texte = "abracadabra"
motif = "dab"
assert not correspondance(texte, motif, 0, len(motif))
assert correspondance(texte, motif, 6, len(motif))

<div class = "alert alert-warning">

### Exercice 1.2

Deuxième fonction :
</div>

In [None]:
def cherche(texte, motif):
    """ fonction qui parcourt texte en décalant la fenêtre de comparaison
        de 1 vers la droite tant que le motif n'a pas été trouvé.
        Si le motif est trouvé, renvoie l'indice de sa position.
        Si le motif n'est pas dans le texte, renvoie -1
    """
    n = len(texte)
    p = len(motif)
    pass # à compléter

pour tester :

In [None]:
texte = "abracadabra"
motif = "dab"
assert cherche(texte, motif)==6
motif = "rac"
assert cherche(texte, motif)==2
motif = "bad"
assert cherche(texte, motif)==-1

<div class = "alert alert-warning">

### Exercice 1.3

Pour aller plus loin
</div>

In [None]:
def nb_occurences(texte, motif):
    """ Fonction qui renvoie le nombre d'apparitions de motif dans texte
        Utilise la fonction cherche précédente.
        Si le motif a été trouvé à l'indice position,
        cherche(texte[position+1:], motif) permet de poursuivre la recherche
        sur le reste du texte.
    """
    pass # à compléter

Pour tester

In [None]:
texte = "abracadabra"
motif = "dab"
assert nb_occurences(texte, motif)==1
motif = "bra"
assert nb_occurences(texte, motif)==2
motif = "bad"
assert nb_occurences(texte, motif)==0