<img src="Images/Logo.png" alt="Logo NSI" style="float:right">

<h1 style="text-align:center">TP : Recherche de mots dans une grille</h1>

## Présentation
Il s'agit d'implémenter la structure de données nécessaire pour représenter un dictionnaire efficacement : un **arbre préfixe**.

## Principe des arbres préfixes
Dans cet exercice nous nous proposons de coder un dictionnaire, c'est à dire une structure de données efficace permettant de stocker un ensemble de mots. Le dictionnaire nous permettra de déterminer si une suite de lettres est préfixe ou non d'un mot de cet ensemble. Réaliser cette opération de manière efficace est crucial pour trouver les solutions du jeu posé en introduction.

Prenons comme exemple les mots suivants :

* `lapin`
* `laper`
* `lupin`
* `lopin`
* `louve`
* `loup`
* `loupe`
* `ma`

Il nous faudra coder une structure permettant de stocker ces mots et de répondre à une question du type :

* Le mot `loup` appartient-il à cet ensemble ?
* Existe-t-il des mots commençant par `lap` et si oui, quelles sont les lettres possibles suivant le `p` ?

Pour réaliser ces opérations nous utiliserons un codage par **arbres n-aires**.

Bien entendu, nous aurions pu stocker nos mots dans un tableau trié. Cette solution pose néanmoins deux problèmes : d'une part ce stockage nécessiterait beaucoup de place, et d'autre part l'ajout d'un élément dans le dictionnaire serait linéaire.

Le principe de codage par un arbre n-aire est très simple. Sur notre exemple précédent nous pouvons représenter notre ensemble de mots par l'arbre suivant :

<div style="text-align: center">
<img src="Images/arbre1.jpg" alt="Arbre n-aire">
</div>

## Gestion de la fin de mot
Le problème du codage précédent est qu'il est difficile de distinguer les mots. Par exemple, comment savoir que le mot `loup` est bien un mot de mon ensemble ? Pour corriger ce défaut, nous pouvons ou bien utiliser un marqueur de fin de mot noté `*`, ou bien créer deux types de nœuds dans l'arbre : le premier servirait à représenter les lettres en milieu de mot, tandis que le second représenterait la fin d'un mot.

Voici les deux exemples mis côte à côte. Notez que dans nos arbres, un nœud n'a qu'un seul fils étiqueté par la même lettre.

<div style="text-align: center">
<img src="Images/arbre2.jpg" alt="Arbre n-aire">
</div>

## Écriture de la classe `Noeud`
Nous vous proposons ici de coder les arbres en utilisant le marqueur `*`.

Les classes `Noeud` et `Dictionnaire` seront nécessaires et dans le même fichier.

Complétez la classe `Noeud` et plus spécifiquement son constructeur `Noeud(c)`. Notez en effet que chaque sommet contient un caractère. Par défaut le nœud créé n'aura pas d'enfants. Munissez votre classe d'une méthode `ajouteFils(a)` qui ajoute un fils au nœud courant. Voici un petit exemple d'utilisation de votre classe:

In [None]:
a1 = Noeud('*')
a2 = Noeud('*')
a3 = Noeud('*')
b = Noeud('l')
c = Noeud('e')
d = Noeud('a')
e = Noeud('s')
b.ajouteFils(c)
b.ajouteFils(d)
c.ajouteFils(e)
c.ajouteFils(a1)
d.ajouteFils(a2)
e.ajouteFils(a3)

Remarquez que le code précédent construit l'ensemble de mots `le`, `la`, `les`.

Quelle est la structure de données adaptée pour représenter la liste des enfants d'un nœud ?

Pour vous assurer que vos nœuds sont bien implémentés, vous pouvez ajouter une méthode d'affichage des nœuds.

Avec, par exemple, une sortie du type :

```python
l(e(s(*), *), a(*))
```

## Gestion d'un ensemble de mots : le dictionnaire
Cette classe nœud créée, nous allons maintenant nous intéresser à la classe `Dictionnaire` située dans le même fichier. Cette classe va simplement représenter un dictionnaire.

Dans nos illustrations, vous remarquerez que nous avons laissé un nœud racine, qui ne contient aucun caractère, et qui permet simplement de commencer à parcourir l'arbre. Ainsi, un dictionnaire vide sera constitué d'un arbre réduit à un nœud. Nous pourrons par exemple mettre le caractère `_` (underscore) dans ce nœud. Écrivez la classe `Dictionnaire` ainsi que son constructeur. Cette classe se contentera de maintenir une référence vers le nœud racine de l'arbre.

## Existence d'un mot
Nous voulons maintenant vérifier la présence d'un mot `m` dans le dictionnaire. Pour cela, nous partons d'un arbre et l'idée est de lire le mot `m` lettre par lettre et de descendre dans l'arbre si la lettre suivante est un fils du nœud courant. Sur l'arbre dessiné au début du sujet, si l'on regarde le mot `lapa` alors on regarde le `l` et on voit que la racine a un fils étiqueté par `l`. Nous descendons donc dans ce nœud. Puis nous regardons la lettre `a` et nous descendons donc dans le fils étiqueté par `a` puis de même pour `p`. Arrivé à cette lettre le nœud de l'arbre n'a pas de fils étiqueté par `a` aussi pouvons donc décider que ce mot n'est pas dans l'ensemble. Attention, même si vous pouvez lire tout le mot, ce n'est pas pour cela qu'il est dans le dictionnaire. En effet, si vous lisez pas exemple le mot `lo` dans votre arbre vous pouvez effectivement lire toutes les lettres mais ce n'est pas pour autant un mot du dictionnaire. Il vous faut aussi vérifier que le nœud d'arrivée a bien un fils étiqueté par `*`.

Écrivez la fonction `existeMot(s)` dans la classe `Dictionnaire`.

Une méthode est de programmer une fonction récursive dans la classe nœud appelée `existeMotRecursif(s, pos)` qui verifie si le nœud courant a bien un fils contenant le caractère `s.[pos]`. Dans ce cas on essaye de lire la suite du mot à partir de ce caractère. Sinon le mot n'est pas présent. Attention de gérer le cas final (`pos` égal à `len(s)`).

In [None]:
a1 = Noeud('*')
a2 = Noeud('*')
a3 = Noeud('*')
b = Noeud('l')
c = Noeud('e')
d = Noeud('a')
e = Noeud('s')
b.ajouteFils(c)
b.ajouteFils(d)
c.ajouteFils(e)
c.ajouteFils(a1)
d.ajouteFils(a2)
e.ajouteFils(a3)

dico = Dictionnaire()
dico.racine.ajouteFils(b)

assert dico.existeMot("") == False
assert dico.existeMot("la") == True
assert dico.existeMot("les") == True
assert dico.existeMot("sa") == False
assert dico.existeMot("se") == False
assert dico.existeMot("lu") == False
assert dico.existeMot("l") == False

## Remplissage du dictionnaire
Nous allons maintenant construire le dictionnaire à partir des mots. Pour cela nous allons écrire la fonction `ajouteMot(s)` dans la classe dictionnaire. Cette méthode va être similaire à la fonction `estPrefixe` à savoir que l'on va descendre dans l'arbre tant que l'on peut lire le début du mot, puis lorsque qu'une lettre ne marche pas, on va construire le bout de l'arbre manquant. Par exemple, reprenons l'arbre du début de l'énoncé et imaginons que nous cherchons à rajouter le mot `loutre`. Nous allons donc lire successivement le début du mot à savoir `lou`. Arrivé à la lettre `u`, on s'aperçoit que la lettre suivante `t` n'est pas dans l'arbre. Nous sommes donc dans la position suivante.

<div style="text-align: center">
<img src="Images/arbre3.jpg" alt="Arbre n-aire">
</div>

Arrivés à cette position, nous allons rajouter le bout d'arbre manquant et nous obtenons le nouvel arbre suivant.

<div style="text-align: center">
<img src="Images/arbre4.jpg" alt="Arbre n-aire">
</div>

Programmez la fonction `ajouteMot`. Votre fonction devra renvoyer `True` si le mot a bien été ajouté et `False` si le mot était déjà présent dans le dictionnaire.

In [None]:
dico =  Dictionnaire();  System.out.println(dico);
b1 = dico.ajouteMot("le")
assert b1 == True
b2 = dico.ajouteMot("loup")
assert b2 == True
dico.ajouteMot("les")
dico.ajouteMot("louve")
assert dico.existeMot("le") == True
assert dico.existeMot("les") == True
assert dico.existeMot("lou") == False
assert dico.existeMot("lesa") == False
assert dico.existeMot("loupp") == False
assert dico.ajouteMot("le") == False
assert dico.ajouteMot("loup") == False
assert dico.ajouteMot("louv") == True
assert dico.ajouteMot("lulu") == True

## Test de préfixe
Écrivez de même la fonction `estPrefixe(s)` qui vérifie si le mot `s` est préfixe d'un mot du dictionnaire. Nous rappelons qu'être préfixe veut dire être le début d'un mot du dictionnaire.

In [None]:
dico =  Dictionnaire();  System.out.println(dico);
dico.ajouteMot("le")
dico.ajouteMot("loup")
dico.ajouteMot("les")
dico.ajouteMot("louve")
assert dico.estPrefixe("le") == True
assert dico.estPrefixe("les") == True
assert dico.estPrefixe("lou") == True
assert dico.estPrefixe("lu") == False

## Énumération des mots du dictionnaire
Il s'agit maintenant d'énumérer les mots du dictionnaire, dans l'ordre alphabétique. En effet, on peut remarquer qu'en réalisant un parcours de l'arbre, on peut énumérer les mots de celui-ci.

L'objet de cette partie est d'écrire une méthode `listeMotsAlphabetique()` dans la classe `Dictionnaire` qui affiche les mots contenus dans le dictionnaire et ce par ordre alphabétique (ordre du dictionnaire, ou ordre lexicographique). Les mots doivent être séparés par des espaces.

Cette question pose en réalité plusieurs difficultés techniques.

### Ordre alphabétique
La première est que nous n'avons pas parlé d'**ordre** jusqu'ici. En effet, rien ne garantit que vos listes internes de nœuds sont dans l'ordre alphabétique. Nous allons modifier votre code de manière à garantir l'**invariant** que les listes de nœuds sont toujours dans l'ordre alphabétique.

Reprenez votre méthode `ajouteMot`. Si vous avez utilisé l'approche la plus simple, vous avez certainement une `list` qui maintient la liste des enfants du nœud. La manière la plus naturelle d'ajouter un enfant était de faire appel à la méthode `append(n)` ou `n`est un `Noeud`.

Modifiez le code de `ajouteMot` pour garantir que l'ajout d'un `Noeud` dans la liste des enfants le positionne immédiatement à la bonne position. 

Il est facile de se tromper dans l'écriture de cette méthode :

* l'ordre demandé est l'ordre du dictionnaire, ou ordre lexicographique : le mot `bout` vient avant le mot `bouteille`, par exemple
* pensez aux cas limites : cas où le mot doit arriver en premier dans la liste, cas où le mot doit arriver en dernier ;
* testez de tête le code sur des listes de taille 0, 1, ou 2.
La fonction d'affichage des nœuds que nous vous conseillions d'écrire un peu plus tôt sera certainement utile pour vous assurer que votre code fonctionne correctement.

### Pile de caractères
La seconde difficulté technique consiste à garder la liste des caractères déjà vus précédemment afin, lorsqu'on rencontre un `*`, de pouvoir immédiatement afficher le mot.

Plusieurs solutions s'offrent à vous. Nous vous proposons de garder une liste des caractères déjà vus jusque là, de manière à pouvoir, lorsque vous rencontrez un `*`, immédiatement accéder à la liste des caractères qui vous ont menés jusqu'à cette `*`.

Écrivez une méthode `listeMotsAlphabetique(prefix)` sur la classe `Noeud`. Cette méthode prend la liste des caractères rencontrés sur le chemin menant au `Noeud` courant, appelée `prefix`. Le `Dictionnaire` appellera cette méthode en lui passant une liste vide. Avant d'effectuer un appel récursif pour descendre dans ses enfants, cette méthode devra étendre la liste avec le caractère courant.

Cette méthode vous demandera un petit peu de travail annexe. 


Il est important de restaurer (backtracking) la liste `prefix` avant de sortir de `listeMotsAlphabetique`. En clair : la méthode `listeMotsAlphabetique` doit laisser, une fois terminée, le `prefix` dans l'état où elle l'a trouvé.

In [None]:
dico = Dictionnaire()
dico.ajouteMot("fartee")
dico.ajouteMot("radiographier")
dico.ajouteMot("refrene")
dico.ajouteMot("refrene")
dico.ajouteMot("refrene")
dico.ajouteMot("refrene")
dico.ajouteMot("depelotonnates")
dico.ajouteMot("sericiculteurs")
dico.ajouteMot("panoramiquerons")
dico.ajouteMot("fautasses")
dico.ajouteMot("contractuelle")
dico.ajouteMot("enerveriez")
dico.ajouteMot("cagnardent")
dico.ajouteMot("vertuchou")
dico.ajouteMot("postates")
dico.ajouteMot("stererent")
dico.ajouteMot("fanion")
dico.ajouteMot("reequilibrames")
dico.ajouteMot("balafrez")
dico.ajouteMot("voltez")
dico.ajouteMot("antirides")
dico.ajouteMot("tintinnabulerait")
dico.ajouteMot("rougissant")
dico.ajouteMot("emmerdons")
dico.ajouteMot("favorables")
dico.ajouteMot("affirmera")
dico.ajouteMot("mer")
dico.ajouteMot("rapprochai")
dico.ajouteMot("dessecheraient")
dico.ajouteMot("revoterent")
dico.ajouteMot("redefiniras")
dico.ajouteMot("separent")
dico.ajouteMot("capturai")
dico.ajouteMot("standardiserais")
dico.ajouteMot("raffolons")
dico.ajouteMot("idiotifiates")
dico.ajouteMot("envideras")
dico.ajouteMot("contrevins")
dico.ajouteMot("saboterie")
dico.ajouteMot("sediments")
dico.ajouteMot("ambitionnerent")
dico.ajouteMot("repliqueriez")
dico.ajouteMot("transsudions")
dico.ajouteMot("inseminions")
dico.ajouteMot("providence")
dico.ajouteMot("inhumations")
dico.ajouteMot("criailles")
dico.ajouteMot("emechez")
dico.ajouteMot("declarait")
dico.ajouteMot("dulcifiaient")
dico.ajouteMot("degueulerions")
dico.ajouteMot("mimera")
dico.ajouteMot("bafouez")
dico.ajouteMot("perennisasses")
dico.ajouteMot("principautes")
dico.ajouteMot("poulinerait")
dico.ajouteMot("aida")
dico.ajouteMot("critiquee")
dico.ajouteMot("detoureras")
dico.ajouteMot("rapapillotasses")
dico.ajouteMot("souche")
dico.ajouteMot("incrementez")
dico.ajouteMot("enliassee")
dico.ajouteMot("approchais")
dico.ajouteMot("peinturera")
dico.ajouteMot("rependrai")
dico.ajouteMot("demantelement")
dico.ajouteMot("captatoires")
dico.ajouteMot("rationneriez")
dico.ajouteMot("cascadeurs")
dico.ajouteMot("gazonnai")
dico.ajouteMot("calorifugerez")
dico.ajouteMot("alluvionnera")
dico.ajouteMot("agitassiez")
dico.ajouteMot("truffee")
dico.ajouteMot("decrepassiez")
dico.ajouteMot("tarabiscotons")
dico.ajouteMot("basilical")
dico.ajouteMot("rassorties")
dico.ajouteMot("statuees")
dico.ajouteMot("egayerez")
dico.ajouteMot("mollarderaient")
dico.ajouteMot("raison")
dico.ajouteMot("emmetreront")
dico.ajouteMot("shahs")
dico.ajouteMot("coudent")
dico.ajouteMot("expiee")
dico.ajouteMot("stylisions")
dico.ajouteMot("anticonstitutionnellement")
dico.ajouteMot("torpillais")
dico.ajouteMot("subirons")
dico.ajouteMot("merisiers")
dico.ajouteMot("saisonnerons")
dico.ajouteMot("sursaturee")
dico.ajouteMot("transmettait")
dico.ajouteMot("solifluerais")
dico.ajouteMot("dedommageant")
dico.ajouteMot("repassasse")
dico.ajouteMot("fadeur")
dico.ajouteMot("velleites")
dico.ajouteMot("aspecterait")
dico.listeMotsAlphabetique()

La sortie attendue est 

```python
affirmera agitassiez aida alluvionnera ambitionnerent anticonstitutionnellement antirides approchais aspecterait bafouez balafrez basilical cagnardent calorifugerez captatoires capturai cascadeurs contractuelle contrevins coudent criailles critiquee declarait decrepassiez dedommageant degueulerions demantelement depelotonnates dessecheraient detoureras dulcifiaient egayerez emechez emmerdons emmetreront enerveriez enliassee envideras expiee fadeur fanion fartee fautasses favorables gazonnai idiotifiates incrementez inhumations inseminions mer merisiers mimera mollarderaient panoramiquerons peinturera perennisasses postates poulinerait principautes providence radiographier raffolons raison rapapillotasses rapprochai rassorties rationneriez redefiniras reequilibrames refrene repassasse rependrai repliqueriez revoterent rougissant saboterie saisonnerons sediments separent sericiculteurs shahs solifluerais souche standardiserais statuees stererent stylisions subirons sursaturee tarabiscotons tintinnabulerait torpillais transmettait transsudions truffee velleites vertuchou voltez
```

## Source :
Coursera, *Conception et mise en œuvre d'algorithmes*, Ecole Polytechnique