# Comparaison Trie / liste

On va comparer les vitesses d'exécution de certains procédés suivant qu'on utilise une liste ou bien un Trie

Commençons par nous fabriquer une fonction donnant le temps système en millisecondes :

In [None]:
from time import process_time_ns
def temps():
    return process_time_ns()/10**6

Maintenant, importons une classe Trie. Lisez bien les docs des méthodes pour pouvoir les utiliser ensuite.

In [None]:
class Trie:

    def __init__(self, valeur=None, fin=False):
        """ Pour créer un noeud, vide par défaut """
        self.valeur = valeur
        self.fin = fin
        self.fils = dict()

        
    def ajoute_mot(self, mot: str) -> None:
        """ Ajoute un mot, à utiliser sur la racine du trie """
        if len(mot) == 1:
            if mot not in self.fils:
                self.fils[mot] = Trie(mot, True)
            else:
                self.fils[mot].fin = True
        else:
            lettre = mot[0]
            if lettre not in self.fils:
                self.fils[lettre] = Trie(lettre)
            self.fils[lettre].ajoute_mot(mot[1:])

            
    def __contains__(self, mot) -> bool:
        """ permet d'écrire if mot in trie, à utiliser sur la racine """
        if len(mot) == 1:
            return mot in self.fils and self.fils[mot].fin
        else:
            lettre = mot[0]
            if lettre not in self.fils:
                return False
            else:
                return mot [1:] in self.fils[lettre]

    
    def commence_par(self, debut) -> list:
        """ Renvoie la liste de tous les mots du trie qui commencent par début, à utiliser sur la racine """
        debut2 = debut
        courant = self
        while debut:
            if debut[0] not in courant.fils:
                return []
            courant = courant.fils[debut[0]]
            debut = debut[1:]
        return courant.contenu(debut2[:-1])
   

        def contenu(self, mot=None, liste=None) -> list:
        """ Renvoie la liste des mots (ou des fins de mots) d'un trie. Pas utilisé par les élèves """
        mot = mot or ""
        liste = liste or []
        if self.valeur:
            mot += self.valeur
        if self.fin:
            liste.append(mot)
        for u in self.fils.values():
            liste2 = u.contenu(mot, liste)
            for m in liste2:
                if m not in liste:
                    liste.append(m)
        return liste


## Créer `liste_mots` et mesurer le temps d'exécution

Exécuter la cellule suivante.

In [None]:
debut = temps()
liste_mots = []  # on part d'une liste vide
with open('dico.txt', 'rt', encoding='utf8') as fichier:  # on ouvre le fichier
    ligne = fichier.readline()  # on lit une ligne
    while ligne:
        liste_mots.append(ligne[:-1])  # On enlève le dernier caractere, c'est un \n
        ligne = fichier.readline()
duree = temps()-debut
print(f"La construction du dictionnaire-liste a duré {duree} millisecondes.")

## Créer `trie_mots` et mesurer le temps d'exécution

Inspires-toi de la cellule précédente pour créer `trie_mots`

In [None]:
debut = temps()
trie_mots = Trie()  # on crée le trie

# Quelques lignes

duree = temps()-debut
print(f"La construction du dictionnaire-trie a duré {duree} millisecondes.")

## Créer des listes de mots aléatoires de longueur donnée

Créer la fonction `liste_mots_aleatoires` qui
- en entrée prend deux `int` : `n` et `longueur`
- renvoie une liste de `n` mots qui sont en majuscules, aléatoires et tous de longueur `longueur`.

Par exemple `liste_mots_aleatoires(3,4)` peut renvoyer `['AHSZ','PURE','ZARU']`.

In [None]:
from random import choice
def liste_mots_aleatoires(n : int,longueur : int) -> list:
    alphabet = 'AZERTYUIOPQSDFGHJKLMWXCVBN'
    resultat = []
   # Allez, ce n'est pas si dur
    return resultat

## Chercher des mots aléatoires dans `liste_mots`

On va chercher `nombre` mots de longueur `longueur` aléatoires dans la `liste_mots`, en affichant ceux qui y sont effectivement :
d'abord on les mets dans une liste `resultat`, puis on affiche, tout ça en mesurant le timing (il y a peut de chance qu'on en trouve si `longueur` est grand.

In [None]:
nombre = 10000
longueur = 5
print("On génère la liste des mots aléatoires")
mots_aleatoires = liste_mots_aleatoires(nombre,longueur)
print("on commence la recherche")
resultat = []
debut = temps()
for mot in mots_aleatoires:
    if mot in liste_mots:
        resultat.append(mot)
duree = temps()-debut
print(f"La recherche de {nombre} mots de longueur {longueur} dans le dictionnaire-liste a duré {duree} millisecondes.")
print()
print(resultat)

Faire de même avec `trie_mots`.

In [None]:
nombre = 10000
longueur = 5
print("On génère la liste des mots aléatoires")
mots_aleatoires = liste_mots_aleatoires(nombre,longueur)
print("on commence la recherche")
resultat = []
debut = temps()

# you can do it

duree = temps()-debut
print(f"La recherche de {nombre} mots de longueur {longueur} dans le dictionnaire-trie a duré {duree} millisecondes.")
print(resultat)

## Autocomplétion

On commence par générer `nombre` débuts de mots de `longueur` lettres, puis on extrait (*retrieve*) de `trie_mots` la liste des mots commençant par ces préfixes.

In [None]:
longueur = 4
nombre = 100
print("On génère la liste des débuts de mots aléatoires.")
debuts_aleatoires = liste_mots_aleatoires(nombre,longueur)
print("On commence la recherche d'autocomplétion.")
debut= temps()
resultat = {}
for debut_mot in debuts_aleatoires:
    liste=trie_mots.commence_par(debut_mot)
    if liste != []:
        resultat[debut_mot] = liste  
duree = temps()-debut
print(f"La recherche dans le dictionnaire-liste a duré {duree} millisecondes.")   
l =[(x,resultat[x]) for x in resultat]
for x in l:
    print(x[0])
    print(x[1])
    print()

À toi de faire de même pour `liste_mots`... en te débrouillant, ce n'est pas trop difficile

In [None]:
nombre = 1000
longueur = 4
print("On génère la liste des débuts de mots aléatoires.")
debuts_aleatoires = liste_mots_aleatoires(nombre,longueur)
print("On commence la recherche d'autocomplétion.")
debut= temps()
resultat = {}

# Ce n'est pas si dur...

duree = temps()-debut
print(f"La recherche dans le dictionnaire-liste a duré {duree} millisecondes.")   
l =[(x,resultat[x]) for x in resultat if resultat[x]!=[]]
for x in l:
    print(x[0],x[1])
    print()

![YES](https://media.giphy.com/media/VGVwLultLZjrrssAak/giphy.gif)