# TP : Dictionnaire

## Internationalisation

 Exercice

1. Définir un dictionnaire `fr_to_en` contenant chaque jour de la semaine (en français) avec sa traduction en anglais.  
2. Vérifier que `fr_to_en["lundi"]` contient `"monday"`.  
3. Ajouter les mois avec leurs traductions.


## Anagramme

On rappelle qu'on peut parcourir les lettres d'une chaîne de caractères avec une boucle  for   :

In [1]:
s = "lamartin"
for c in s: # en parcourant directement les caractères
    print(c)
for i in range(len(s)): # en parcourant les indices
    print(s[i])

l
a
m
a
r
t
i
n
l
a
m
a
r
t
i
n


 Exercice
 Écrire une fonction `anagramme(m1, m2)` qui teste si deux mots (des chaînes de caractères) sont des anagrammes, c'est-à-dire s'ils contiennent les mêmes lettres (avec le même nombre d'occurence de chaque lettre). Par exemple, `anagramme("ordre", "dorer")` doit renvoyer `True`.  
Cette fonction doit être en O($n_1 + n_2$), où $n_1$, $n_2$ sont les tailles de `m1`, `m2`.  
**Aide** : On pourra utiliser deux dictionnaires pour compter le nombre d'apparitions de chaque lettre dans `m1` et `m2`, puis vérifier que ces deux dictionnaires contiennent les mêmes associations (clé, valeur).


In [2]:
def anagramme(m1:str, m2:str) -> bool:
    occ_1 = {}
    for char in m1:
        if char in occ_1:
            occ_1[char] += 1
        else:
            occ_1[char] = 1
    for char in m2:
        if char not in occ_1:
            return False
        else:
            occ_1[char] -= 1
    for char in occ_1:
        if occ_1[char] != 0:
            return False
    return True

## Trie (arbre préfixe) 

### Arbres enracinés

Un **arbre** est un graphe ayant deux propriétés supplémentaires :  
- **Connexe** : il existe un chemin entre deux sommets quelconques  
- **Acyclique** : il ne contient pas de cycle

On considère souvent des **arbres enracinés**, c'est-à-dire ayant un sommet particulier appelé la **racine**, qu'on représente en haut de l'arbre :

<center><img src=https://raw.githubusercontent.com/fortierq/tikz-pdf/main/tree/ntree/ntree.png width=70%><br>
Exemple d'arbre, ayant pour racine 0</center>

Chaque sommet différent de la racine possède un **père**, qui est le sommet juste au dessus. Sur l'exemple, 0 est le père de 1, 1 est le père de 7...

Si p est le père de v, on dit aussi que v est un **fils** de p. Chaque sommet a au plus un père, mais peut avoir un nombre quelconque de fils.


### Trie

Un **trie** sert à stocker un ensemble de mots sous forme d'arbre. Chaque arête est etiquetée par une lettre et les mots appartenant au trie sont ceux obtenus le long d'un chemin de la racine à une arête étiqueté par $.  
Par exemple, l'arbre suivant contient les mots cap, copie, copier, copies, cor, corde, corne, correct, correcte :


<center><img src=https://github.com/fortierq/cours/blob/main/python/dict/tp/trie.png?raw=true width=60%></center>

**Remarque** : les tries sont utilisés pour la complétion automatique (proposition de complétion d'un mot en cours d'écriture, par exemple sur téléphone), pour la correction orthographique...

Pour stocker un trie, on utilisera un dictionnaire où chaque clé est l'étiquette d'une arête sortant de la racine et la valeur est le dictionnaire correspondant au fils. Une feuille (sommet sans fils) est représentée par le dictionnaire vide.  

Par exemple, le trie contenant l'ensemble de mots $\{$ car, cat, cd, ok $\}$ est représenté par :

In [3]:
{ 
    "c" : { 
        "a" : {
            "r" : { "$" : {} },
            "t" : { "$" : {} }
        },
        "d" : { "$" : {} }
    },
    "o" : { 
        "k" : { "$" : {} }
    }
}

{'c': {'a': {'r': {'$': {}}, 't': {'$': {}}}, 'd': {'$': {}}},
 'o': {'k': {'$': {}}}}

 Exercice
  
1. Dessiner le trie contenant les mots art, axe, set.  
2. Définir ce trie sous forme d'un dictionnaire.


In [4]:
{
    "a" : {
        "r" : {
            "t" : { "$" : {} }
        },
        "x" : {
            "e" : { "$" : {} }
        }
    },
    "s" : {
        "e" : {
            "t" : { "$" : {} }
        }
    }
}

{'a': {'r': {'t': {'$': {}}}, 'x': {'e': {'$': {}}}},
 's': {'e': {'t': {'$': {}}}}}

 Exercice
 Écrire une fonction `trie_add(trie, m)` pour ajouter un mot `m` dans un trie. On pourra compléter le code ci-dessous.


In [5]:
def trie_add(trie, m):
    if m != "":
        m += "$"
    for c in m: # parcours des lettres c de m
        if c not in trie: # s'il n'y a pas d'arête sortante de trie étiquetée par c
            trie[c] = {} # créer une nouvelle association (c, dictionnaire vide)
        trie = trie[c] # descendre dans l'arbre suivant la lettre c

 Exercice
 En utilisant `trie_add`, définir un trie contenant les mots `"arbre"`, `"arete"`, `"graphe"`.


In [6]:
mots = ["arbre", "arete", "graphe"]
trie = {}
for mot in mots:
    trie_add(trie, mot)

print(trie)

{'a': {'r': {'b': {'r': {'e': {'$': {}}}}, 'e': {'t': {'e': {'$': {}}}}}}, 'g': {'r': {'a': {'p': {'h': {'e': {'$': {}}}}}}}}


 Exercice
 Écrire une fonction `trie_print(trie)` pour afficher les mots `m` appartenant à un trie. Vérifier avec l'exemple précédent.


In [7]:
def trie_print(trie):
    def aux (trie, buffer):
        for char in trie:
            if char == "$":
                print(buffer)
            else:
                aux(trie[char], buffer + char)
    aux(trie, "")

trie_print(trie)

arbre
arete
graphe


 Exercice
 Écrire une fonction `trie_size(trie)` pour afficher le nombre de mots appartenant à un trie.


In [8]:
def trie_size(trie):
    size = 0
    def aux (trie):
        for char in trie:
            if char == "$":
                size = size + 1
            else:
                aux(trie[char])
    aux(trie)

trie_size(trie)

UnboundLocalError: cannot access local variable 'size' where it is not associated with a value

 Exercice
 Écrire une fonction `trie_has(trie, m)` pour tester si `m` appartient à un trie.


In [None]:
def trie_has(trie, m):
    for char in m:
        if char in trie:
            trie = trie[char]
        else:
            return False
    return ("$" in trie)

 Exercice
 (MP/MP* Option info seulement) Quelles sont les autres possibilités pour implémenter un ensemble de mots ? Pourquoi un trie est-il intéressant ? On pourra supposer que les lettres sont entre a et z.


## Algorithme d'Ératosthène

 Exercice
 Écrire une fonction `eratosthene(n)` renvoyant un ensemble (`set`) contenant les nombres premiers inférieurs à `n`, en utilisant le [crible d'Ératosthène](https://fr.wikipedia.org/wiki/Crible_d%27%C3%89ratosth%C3%A8ne).


In [2]:
def eratosthene(n):
    L = [True] * (n + 1)
    L[0], L[1] = False, False
    i = 2
    while i * i <= n:
        if L[i]:
            for j in range(i*i, n + 1, i):
                L[j] = False
        i += 1
    return set([i for i in range(len(L)) if L[i]])

eratosthene(94348343)

{2,
 3,
 5,
 50331653,
 7,
 11,
 83886091,
 13,
 67108879,
 17,
 83886097,
 19,
 23,
 29,
 31,
 83886113,
 33554467,
 50331683,
 37,
 83886119,
 41,
 33554473,
 43,
 16777259,
 50331691,
 47,
 67108913,
 53,
 67108919,
 83886137,
 59,
 50331707,
 61,
 50331709,
 83886139,
 67,
 33554501,
 67108933,
 71,
 33554503,
 73,
 16777289,
 16777291,
 50331719,
 33554509,
 79,
 83886161,
 83,
 33554519,
 89,
 83886169,
 67108957,
 33554527,
 97,
 67108961,
 101,
 103,
 107,
 109,
 113,
 16777331,
 50331763,
 16777333,
 67108981,
 50331767,
 16777337,
 83886203,
 127,
 131,
 137,
 139,
 83886223,
 50331793,
 33554579,
 149,
 33554581,
 151,
 83886233,
 157,
 67109023,
 83886239,
 33554593,
 163,
 50331811,
 16777381,
 167,
 67109033,
 173,
 179,
 181,
 83886263,
 67109051,
 83886269,
 191,
 193,
 197,
 199,
 50331847,
 83886281,
 16777421,
 33554639,
 67109071,
 33554641,
 50331857,
 211,
 83886293,
 50331863,
 83886301,
 223,
 50331871,
 16777441,
 227,
 229,
 16777447,
 233,
 50331881,
 8388631