# 1A.1 - Dictionnaires,code de Vigenère

Le dictionnaire est une structure de données très utilisée. Elle est illustrée pour un problème de décryptage.

### Rappel sur les dictionnaires

#### clé - valeur

Une **liste** est un ensemble d'autres objets indexés par des entiers. Un **dictionnaire** est un ensemble d'autres objets indexés par presque n'importe quel structure ou objet.

In [None]:
d = { }   # un dictionnaire vide
d = { 'a' : 'acronym', 'b': 'bizarre' }  # un dictionnaire qui associe 'acroym' à 'a' et 'bizarre' à 'b'.
z = d ['a']   # z reçoit la valeur associée à 'a' et stockée dans le dictionnaire d

Quelques fonctions utiles :

In [None]:
d = { 'a' : 'acronym', 'b': 'bizarre' }  
l = len(d)    # retourne le nombre d'élément de d
b = 'a' in d  # b vaut True si une valeur est associée à 'a', on dit aussi que la clé 'a' est présente 
x = d.get ('a', '')  # x vaut d['a'] si la clé 'a' existe, il vaut '' sinon 

"d=",d,"l=",l,"b=",b,"x=",x

('d=', {'a': 'acronym', 'b': 'bizarre'}, 'l=', 2, 'b=', True, 'x=', 'acronym')

On utilise souvent un dictionnaire pour compter les lettres d'un texte :

In [None]:
texte = "exemple de texte"
d = { }
for c in texte :
    d[c] = d.get(c,0) + 1

d

{' ': 2, 'd': 1, 'e': 6, 'l': 1, 'm': 1, 'p': 1, 't': 2, 'x': 2}

Les valeurs peuvent être n'importe quoi, y compris des listes ou des dictionnaires. Les clés doivent être des types immuables (nombre, chaînes de caractères, ``tuple`` incluant des types immuables). Si vous utilisez un autre type, cela déclenche une erreur : 

In [None]:
f = [3,4]
d[f] = 0        # déclenche une exception

NameError: ignored

Lorsqu'on affecte une valeur à une clé, le dictionnaire crée la clé ou remplace la valeur précédente par la nouvelle :

In [None]:
d = { }
d['a'] = 0   # création d'une clé
d['a'] = 1   # remplacement d'une valeur

d

{'a': 1}

On peut aussi créer un dictionnaire de façon compacte :

In [None]:
d = { s:len(s) for s in ['un', 'deux', 'trois'] }
d

{'un': 2, 'trois': 5, 'deux': 4}

#### notions de coût

Il est aussi rapide d'accéder à un élément d'un dictionnaire que d'accéder à un élément d'une liste : [TimeComplexity](https://wiki.python.org/moin/TimeComplexity). C'est une [table de hashage](https://fr.wikipedia.org/wiki/Table_de_hachage) qui permet d'obtenir ce résultat.

#### ordonner les éléments d'un dictionnaire

Les éléments d'un dictionnaire ne sont pas ordonnées ou tout du moins ne le sont pas d'une façon prédictible. Pour les parcourir dans un ordre précis, il faut utiliser une liste puis les ordonner. L'exemple suivant montre comment ordonner les éléments par ordre croissant de valeur, puis par ordre alphabétique en cas d'ex aeco.

In [None]:
d = { s:len(s) for s in ['un', 'deux', 'trois', 'quatre', 'cinq'] }
d

{'cinq': 4, 'deux': 4, 'quatre': 6, 'trois': 5, 'un': 2}

In [None]:
ordonne = [ (v,k) for k,v in d.items()]
ordonne

[(4, 'cinq'), (5, 'trois'), (4, 'deux'), (6, 'quatre'), (2, 'un')]

In [None]:
ordonne.sort()
ordonne

[(2, 'un'), (4, 'cinq'), (4, 'deux'), (5, 'trois'), (6, 'quatre')]

**A quoi ça sert ?** on se sert beaucoup des dictionnaires pour compter la fréquences des caractères, des mots ou de couples de mots dans un texte. On les ordonne ensuite par fréquences décroissantes pour obtenir les mots ou caractères les plus fréquents.

### Exercice 1 : recherche dans une liste

On considère une liste de mots :

In [None]:
mots = ['eddard', 'catelyn', 'robb', 'sansa', 'arya', 'brandon',
        'rickon', 'theon', 'rorbert', 'cersei', 'tywin', 'jaime',
        'tyrion', 'shae', 'bronn', 'lancel', 'joffrey', 'sandor',
        'varys', 'renly', 'a' ]

Il faut écrire une fonction qui retourne tous les mots de la liste qui ont un 'y' en seconde position.

In [5]:
def mots_lettre_position (liste, lettre, position) :
    l = []
    for i in liste:
        if i[position] == lettre:
            l.append(i)
    return l
print(mots_lettre_position (['eddard', 'catelyn', 'robb', 'sansa', 'arya', 'brandon','rickon', 'theon', 'rorbert', 'cersei', 'tywin', 'jaime','tyrion', 'shae', 'bronn', 'lancel', 'joffrey', 'sandor','varys', 'renly'], "y", 1))

['tywin', 'tyrion']


### Exercice 2 : utilisation d'un dictionnaire

On modifie la fonction précédente ``mots_lettre_position`` de telle sorte qu'elle s'écrive comme suit :

In [8]:
def dictionnaire_position (dictionnaire_bien_choisi, lettre, position) :
    l = []
    for i in dictionnaire_bien_choisi.keys():
        if i[position] == lettre:
            l.append(i)
    return l
print(dictionnaire_position({"chien":1,"chat":1,"elephant":1},"c",0))

['chien', 'chat']


Construisez le dictionnaire ``dictionnaire_bien_choisi`` pour que cela fonctionne.
Combien de mots sont stockés dans ``dictionnaire_bien_choisi`` ?

Lorsqu'on cherche un mot dans un dictionnaire (un vrai), on tourne peu de pages pour le trouver puisqu'ils sont triés par ordre alphabétique. Maintenant, si on souhaite trouver tous les mots dans la seconde lettre est ``e``, c'est impossible à moins de trier les mots par leur seconde lettre : il faudrait un dictionnaire différent pour chaque position de lettre. 

L'objectif de cet exercice est de concevoir une sorte de dictionnaire qui permette de retrouver tous les mots ayant telle lettre à telle position.

### Exercice 3 : crypter de décrypter selon Vigenère

Le [code de César](http://fr.wikipedia.org/wiki/Chiffrement_par_d%C3%A9calage) est une permutation de lettre ou un décalage. Toutes les lettres du message sont décalées d'un nombre fixe :

- ``JENESUISPASCODE``
- ``MHQHVXLVSDVFRGH``

Le [code de Vigenère](http://fr.wikipedia.org/wiki/Chiffre_de_Vigen%C3%A8re) introduit un décalage qui dépend de la position de la lettre dans le message à coder. On choisit d'abord un mot qui servira de code (par exemple ``DOP``) puis on le traduit en décalages : ``[3, 14, 15]`` en servant de la position des lettres dans l'alphabet. 

Pour coder, on décale la première lettre de 3, la seconde de 14, la troisième 15, la quatrième de 3 à nouveau... L'objectif de cette partie est d'écrire une fonction qui crypte le message précédent et une autre qui décrypte.

In [21]:
def code_vigenere ( message, cle) :
    alphabet1 = {"a":1,"b":2,"c":3,"d":4,"e":5,"f":6,"g":7,"h":8,"i":9,"j":10,"k":11,"l":12,"m":13,"n":14,"o":15,"p":16,"q":17,"r":18,"s":19,"t":20,"u":21,"v":22,"w":23,"x":24,"y":25,"z":26}
    alphabet2 = ["a","b","c","d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z"]
    l = []
    for i in range(len(mot)):
        i = message[i]
        l.append(i)
    for i in range(len(l)):
        l[i] = alphabet1[l[i]]
        l[i] = l[i]+cle[i]
    for i in range(len(l)):
        b = l[i]-1
        l[i] = alphabet2[b]
    return(l)
code_vigenere("chiens",[5,16,3,6,8,4])

['h', 'x', 'l', 'k', 'v', 'w']

A quelle condition le code de Vigenère est un simple code de César ?

Seulement lorsque l'on demande de décaler toutes les lettres du même intervale

Pensez-vous qu'il soit possible de casser le code de Vigenère (de le décrypter sans la clé) ?

In [None]:
Je ne pense pas, puisque sans la clé, on ne sait pas de combien de fois on doit décaler les lettres du messages.