# Dictionnaires et fonctions

Le dictionnaire est une structure de données très utilisée. Elle est illustrée ici pour un problème de décryptage.

### Fonctions

Les fonctions sont des portions de programmes qui reproduisent les mêmes instructions. La fonction suivante calcule un polynôme de second degré $x^2-x-1$. A chaque fois qu'on appellera la fonction ``polynome``, elle fera le même calcul sur des ``x`` différents. Cela évite principalement d'avoir à recopier les mêmes lignes à chaque fois qu'on en a besoin.

In [28]:
def polynome(x):
    resultat = x**2 - x - 1 
    return resultat

Une fonction commence toujours par ``def``. Entre parenthèses, ce sont les paramètres (ou entrées de la fonction). Ce qui suit le mot-clé ``return`` est le résultat de la fonction (ou sa sortie). 

De son utilisation ou appel :

In [29]:
y = polynome(0)  # calcul de x^2 - x - 1 pour x = 0
y

-1

In [32]:
polynome(10) # Appel et affichage (sous jupyter notebook)

89

In [33]:
# Pour ceux qui ont reconnu le polynôme
import math
nombre_d_or = (1 + math.sqrt(5)) / 2
polynome(nombre_d_or)

0.0

On peut appeler une fonction depuis une autre fonction. Une fonction peut prendre autant de paramètres que l'on veut à condition qu'ils aient des noms différents. On peut aussi leur associer une **valeur par défaut** :

Les fonctions doivent porter des noms différents. Dans le cas contraire, seule la dernière existe.

In [35]:
def polynome(x):       # remplacée par la seconde fonction
    return x * x + x - 100


y = polynome(0)  # à comparer au premier résulat
y

-100

### Exercice 1

Les fonctions [chr](https://docs.python.org/3.4/library/functions.html#chr) et [ord](https://docs.python.org/3.4/library/functions.html#ord) sont symétriques l'une de l'autre : elles convertissent un nombre en lettre et réciproquement.

In [14]:
print (chr(65), chr(97))
print (ord('Z'), ord('b'))

A a
90 98


Le symbol ``%`` permet d'obtenir le reste d'une division entière. L'exercice consiste à écrire une fonction qui retourne la lettre suivante pour une minuscule dans l'ordre alphabétique. La lettre qui suit ``z`` est ``a``.

In [8]:
def lettre_suivante(lettre) :
    '''
    lettre :  minuscule entre a et z
    '''
    return chr((ord(lettre) - ord('a') + 1) % 26 + ord('a'))

In [9]:
lettre_suivante("r")

's'

In [10]:
lettre_suivante("z")

'a'

In [11]:
lettre_suivante("a")

'b'

### Fonctions dans le détail

#### Variable locale

**Une variable créée à l'intérieur d'une fonction n'existe pas à l'extérieur : c'est une variable locale.** C'est pourquoi le code suivant provoque une erreur car la variable ``z`` n'existe pas en dehors de la fonction ``calcul``. Les variables ``y`` ou ``z`` ne servent que d'intermédiaire de calcul. Le seul résultat qui sort de la fonction suit le mot-clé ``return``.

In [21]:
def calcul(x) :
    y = x**2
    z = x + y
    return z

print(z)    # déclenche une exception

NameError: name 'z' is not defined

In [37]:
def polynome(x):
    y_de_la_fonction = x**2 - x - 1  # La variable y_de_la_fonction ne "vit" que dans la fonction, c'est sa portée (scope)
    return y_de_la_fonction  # `y_de_la_fonction` a disparu après cette instruction

y = polynome(nombre_d_or)  # On peut réutiliser une variable y qui n'a rien à voir avec la précédente
print(y)

0.0


Typiquement on va souvent utiliser dans la fonction un nom qui sera aussi utilisé dans le programme principal. Même si les variables ont le même nom elles sont complètement différentes.

In [40]:
def polynome(x):
    y = x**2 - x - 1  # La variable y ne "vit" que dans la fonction, c'est sa portée (scope)
    return y  # `y` a disparu après cette instruction

y = polynome(nombre_d_or)  # On peut réutiliser une variable y qui n'a rien à voir avec la précédente
print(y)

0.0


#### Mot-clé ``return``

**Sans mot-clé ``return``, le résultat est ``None``,** car la fonction ne renvoie rien. (Python associe alors au résultat de l'appel le mot clef réservé None)

In [43]:
def calcul(x):
    y = x**2
    z = x + y


a = calcul(3)
print(a)

None


La fonction se termine après le premier ``return`` rencontré lors de l'exécution.

In [44]:
def valeur_absolue(x):
    print("je passe par ici")
    if x < 0:
        y = -x
        return y
    else:
        y = x
        return y
    print("je ne passe jamais par ici")


valeur_absolue(-5)


je passe par ici


5

### Fonction récursive

**Une fonction peut être récursive : elle s'appelle elle-même.** Mais il est important de savoir qu'il existe un cas dans lequel elle ne s'appelle pas pour arrêter la récursion.

In [45]:
def recursive(x):
    if x / 2 < 1:
        print("je ne m'appelle pas pour x=", x)
        return 1
    else:
        print("je m'appelle pour x=", x)
        return recursive(x / 2) + 1


recursive(10)

je m'appelle pour x= 10
je m'appelle pour x= 5.0
je m'appelle pour x= 2.5
je ne m'appelle pas pour x= 1.25


4

### Dictionnaires

#### clé - valeur

Une **liste** est un ensemble d'autres objets indexés par des entiers. Un **dictionnaire** est un ensemble d'autres objets indexés par des clefs, celles ci peuvent être de n'importe quel type immuable.  
`dictionnaire = { clé : valeur }`

In [48]:
d = {}   # un dictionnaire vide
d = {'a': 'acronym', 'b': 'bizarre'}  # un dictionnaire qui associe 'acroym' à 'a' et 'bizarre' à 'b'.
d

{'a': 'acronym', 'b': 'bizarre'}

In [49]:
z = d['a']   # z reçoit la valeur associée à 'a' et stockée dans le dictionnaire d
print(z)

acronym


Quelques fonctions utiles :

In [52]:
d = {'a': 'acronym', 'b': 'bizarre'}
l = len(d)    # retourne le nombre d'élément de d
p = 'a' in d  # p vaut True si une valeur est associée à 'a', on dit aussi que la clé 'a' est présente
x = d.get('a', '')  # x vaut d['a'] si la clé 'a' existe, il vaut '' sinon

print(" dictionnaire = ", d)
print(" longueur = ", l)
print(" la clé 'a' est présente ? = ", p)
print(" valeur = ", x)


 dictionnaire =  {'a': 'acronym', 'b': 'bizarre'}
 longueur =  2
 la clé 'a' est présente ? =  True
 valeur =  acronym


On peut par exemple utiliser un dictionnaire pour compter les lettres d'un texte :

In [1]:
texte = "exemple de texte"
d = { }
for caractere in texte :
    d[caractere] = d.get(caractere,0) + 1

d

{'e': 6, 'x': 2, 'm': 1, 'p': 1, 'l': 1, ' ': 2, 'd': 1, 't': 2}

Les valeurs peuvent être n'importe quoi, y compris des listes ou des dictionnaires. Les clés doivent être des types [immuables](http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx/all_FAQ.html#tabulations-ou-espace) (nombre, chaînes de caractères, ``tuple`` incluant des types immuables, ou toute combinaison de types immuables). Si vous utilisez un autre type, cela déclenche une erreur : 

In [54]:
f = [3,4]  # Une liste est un type altérable (mutable)
d[f] = 0        # déclenche une exception

TypeError: unhashable type: 'list'

Lorsqu'on affecte une valeur à une clé, le dictionnaire crée la clé ou remplace la valeur précédente par la nouvelle :

In [55]:
d = { }
d['a'] = 0   # création d'une clé
d['a'] = 1   # remplacement d'une valeur

d

{'a': 1}

#### Ordonner les éléments d'un dictionnaire

Les éléments d'un dictionnaire ne sont pas ordonnées ou tout du moins ne le sont pas d'une façon prédictible. Pour les parcourir dans un ordre précis, il faut utiliser une liste puis les ordonner. L'exemple suivant montre comment ordonner les éléments par ordre croissant de valeur, puis par ordre alphabétique en cas d'ex aeco.

In [57]:
# Création d'un dictionnaire qui a une liste de mots associe leur longueur
d = { s:len(s) for s in ['un', 'deux', 'trois', 'quatre', 'cinq'] }  # Création d'un dictionnaire avec `dict comprehension`
d

{'un': 2, 'deux': 4, 'trois': 5, 'quatre': 6, 'cinq': 4}

In [58]:
ordonne = [ (v,k) for k,v in d.items()]
ordonne

[(2, 'un'), (4, 'deux'), (5, 'trois'), (6, 'quatre'), (4, 'cinq')]

In [59]:
ordonne.sort()
ordonne

[(2, 'un'), (4, 'cinq'), (4, 'deux'), (5, 'trois'), (6, 'quatre')]

**A quoi ça sert ?** on se sert beaucoup des dictionnaires pour compter la fréquences des caractères, des mots ou de couples de mots dans un texte. On les ordonne ensuite par fréquences décroissantes pour obtenir les mots ou caractères les plus fréquents.

### Exercice 2 : recherche dans une liste

On considère une liste de mots :

In [60]:
mots = ['eddard', 'catelyn', 'robb', 'sansa', 'arya', 'brandon',
        'rickon', 'theon', 'rorbert', 'cersei', 'tywin', 'jaime',
        'tyrion', 'shae', 'bronn', 'lancel', 'joffrey', 'sandor',
        'varys', 'renly', 'a' ]

Il faut écrire une fonction qui retourne tous les mots de la liste qui ont un 'y' en seconde position.

In [61]:
def mots_lettre_position (liste, lettre, position) :
    # liste_mots est une liste qui contient l'ensemble des mots ayant la lettre `lettre`
    # en position `position`
    liste_mots_choisis = []
    # La méthode find des chaînes de caractères devrait nous aider grandement
    for mot in liste:
        if mot.find(lettre) == (position-1):
            liste_mots_choisis.append(mot)
    return liste_mots_choisis

In [62]:
mots_lettre_position(mots, "y", 2)

['tywin', 'tyrion']

### Exercice 3 : crypter de décrypter selon Vigenère

Le [code de César](http://fr.wikipedia.org/wiki/Chiffrement_par_d%C3%A9calage) est une permutation de lettre ou un décalage. Toutes les lettres du message sont décalées d'un nombre fixe :

- ``JENESUISPASCODE``
- ``MHQHVXLVSDVFRGH``

Le [code de Vigenère](http://fr.wikipedia.org/wiki/Chiffre_de_Vigen%C3%A8re) introduit un décalage qui dépend de la position de la lettre dans le message à coder. On choisit d'abord un mot qui servira de code (par exemple ``DOP``) puis on le traduit en décalages : ``[3, 14, 15]`` en servant de la position des lettres dans l'alphabet. 

Pour coder, on décale la première lettre de 3, la seconde de 14, la troisième 15, la quatrième de 3 à nouveau... L'objectif de cette partie est d'écrire une fonction qui crypte le message précédent et une autre qui décrypte.

On se limitera aux minuscules de caractères non accentué avec des messages sans espace.

In [2]:


def calcul_des_decalages(cle):
    # on va définir les decalages pour l'encodage et le décodage
    decalages = []
    for lettre in cle:
        decalages.append(ord(lettre) - ord('a') + 1) 
    return decalages



def code_vigenere(message, cle) :
    decalages = calcul_des_decalages(cle)
    
    # chiffrement
    i = 0  # variable utilisée pour boucler sur les décalages
    message_code = ''
    for lettre in message:
        nouvelle_lettre = chr((ord(lettre) - ord('a') + decalages[i]) % 26 + ord('a'))
        message_code += nouvelle_lettre
        
        # On prend le décalage suivant
        i = (i+1) % (len(decalages)) # utilisation du modulo pour boucler quand on est à la fin
    
    return message_code


def decode_vigenere(message_code, cle) :
    decalages = calcul_des_decalages(cle)
 
    # déchiffrement
    i = 0
    message = ''
    for lettre in message_code:
        nouvelle_lettre =  chr((ord(lettre) - ord('a') + 26 - decalages[i]) % 26 + ord('a'))
        message += nouvelle_lettre
        i = (i+1) % (len(decalages))

    return message

message = 'abcz'
cle = 'ab'

print ('message : ', message)
print('clé  : ', cle)

message_code = code_vigenere(message, cle)
message_initial = decode_vigenere(message_code, cle)

print ('message codé : ', message_code)
print('message initial  : ', message_initial)


message :  abcz
clé  :  ab
message codé :  bddb
message initial  :  abcz


A quelle condition le code de Vigenère est un simple code de César ?

Pensez-vous qu'il soit possible de casser le code de Vigenère (de le décrypter sans la clé) ?

Code César =  une seule lettre dans le mot qui sert de code  

Casser le code de Vigenère, cf  
https://fr.wikipedia.org/wiki/Cryptanalyse_du_chiffre_de_Vigen%C3%A8re

In [3]:
98%26

20

In [4]:
ord('a')

97