# ITC2 - MP/PSI
---

# TP1 : Révisions : dictionnaires, lecture dans un fichier et utilisation d'un module externe
 
Rappel : Un _dictionnaire_ est une structure de données `python` qui permet d'associer une clef à une valeur (comme une fonction mathématique qui serait définie sur un domaine fini en quelque sorte).

Les valeurs peuvent être d'un type quelconque, mais il y a des restrictions sur les ensembles possibles de clefs: les clefs peuvent prendre leurs valeurs dans tous les types que nous avons déjà croisés, sauf les listes et les dictionnaires. Les symboles de délimitation d'un dictionnaire sont des accolades `{` `}`. Par ailleurs une clef ne peut apparaître plusieurs fois (de même qu'une fonction mathématique ne peut associer plusieurs valeurs à une valeur donnée).

En première approximation, on peut imaginer les dictionnaires comme des structures permettant de stocker des données nommées plutôt que numérotées (à comparer avec les listes):

## Exercice 1 : tri
On souhaite trier un tableau d'entiers positifs en comptant les occurrences de chaque valeur qui y apparaît.

1. Écrire et documenter une fonction `denombre` qui prend une liste d'entiers en argument et renvoie un dictionnaire qui permet d'avoir le nombre d'occurrence de chacun de ses arguments.

In [None]:
assert(denombre([]) == {})
assert(denombre([15356]) == {15356: 1})
assert(denombre([0,0,0,0]) == {0: 4})
assert(denombre([0,0,0,1,1,1,1,1,3,3,3]) == {0: 3, 1: 5, 3: 3})
assert(denombre([3,7,2,9,1,0,3]) == {3: 2, 7: 1, 2: 1, 9: 1, 1: 1, 0: 1})

2. Écrire et documenter une fonction `tri` qui prend en argument une liste d'entiers positifs et renvoie une nouvelle liste triée composée des mêmes valeurs, en utilisant la fonction `denombre` et la fonction `max` (qui renvoie le maximum d'une liste, mais aussi le maximum des clefs d'un dictionnaire).

In [None]:
assert(tri([]) == [])
assert(([15356]) == [15356])
assert(tri([0,0,0,0]) == [0,0,0,0])
assert(tri([0,0,0,1,1,1,1,1,3,3,3]) == [0,0,0,1,1,1,1,1,3,3,3])
assert(tri([3,3,3,1,1,1,1,1,0,0,0]) == [0,0,0,1,1,1,1,1,3,3,3])
assert(tri([3,7,2,9,1,0,3]) == [0, 1, 2, 3, 3, 7, 9])

## Exercice 2 : fréquence des lettres en Français
Pour cet exercice, on se base sur le texte [Les_Liaisons_dangereuses.txt](Les_Liaisons_dangereuses.txt) (que vous connaissez bien). On désire connaître la fréquence de chaque lettre dans ce texte.

On rappelle que la lecture dans un fichier se fait après ouverture (`open`) avec une des trois fonctions `read`, `readline` et `readlines`.

1. Écrire et documenter une fonction `occurrences` qui prend en argument un nom de fichier et renvoie un dictionnaire avec le nombre d'apparitions de chaque caractère (lettre ou autre, sans distinction) dans ce texte.

In [None]:
assert(occurrences('vide') == {})

d = occurrences('Les_Liaisons_dangereuses.txt')
assert(d['T'] == 228 and d['u'] == 43115 and d['?'] == 771 and 'ö' not in d)

2. Écrire et documenter une fonction `frequences` qui prend en argument un dictionnaire dont on suppose (sans avoir à le vérifier) que les valeurs sont des nombres et renvoie la liste des couples (clef,valeur) dans l'ordre décroissants des valeurs. Pour accéder aux composantes des couples, on utilise la même notation que pour accéder aux cases des listes : `c[0]` par exemple.

In [None]:
assert(frequences({}) == [])
assert(frequences({0: 1}) == [(0, 1)])
assert(frequences({3: 6, 7: 5, 2: 4, 9: 3, 1: 2, 0: 1}) == [(3, 6), (7, 5), (2, 4), (9, 3), (1, 2), (0, 1)])
assert(frequences({'a':23, 'e':12, 'i':7423, 'o':32112, 'y':2}) == 
       [('o', 32112), ('i', 7423), ('a', 23), ('e', 12), ('y', 2)])
d = occurrences('Les_Liaisons_dangereuses.txt')
assert(frequences(d)[1] == ('e', 97345) and frequences(d)[42] == ('?', 771))

3. On veut maintenant se restreindre à regarder les lettres d'un texte et pas tous les caractères. La méthode `isalpha` sur les chaînes de caractères permet de déterminer si une chaîne ne contient que des lettres ou pas :

In [None]:
'abcde'.isalpha()

In [None]:
'abcd5'.isalpha()

Écrire et documenter une fonction `que_lettres` qui prend en argument une liste de couple comme renvoyée par `frequence` et renvoie la liste des seuls couples dont la première composante est une lettre (en conservant l'ordre d'apparition).

In [None]:
L = que_lettres(frequences(occurrences('Les_Liaisons_dangereuses.txt')))
assert(L[17] == ('f', 6568) and L[42] == ('ô', 317))

4. On souhaite représenter tout cela sous forme  d'un diagramme camembert. Voici un exemple d'utilisation d'un tel diagramme :

In [None]:
from matplotlib import pyplot
donnees = [23, 17, 35, 29, 12, 41]
legende = ['a', 'b', 'c', 'd', 'e', 'f']

pyplot.pie(donnees, labels=legende)
pyplot.show()

Écrire et documenter une fonction `statistiques` qui prend en argument une liste de couples comme renvoyés par la fonction `frequences` et affiche le diagramme camembert correspondant, dans l'ordre des fréquences.

In [None]:
statistiques(que_lettres(frequences(occurrences('Les_Liaisons_dangereuses.txt'))))

Pour vous aidez à vérifier, voici mes propres statistiques sur ce texte :
    ![](mes_stats.png)

## Exercice 3 : déchiffre un texte mystère
En combinant ce qui a été fait dans l'exercice précédent, trouver le texte [mystere.txt](mystere.txt) où les lettre ont été modifiée : seules les lettres non accentuées ont été modifiées, chaque occurrence d'une lettre a été remplacée par la même lettre, ce remplacement est injectif.