# Listes, tuples et dictionnaires

Un _conteneur de données_ est un type qui contient plusieurs données simples. En Python, les principaux types de "conteneurs" de données utilisés sont les listes, les tuples et les dictionnaires.

## Listes
En Python, le conteneur le plus utilisé est la _liste_. Une liste est une séquence de valeurs, qu'on écrit séparées par des virgules et délimitée par des crochets. Voici un exemple de liste de trois chaines de caractères:

In [1]:
repas = ["hamburger", "frites", "boisson"]

La liste la plus simple est la liste vide, qui s'écrit ```[]```:

In [2]:
vide = []

On peut créer une liste d'un élément en plaçant simplement des crochets autour d'une valeur (qui peut être une variable ou un littéral):

In [3]:
["milk-shake"]

['milk-shake']

In [4]:
drink = "irn-bru"

In [5]:
[drink]

['irn-bru']

Une liste peut contenir des chaines de caractères, comme dans l'exemple précédent, mais aussi des nombres, des booléens ou encore d'autres listes. Plusieurs éléments de types différents peuvent même se cotoyer dans la même liste:

In [6]:
melange = [ 1, "deux", False, ["trois", "3 bis"], 4.3, True]

In [7]:
melange[2]

False

In [8]:
melange[3]

['trois', '3 bis']

Ici on a un exemple de liste imbriquée dans une autre. Comme le quatrième élément de mélange (soit ```melange[3]```) est lui-même une liste, on peut accéder à son premier élément comme ceci:

In [9]:
melange[3][0]

'trois'

D'autre part, il vaut la peine de noter que la liste ```["trois", "3 bis"]``` constitue _un seul_ élément de la liste ```mélange```. L'élément suivant, qui est le nombre décimal ```4.3```, est donc à la position 4 (on rappelle que la première position est indexée 0). On peut le vérifier:

In [10]:
melange[4]

4.3

### Opérations sur les listes

Quelles opérations peuvent être utilisées sur les listes? 

#### Accéder aux éléments

La principale opération pertinente est l'opération d'accéder aux éléments de la liste, en désignant un élément par sa position. Le premier est à la position zéro, le deuxième à la position 1, le troisième à la position 2, etc.

Exemples:

In [11]:
repas[0]

'hamburger'

In [12]:
repas[2]

'boisson'

Au-dessus on a accéder au dernier élément de ```repas``` par sa indice (2), mais on peut aussi compter négativement à partir de la fin: le dernier élément est à la position ```-1```, l'avant-dernier à la position -2, etc.

In [13]:
repas[-1]

'boisson'

On peut aussi accéder à _plusieurs_ éléments, en combinant deux positions pour délimiter un intervalle. Par exemple, en écrivant ```repas[0:2]``` on accède aux éléments des positions ```0``` et ```1``` (les valeurs depuis zéro et jusqu'à deux, sans inclure deux. On peut remarquer que le concept d'inclure le premier indice mais pas le dernier est semblable à ce qu'on fait avec ```range```.

In [14]:
repas[0:2]

['hamburger', 'frites']

Quand on veut sélectionner les éléments _depuis le début_ ou bien _jusqu'à la fin_, on peut omettre l'indice correspondant. Implicitement, utiliser un deux-points indique qu'on sélectionne un intervalle de valeurs.

Les éléments depuis le premier jusqu'à 2 (exclus):

In [15]:
repas[:2]

['hamburger', 'frites']

Les éléments de 1 (inclusivement) à la fin:

In [16]:
repas[1:]

['frites', 'boisson']

#### Concaténation

L'opérateur ```+``` permet de concaténer deux listes:

In [17]:
repas + ["crème dessert", "café"]

['hamburger', 'frites', 'boisson', 'crème dessert', 'café']

L'opération a créé une nouvelle liste avec la concaténation des deux listes opérandes.

#### Appartenance

Le mot clé ```in``` s'utilise comme un opérateur binaire, et sert à vérifier qu'une valeur quelconque est un élément d'une liste.

In [18]:
"frites" in repas

True

Remarquer que ```in``` signifie _est élément de_ et non pas _est inclus dans_:

In [19]:
["hamburger", "frites"] in repas

False

Cette opération donne ```False``` alors que la liste ```["hamburger", "frites"]``` est une sous-liste de ```repas```.

En revanche on peut vérifier que la liste ```["trois", "3 bis"]``` est bien un _élément_ de la liste ```melange``` (et non pas une sous-liste:

In [20]:
["trois", "3 bis"] in melange

True

#### Énumérer les valeurs d'une liste

La boucle ```for``` est parfaitement adaptée à énumérer les valeurs dans une liste:

In [21]:
for element in repas:
    print("Je vais manger:", element)

Je vais manger: hamburger
Je vais manger: frites
Je vais manger: boisson


Il est parfois nécessaire d'accéder aux éléments par leur position, afin, par exemple, de raisonner sur l'élément qui suit ou qui précède. On peut alors utiliser un objet ```range```, pour obtenir l'intervalle des indices, soit 0, 1.. jusqu'à la longueur de la liste, que nous donne la fonction ```len()```:

In [22]:
for i in range(len(repas)):
    print("Je vais manger:", repas[i])

Je vais manger: hamburger
Je vais manger: frites
Je vais manger: boisson


Il existe aussi une fonction ```enumerate``` qui permet permet d'accéder simultanément aux éléments et à leurs indices:

In [23]:
for i, elem in enumerate(repas):
    print("Élément numéro", i, ":", elem)

Élément numéro 0 : hamburger
Élément numéro 1 : frites
Élément numéro 2 : boisson


Ce qu'il se passe ici est que la fonction ```enumerate``` nous donne une liste de paires qui sont prises une par une dans la boucle ```for```. La notation ```i, elem``` dans l'en-tête de la boucle ```for``` fait correspondre ```i``` au premier élément de la paire, et ```elem``` au deuxième. On reviendra sur cette fonctionnalité de pattern-matching dans la section sur les tuples.

#### Modification d'une liste

Une liste est modifiable: on peut ajouter ou supprimer des éléments, et on peut les remplacer par d'autres.

Pour remplacer un élément, il suffit d'écrire une affectation vers la variable qui désigne l'élément à remplacer, par sa position: 

In [24]:
repas[0] = "hot-dog"

In [25]:
repas

['hot-dog', 'frites', 'boisson']

On peut même utiliser des _slice_ pour rempalcer plusieurs éléments d'un coup:

In [26]:
repas[0:2]= ['saumon', 'salade verte']

In [27]:
repas

['saumon', 'salade verte', 'boisson']

Pour ajouter un élément, on utilise la fonction _append_. 
La syntaxe est un peu particulière, car la fonction append 'appartient' au type liste (en terminologie de programmation orienté-objet, c'est une méthode de la classe liste). La syntaxe pour utiliser la fonction append est donc une syntaxe orientée-objet:

In [28]:
repas.append("creme glacée")

On applique ainsi l'ajout à la liste ```repas```.

Remarquer que la fonction ```append``` ne _retourne_ rien mais modifie la liste:

In [29]:
repas

['saumon', 'salade verte', 'boisson', 'creme glacée']

On pourrait aussi allonger la liste ```repas``` en utilisant la concaténation:

In [30]:
repas = repas + ['café']

Remarquer que la concaténation se fait entre deux listes: il est donc nécessaire de créer une liste d'un élément (i.e. ```['café']``` plutôt que juste ```'café'```) avec l'élément à ajouter.

Autre remarque: par cette affectation, on n'a pas techniquement _modifié_ une liste existante: la partie droite de l'affectation _crée une nouvelle liste_ ```repas + [café]```, et le résultat est ensuite affecté à la variable ```repas```.

La distinction est importante à cause de l'association entre variables et valeurs en Python (et dans les langages orienté-objet en général).

### Aparté: Objets modifiables en Python

Comme on a vu juste avant, les listes sont des objets modifiables. Ceci a des conséquences importantes sur les concepts d'_égalité_ et d'_identité_: deux objets sont-ils "pareils" ou bien "le même objet"?

Considérons par exemple les variables ```repas1```, ```repas2``` et ```repas3``` suivantes:

In [31]:
repas1 = ['bacon', 'oeufs']
repas2 = ['bacon', 'oeufs']
repas3 = repas2

Les trois listes sont "égales" au sens où elles contiennent les mêmes éléments, et ceci se reflète par les égalités suivantes:

In [32]:
repas1==repas2

True

In [33]:
repas2==repas3

True

Cependant, les listes ```repas2``` et ```repas3``` sont "encore plus égales", car elles sont associées avec une seule et même liste en mémoire (c'est le résultat de l'affectation).

On peut tester cela avec le mot-clé ```is``` qui nous dit que deux variables se réfèrent _au même objet_:

In [34]:
repas1 is repas2

False

In [35]:
repas2 is repas3

True

Pour bien comprendre les conséquences de cette égalité/identité, on peut modifier la liste ```repas2```, et voir l'effet sur les autres listes:

In [36]:
repas2.append('café')

In [37]:
repas2

['bacon', 'oeufs', 'café']

On a rajouté un élément à ```repas2```.

Comme on peut s'y attendre, ```repas1``` n'a pas changé:

In [38]:
repas1

['bacon', 'oeufs']

En revanche, quand on disait que ```repas2``` et ```repas3``` sont _la même liste_, c'est que ```repas3``` a changé:

In [39]:
repas3

['bacon', 'oeufs', 'café']

À retenir de ceci: avec des objets _modifiables_ (dont les listes et les dictionnaires), il faut avoir conscience que si on "copie" une variable en écrivant une affectation du genre ```liste2=liste1```, les deux variables sont deux références _au même objet_. Si on veut dupliquer une liste (ou tout autre objet modifiable), il faut le faire explicitement.  

### Exercices


Quelques exercices sur les listes, où on va extraire les mots d'un texte et faire des choses sur cette liste.

On part d'un texte sous forme de String:

In [40]:
texte = "La vie est courte, l'art est long, l'occasion fugitive, l'expérience trompeuse, le jugement difficile."

On extrait la liste de mots à l'aide d'une expression régulière:

In [41]:
import re # importer la bibliothèque des expressions régulières
mots = re.findall('[a-z|é|è|ê|à|â|ô|ë|ï|ü]+', texte.lower()) # extraire toutes les séquences de lettres

Ceci nous donne les mots du texte en minuscules, dans une liste:

In [42]:
mots

['la',
 'vie',
 'est',
 'courte',
 'l',
 'art',
 'est',
 'long',
 'l',
 'occasion',
 'fugitive',
 'l',
 'expérience',
 'trompeuse',
 'le',
 'jugement',
 'difficile']

On applique les mêmes opérations à un texte plus long:

In [43]:
serment = """"
Je jure par Apollon, médecin, par Esculape, par Hygie et Panacée, par tous les dieux et
toutes les déesses, les prenant à témoin que je remplirai, suivant mes forces et ma
capacité, le serment et l’engagement suivant :
« Je mettrai mon maître de médecin au même rang que les auteurs de mes jours, je
partagerai avec lui mon avoir et, le cas échéant, je pourvoirai à ses besoins; je
tiendrai ses enfants pour des frères, et, s’ils désirent apprendre la médecine, je la
leur enseignerai sans salaire ni engagement. Je ferai part des préceptes, des leçons
orales et du reste de l’enseignement à mes fils, à ceux de mon maître et aux
disciples liés par engagement et un serment suivant la loi médicale, mais à nul
autre. Je dirigerai le régime des malades à leur avantage, suivant mes forces et
mon jugement, et je m’abstiendrai de tout mal et de toute injustice.
« Je ne remettrai à personne du poison, si on m’en demande, ni ne prendrai
l’initiative d’une pareille suggestion; semblablement, je ne remettrai à aucune
femme un pessaire abortif, je passerai ma vie et j’exercerai mon art dans
l’innocence et la pureté. Je ne pratiquerai pas l’opération de la taille. Dans
quelque maison que j’entre, j’y entrerai pour l’utilité des malades, me préservant
de tout méfait volontaire et corrupteur, et surtout de la séduction des femmes et
des garçons, libres ou esclaves. Quoi que je voie ou entende dans la société
pendant l’exercice ou même hors de l’exercice de ma profession, je tairai ce qui
n’a jamais besoin d’être divulgué, regardant la discrétion comme un devoir en
pareil cas.
« Si je remplis ce serment sans l’enfreindre, qu’il me soit donné de jouir
heureusement de la vie et de ma profession, honoré à jamais des hommes; si je le
viole et que je me parjure, puissé-je avoir un sort contraire. »
"""
mots = re.findall('[a-z|é|è|ê|à|â|ô|ë|ï|ü]+', serment.lower())

La liste ```mots``` ainsi obtenue est la base pour les questions suivantes.

__1.1__ Dans cette liste de mots, calculer la longueur moyenne des mots

__1.2__ Trouver tous les mots commençant par la lettre a (avec ou sans accent), et en faire une liste.

__1.3__ Trouver le mot le plus long

__1.4__ Afficher toutes les séquences d'au moins 3 mots de longueur croissante (exemple ```['je', 'la', 'leur', 'enseignerai']```)

__1.5__ Trouver _la plus longue_ séquence de mots de longueur croissante

## Tuples

Les tuples sont semblables à des listes, au sens où ce sont aussi des séquences de valeurs de types quelconques. 

La principale différence est qu'un tuple est _immuable_, ce qui veut dire qu'on ne peut pas le modifier. Comme on vient de le voir au-dessus, ceci a d'importantes conséquences pratiques sur la manière dont on raisonne sur les objets dans un programme. D'autre part, il y a un intérêt pratique quand on veut utiliser une séquence de valeurs comme clé d'un dictionnaire (voir plus loin): on peut utiliser un tuple mais pas une liste.  

Un tuple s'écrit comme une liste, sauf que les crochets sont remplacés par des parenthèses:

In [44]:
mousquetaires = ("Athos", "Porthos", "Aramis")

In [45]:
mousquetaires

('Athos', 'Porthos', 'Aramis')

Dans la plupart des cas, les parenthèses sont optionnelles:

In [46]:
comiques = "laurel", "hardy"

In [47]:
comiques

('laurel', 'hardy')

Noter qu'on pourrait aussi utiliser deux variables à gauche de l'affectation:

In [48]:
maigre, gros = "laurel", "hardy"

In [49]:
gros

'hardy'

Ici la partie droite est implicitement un tuple, et à gauche Python fait un "pattern-matching" pour décomposer ce tuple en deux et faire les affectations séparément. On peut aussi utiliser ces "affectations multiples" pour décomposer un tuple:

In [50]:
moustachu, barbu, chevelu = mousquetaires

In [51]:
barbu

'Porthos'

Lorsqu'on veut écrire une fonction qui retourne plusieurs valeurs, on utilise normalement un tuple:

In [52]:
def macandcheese(garniture):
    return "mac", "cheese", garniture

In [53]:
repas = macandcheese("brocoli")

In [54]:
repas

('mac', 'cheese', 'brocoli')

### Opérations sur les tuples

On peut accéder aux valeurs d'un tuple de la même manière qu'on accède aux valeurs d'une liste:

In [55]:
mousquetaires[0]

'Athos'

Les opérateurs ```+``` et ```in``` sont aussi utilisables avec des tuples:

In [56]:
"d'Artagnan" in mousquetaires

False

In [57]:
mousquetaires + ("d'Artagnan", "Richelieu", "Milady")

('Athos', 'Porthos', 'Aramis', "d'Artagnan", 'Richelieu', 'Milady')

On peut utiliser une boucle ```for``` pour énumérer les éléments d'un tuple:

In [58]:
for m in mousquetaires:
    print(m)

Athos
Porthos
Aramis


Cependant, en général pour des séquences longues qu'on voudrait énumérer à l'aide d'une boucle, on utilise plutôt une liste. Ceci n'est pas une règle stricte, mais simplement une bonne pratique qui reflète les raisons d'être de ces deux types de conteneurs de données.

Comme indiqué plus haut, on ne peut pas modifier ou ajouter de valeurs à un tuple:

In [59]:
mousquetaires[0]="Zorro"

TypeError: 'tuple' object does not support item assignment

In [60]:
mousquetaires.append("d'Artagnan")

AttributeError: 'tuple' object has no attribute 'append'

### Exercice

On reprend la liste de mots de l'exercice 1.1.

__2.1__ À partir de cette liste de mots, créer une liste de tuples de la forme ```[("mot", longueur du mot),("mot2", longueur du mot2)...]```, avec tous les mots du texte et leur longueur.

__2.2__ Écrire une fonction ```mvc```qui prend un mot en entrée (un string) et retourne un tuple ```(mot, nombre_voyelles, nombre_consonnes)```, où ```mot``` est le mot passé en paramètre, ```nombre_voyelles``` est le nombre de voyelles contenues dans le mot, et ```nombre_consonnes``` est le nombre de consonnes.

__2.3__ En utilisant la fonction de la question précédente, créer une nouvelle liste de tuples similaire à celle de l'exercice 2.1, mais avec des tuples de 3 éléments ```("mot", nombre_voyelles, nombre_consonnes)```

## Dictionnaires

Un _dictionnaire_ est une structure associative, où on a des "clés" et des "valeurs" associées.

Le terme "dictionnaire" vient de l'analogie avec un dictionnaire où on va aller chercher un mot (la clé) et obtenir la définition correpondante (la valeur).

On écrit un dictionnaire entre accolades, sous forme de séquence de paires clé-valeur sépárées par des virgules. Chaque paire clé-valeur est écrite séparée par un deux-points.

In [61]:
dictionnaire = {"python": "un type de serpent", "java": "une ile de l'archipel indonésien", "c": "la troisième lettre de l'alphabet" }

On peut créer un dictionnaire vide en utilisant la notation ```{}```, et ajouter des éléments en associant des valeurs à des clés:

In [62]:
contacts = {}
contacts["Bill"] = "bill.gates@microsoft.com"
contacts["Sundar"] = "sundar.pichai@google.com"

In [63]:
contacts

{'Bill': 'bill.gates@microsoft.com', 'Sundar': 'sundar.pichai@google.com'}

Contrairement aux listes et tuples, les éléments d'un dictionnaire ne sont pas ordonnés: il n'y a pas de concept de premier, deuxième, ou dernier élément. Si on considère que les éléments des listes et tuples sont "indexés" par les nombres entiers 0, 1, 2...n, alors on peut considérer dans un dictionnaire les _valeurs_ sont indexées par les _clés_. 
Ceci se reflète dans la manière dont modifie les éléments d'un dictionnaire, et dans la manière dont on accède aux données.

### Opérations sur les dictionnaires

#### Accéder aux données
Pour accéder aux valeurs d'un dictionnaire (et ici on parle bien des _valeurs_ dans les paires clés-valeurs), on utilise les clés comme "indices" et la notation avec des crochets:

In [64]:
dictionnaire["python"]

'un type de serpent'

Cette manière d'accéder aux valeurs à partir des clés sous-entend qu'on connaisse les clés. 

#### Modifier un dictionnaire
On a vu au-dessus qu'on peut ajouter des éléments à un dictionnaire, en associant une valeur à une clé. Il est important de noter que cette même façon de faire nous permet aussi de _modifier_ le dictionnaire, en changeant la valeur associée à une clé existante:

In [65]:
contacts["Bill"] = "bill.gates@gates_foundation.com"

On constate que l'ancienne valeur associée à la clé ```"Bill"``` a disparu:

In [66]:
contacts

{'Bill': 'bill.gates@gates_foundation.com',
 'Sundar': 'sundar.pichai@google.com'}

Ceci garantit que les clés sont uniques: si on essaye d'ajouter une paire clé-valeur où la clé existe déjà, l'ancienne paire est supprimée. Il ne peut donc pas y avoir de clés dupliquées.

L'autre manière dont on peut vouloir modifier un dictionnaire est en supprimant les paires clés-valeurs. Ceci peut se faire avec la méthode ```pop()```, toujours en accédant à la paire par la clé. L'appel de la méthode retourne la valeur associée à la clé, et enlève la paire du dictionnaire:

In [67]:
contacts.pop("Sundar")

'sundar.pichai@google.com'

In [68]:
contacts

{'Bill': 'bill.gates@gates_foundation.com'}

#### Appartenance et énumération

Pour énumérer les données d'un dictionnaire, ou pour vérifier l'appartenance d'éléments, on peut utiliser les techniques applicables à des listes et tuples (l'opérateur ```in``` et la boucle ```for```, en particulier), mais on les utilise comme si le dictionnaire était seulement une collection des clés (et non pas des valeurs):

In [69]:
"python" in dictionnaire

True

In [70]:
'un type de serpent' in dictionnaire

False

Comme on peut le voir, ```in``` nous indique quelles _clés_ sont présentes.

De la même façon, une boucle ```for``` nous permet d'énumérer les clés:

In [71]:
for k in dictionnaire:
    print(k)

python
java
c


L'énumération des clés nous permet d'accéder à toutes les données du dictionnaire, en récupérant à chaque fois la valeur associée à une clé:

In [72]:
for k in dictionnaire:
    print(k, "=>", dictionnaire[k])

python => un type de serpent
java => une ile de l'archipel indonésien
c => la troisième lettre de l'alphabet


Comme pour les listes, on pourrait utiliser ```enumerate``` pour obtenir des positions numériques pour les clés, mais il n'est pas recommandé de chercher à raisonner sur l'ordre des clés. Il est préférable de considérer les clés comme un ensemble (au sens _Set_, un ensemble non ordonné qui ne contient pas d'éléments en double). 

L'équivalent logique de ```enumerate``` pour les dictionnaires est plutôt d'accéder aux paires clés-valeurs, en utilisant la méthode ```items()```:

In [73]:
for k,v in dictionnaire.items():
    print(k,"=>",  v)

python => un type de serpent
java => une ile de l'archipel indonésien
c => la troisième lettre de l'alphabet


Pour certains cas d'utilisations, il peut être utile d'accéder directement à la liste de clés, ou à la liste de valeurs.

Ces deux ensembles sont accessibles par les méthodes ```keys()``` et ```values```:

In [74]:
contacts.keys()

dict_keys(['Bill'])

In [75]:
contacts.values()

dict_values(['bill.gates@gates_foundation.com'])

Attention: les notations ```dict_keys``` et ```dict_values``` montrent qu'il ne s'agit pas de listes mais d'objets de types "ensemble de clés de dictionnaire" et "ensemble de valeurs de dictionnaire". 

On peut cependant les énumérer avec des boucles ```for```:

In [76]:
for k in dictionnaire.keys():
    print(k)

python
java
c


In [77]:
for v in dictionnaire.values():
    print(v)

un type de serpent
une ile de l'archipel indonésien
la troisième lettre de l'alphabet


On peut remarquer que l'énumération des clés pouvait se faire directement à l'aide de ```for k in dictionnaire``` (sans se référer explicitement à ```keys()```). L'énumération directe des valeurs peut avoir un intérêt dans quelques cas particuliers, mais l'énumération des clés et l'accès aux valeurs correspondantes est la technique la plus appropriée en général.

### Exercices

On reprend l'exercice où on manipule du texte.

__1__: Écrire du code pour compter les occurences des différents mots. Pour chaque mot qui apparait dans le texte, on veut savoir combien de fois il apparait.

Le résultat doit être un dictionnaire ```{"mot": compte}```.

Méthode:
(1) créer un dictionnaire vide.
(2) Énumérer les mots du texte
    Pour chaque mot:
 -> s'il n'est pas encore dans le dictionnaire, l'ajouter, avec un compte de 1
 -> s'il y est déjà, ajouter 1 au compte pour ce mot.

__2__: Le dictionnaire suivant nous donne les points au Scrabble pour les différentes lettres:

In [78]:
scrabble: {'A': 1,'B': 3,'C': 3,'D': 2,'E': 1,'F': 4,'G': 2,'H': 4,'I': 1,'J': 8,'K': 10, 'L': 1,'M': 2,'N': 1,'O': 1,'P': 3,'Q': 8,'R': 1,'S': 1,'T': 1,'U': 1,'V': 4,'W': 10, 'X': 10, 'Y':10, 'Z':10}

Écrire une fonction qui calcule le score au scrabble pour un mot donné.
Attention: il faut ajouter manuellement au dictionnaire les points pour les lettres accentuées...

__3__: Pour tous les mots de 8 lettres et moins dans le texte, calculer leur score au Scrabble. Créer un dictionnaire indiquant le score de chaque mot apparaissant dans le texte.

__4__: Parcourir les dictionnaires des questions 1 et 4 pour trouver le mot dont le "score combiné" est le plus élevé, en prenant comme "score combiné" le nombre de fois qu'il apparait multiplié par le nombre de points qu'il rapporte à chaque fois.