# Listes et tuples

Dans ce chapitre, nous abordons deux types de structures de données utilisées en Python : les **listes** et les **tuples**.

## Pourquoi utiliser des structures de données ?

Dans les chapitres précédents, nous n'avons utilisé que des variables simples pour stocker les informations traitées dans nos programmes (ce que nous appelons ici « variable simple » est une variable contenant un objet simple comme un entier, un réel, une chaîne ou un booléen - cf. chapitre sur les bases du langage Python). Ces informations étant peu volumineuses et peu structurées, cette technique était suffisante. Cependant, programmer en utilisant uniquement des variables simples est très largement insuffisant, voire même impossible. 

Prenons l'exemple d'un programme qui doit calculer la moyenne d'une promo de 500 étudiants à un examen d'économie. Est-ce gérable de déclarer 500 variables : une variable par note ? Pas vraiment.

Autre exemple : celui d'un programme qui traite des données textuelles en appliquant un traitement identique à tous les mots d'un texte. Est-ce envisageable de compter au préalable le nombre de mots du texte pour savoir de combien de variables on a besoin ? Absolument pas. Et en supposant que cela soit possible, cela signifie qu'il faudra modifier votre programme si le texte à traiter change...

Utiliser uniquement des variables simples suppose de connaître à l'avance la quantité de données à traiter, ce qui est rarement le cas sauf pour des programmes très simples. Et même dans l'hypothèse où il serait possible de quantifier précisément les données, il est inconcevable d'écrire des programmes qui gèrent des centaines, voire des milliers de variables.

Autre limitation des variables simples : elles ne permettent pas de mémoriser des données structurées. Prenons l'exemple d'un programme permettant de gérer les clients d'une entreprise commerciale. Un client est décrit à l'aide de différentes caractéristiques : numéro, nom, prénom, adresse, etc. Une variable simple ne permet pas de mémoriser toutes ces informations de types différents (chaînes, nombres, etc). 

Enfin, et nous terminerons sur cette dernière limitation : les variables simples ne permettent pas de mémoriser des associations entre des informations. Pourtant, ces associations sont monnaie courante : un mot du dictionnaire et sa définition, un n° de département et le nom du département correspondant, un n° d'étudiant et l'étudiant qui lui est associé, etc. Elles ne permettent pas non plus de stocker des données multi-dimensionnelles comme des vecteurs ou des matrices de nombres.

Les structures de données ont été introduites en programmation pour pallier aux limitations des objets et variables simples. Il existe différents types de structures de données selon le langage. En python, il en existe quatre principaux :

* les listes
* les tuples
* les dictionnaires
* les ensembles

Les listes et les tuples sont abordés dans ce chapitre. Les dictionnaires feront l'objet d'un autre chapitre.

## Qu'est-ce qu'une liste ?

Une liste est une séquence de valeurs (une collection ordonnée d'objets) dont les types peuvent être différents. Chaque valeur figure à une place précise dans la liste (on parle aussi d'**indice**, de **position** ou de **rang**) qui permet de la repérer et d'y accéder. On dit en particulier qu'une liste est indexée sur les indices de ses éléments. Le nombre de valeurs stockées dans une liste est quelconque et peut varier au cours d'un programme. 

## Notation et création d'une liste

La notation d'une liste s'effectue à l'aide des crochets :

* `[` pour indiquer le début de la liste
* `]` pour indiquer la fin de la liste

À l'intérieur des crochets, les différentes valeurs de la liste sont séparées par des virgules. Par exemple : `[3.1416, 25, 154, "fromage", "dessert"]`. Il existe un cas particulier de liste : la liste vide ne contenant aucun élément. Dans ce cas, la notation s'effectue avec uniquement les crochets : `[]`.
Les valeurs d'une liste sont indexées par leur rang dans la liste, en commençant par 0 (rang de la première valeur), puis 1 (rang de la deuxième valeur), etc.

![Exemple de liste](ImagesNotebook/ExempleListe.PNG)


Une liste doit être mémorisée dans une variable (on parle alors de **variable structurée**). Par exemple : `bazar = [3.1416, 25, 154, "fromage", "dessert"]`. Le nom de la variable est alors appelé son identifiant et permet de la référencer dans le programme. Une liste est un objet **muable**, dans la mesure où on peut la modifier sans réaliser une nouvelle affectation de la variable qui la contient. 

## Accès aux éléments d'une liste

L'accès aux éléments d'une liste se fait à l'aide de leurs rangs dans la liste avec la notation suivante :


In [None]:
id_liste[pos]

où `id_liste` est le nom de la variable référençant la liste et `pos` est la position occupée par l'élément dans la liste. La position indiquée doit correspondre à un élément, sous peine de déclencher une erreur d'exécution. Le programme suivant effectue des accès aux éléments d'une liste.

In [12]:
bazar = [3.1416, 25, 154, "fromage", "dessert"]
print(f"Le premier élément de la liste est : {bazar[0]}")
print(f"Le troisième élément de la liste est : {bazar[2]}")
print(f"Le dernier élément de la liste est : {bazar[4]}")
print(f"Le sixième élément de la liste n'existe pas {bazar[5]}. Cette instruction doit produire une erreur.")

Le premier élément de la liste est : 3.1416
Le troisième élément de la liste est : 154
Le dernier élément de la liste est : dessert


IndexError: list index out of range

La dernière instruction de ce programme produit une erreur. En effet, elle contient un accès au sixième élément de la liste : `bazar[5]`. Or cet élément n'existe pas puisque la liste n'en comporte que cinq.

La valeur de la position fournie lors de l'accès à un élément peut être négative. Dans ce cas, l'accès aux élements s'effectue à partir de la fin de la liste. Le dernier élément figure alors à la position -1, l'avant-dernier élément à la position -2, etc. 

In [3]:
print(f"L'élément de position -1 est : {bazar[-1]}")
print(f"L'élément de position -5 est : {bazar[-5]}")

L'élément de position -1 est : dessert
L'élément de position -5 est : 3.1416


## Accès à une sous-liste (« list slicing »)

En Python, une sous-liste (on dit aussi une « tranche » de liste) est une partie contigüe de ses éléments, qui débute à partir d'une position de début comprise, et qui se termine à une position de fin non comprise. La syntaxe générale d'accès à une sous-liste est la suivante&nbsp;:

In [None]:
id_liste[pos_deb:pos_fin]

où `pos_deb` est la position du premier élément de la sous-liste et `pos_fin` est la position du premier élément non compris dans la sous-liste. Les éléments composant la sous-liste sont donc ceux compris entre la position `pos_deb` et la position `pos_fin-1`.

In [4]:
print(f"Premier exemple de slicing : {bazar[1:3]}")
print(f"Deuxième exemple de slicing : {bazar[-3:-1]}")
print(f"Troisième exemple de slicing : {bazar[1:-1]}")

Premier exemple de slicing : [25, 154]
Deuxième exemple de slicing : [154, 'fromage']
Troisième exemple de slicing : [25, 154, 'fromage']


Il est possible d'omettre la position `pos_fin`. Dans ce cas, la sous-liste contient tous les éléments à partir de la position `pos_deb` jusqu'à la fin de la liste. 

In [7]:
print(f"bazar[3:] = {bazar[3:]}")
print(f"bazar[-4:] = {bazar[-4:]}")

bazar[3:] = ['fromage', 'dessert']
bazar[-4:] = [25, 154, 'fromage', 'dessert']


Il est possible d'omettre la position `pos_deb`. Dans ce cas, la sous-liste contient tous les éléments à partir du début de la liste jusqu'à l'élément de rang `pos_fin-1`.

In [9]:
print(f"bazar[:3] = {bazar[:3]}")
print(f"bazar[:-3] = {bazar[:-3]}")

bazar[:3] = [3.1416, 25, 154]
bazar[:-3] = [3.1416, 25]


Dans les exemples précédents, tous les éléments des sous-listes sont adjacents dans la liste initiale (i.e., ils sont stockés les uns à côté des autres). Il est possible d'extraire une sous-liste dont les éléments ne sont pas adjacents dans la liste initiale. On parle alors de « slicing » étendu. Dans ce cas, il faut ajouter entre les crochets un troisième nombre, appelé le **pas**, correspondant à l'écart qu'il doit y avoir entre les positions des éléments à extraire&nbsp;:

In [None]:
id_liste[pos_deb:pos_fin:pas]

Voici ci-dessous des exemples de « slicing » étendu&nbsp;:

In [2]:
alphabet = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']
print(f"Extraction de la position 2 à la position 15 comprises, de 2 en 2 : alphabet[2:16:2] = {alphabet[2:16:2]}.")
print(f"Extraction de la position 0 à la position 25 comprises, de 4 en 4 : alphabet[0:26:4] = {alphabet[0:26:4]}.")

Extraction de la position 2 à la position 15, de 2 en 2 : alphabet[2:16:2] = ['c', 'e', 'g', 'i', 'k', 'm', 'o'].
Extraction de la position 0 à la position 25, de 4 en 4 : alphabet[0:26:4] = ['a', 'e', 'i', 'm', 'q', 'u', 'y'].


La valeur de `pas` peut-être négative. L'extraction s'effectue alors de droite à gauche à partir de `pos_deb` jusqu'à `pos_fin+1`. Dans ce cas, il faut impérativement que `pos_deb` soit strictement supérieure à `pos_fin` sous peine d'avoir un résultat vide.

In [5]:
print(f"Extraction de la position 20 à la position 5 comprises, de -2 en -2 : alphabet[20:4:-2] = {alphabet[20:4:-2]}.")
print(f"Extraction de la position 5 à la position 20 comprises, de -2 en -2 : alphabet[5:21:-2] = {alphabet[5:21:-2]}.")

Extraction de la position 20 à la position 5 comprises, de -2 en -2 : alphabet[20:4:-2] = ['u', 's', 'q', 'o', 'm', 'k', 'i', 'g'].
Extraction de la position 5 à la position 20 comprises, de -2 en -2 : alphabet[5:21:-2] = [].


Les valeurs de `pos_deb` et `pos_fin` peuvent être omises, comme l'illustrent les exemples ci-dessous.

In [10]:
print(f"alphabet[:7:2] = {alphabet[:7:2]}.")
print(f"alphabet[3::2] = {alphabet[3::2]}.")
print(f"alphabet[:3:-2] = {alphabet[:3:-2]}.")
print(f"alphabet[7::-2] = {alphabet[7::-2]}.")
print(f"alphabet[::-1] = {alphabet[::-1]}.")

alphabet[:7:2] = ['a', 'c', 'e', 'g'].
alphabet[3::2] = ['d', 'f', 'h', 'j', 'l', 'n', 'p', 'r', 't', 'v', 'x', 'z'].
alphabet[:3:-2] = ['z', 'x', 'v', 't', 'r', 'p', 'n', 'l', 'j', 'h', 'f'].
alphabet[7::-2] = ['h', 'f', 'd', 'b'].
alphabet[::-1] = ['z', 'y', 'x', 'w', 'v', 'u', 't', 's', 'r', 'q', 'p', 'o', 'n', 'm', 'l', 'k', 'j', 'i', 'h', 'g', 'f', 'e', 'd', 'c', 'b', 'a'].


Notons que le dernier exemple `alphabet[::-1]` est particulièrement intéressant. La valeur de `pas` est de -1, donc les caractères extraits seront adjacents. Comme il s'agit d'une valeur négative, l'extraction se fait de droite à gauche en commençant par la fin de la liste (puisque `pos_deb` est omise) jusqu'au début de la liste (puisque `pos_fin` est omise). On extrait donc tous les caractères situés de la fin de la liste jusqu'à son début : cela revient tout simplement à inverser la liste ! 

Ajoutons pour terminer que toutes les opérations de « slicing » présentées ici sur les listes sont utilisables également sur les chaînes pour extraire des sous-chaînes.

## Opérations, fonctions et instructions usuelles sur les listes

### Taille d'une liste : la fonction **len()**

La taille d'une liste est le nombre d'élements qu'elle contient. La fonction **len()**&nbsp;:

* prend en paramètre une liste
* retourne en résultat un nombre entier égal à la taille de cette liste

In [13]:
print(f"La taille de la liste bazar est : {len(bazar)}")
print(f"La taille de la liste alphabet est : {len(alphabet)}")

La taille de la liste bazar est : 5
La taille de la liste alphabet est : 26


### Modification d'un élément existant

Un élément d'une liste peut être modifié à l'aide d'une simple opération d'affectation. La syntaxe est la suivante&nbsp;:

In [None]:
id_liste[pos] = valeur

où &nbsp;:

* `id_liste` est l'identifiant de la liste
* `pos` est la position occupée par l'élément à modifier
* `valeur` est la nouvelle valeur de l'élément

In [14]:
print(f"Liste bazar avant modification : {bazar}")
bazar[2] = 'bonjour'
bazar[1] += 3
print(f"Liste bazar après modification : {bazar}")

Liste bazar avant modification : [3.1416, 25, 154, 'fromage', 'dessert']
Liste bazar après modification : [3.1416, 28, 'bonjour', 'fromage', 'dessert']


### Suppression d'élément(s) : l'instruction **del**

L'instruction **del** permet de supprimer un élément ou une sous-liste dans une liste existante. Deux syntaxes sont possibles&nbsp;:

In [None]:
del id_liste[pos]

qui va supprimer de la liste `id_liste` l'élément situé à la position `pos`;

In [None]:
del id_liste[pos_deb:pos_fin]

qui va supprimer de la liste `id_liste` la sous-chaîne comprise entre les positions `pos_deb` et `pos_fin-1`.

In [15]:
print(f"Liste bazar avant première suppression : {bazar}")
del bazar[2]
print(f"Liste bazar après première suppression : {bazar}")
del bazar[1:3]
print(f"Liste bazar après deuxième suppression : {bazar}")

Liste bazar avant première suppression : [3.1416, 28, 'bonjour', 'fromage', 'dessert']
Liste bazar après première suppression : [3.1416, 28, 'fromage', 'dessert']
Liste bazar après deuxième suppression : [3.1416, 'dessert']


### Concaténation de listes : l'opérateur **+**

L'opérateur **+** permet de mettre bout à bout deux listes pour en construire une troisième. C'est ce qu'on appelle la **concaténation** de listes.

In [16]:
debut = [1, 2]
fin = [3, 4]
total = debut + fin
print(total)

[1, 2, 3, 4]


Il permet également d'ajouter un nouvel élément soit en début de liste&nbsp;:

In [None]:
id_liste = [nouveau] + id_liste

soit en fin de liste&nbsp;:

In [None]:
id_liste = id_liste + [nouveau]

ou bien&nbsp;:

In [None]:
id_liste += [nouveau]

In [17]:
liste = ['B', 'C']
liste = liste + ['D']
liste = ['A'] + liste
print(liste)

['A', 'B', 'C', 'D']


### Méthodes usuelles sur les listes

En Python, une liste est un objet sur lequel on peut appliquer des **méthodes** (la programmation objet sera abordée en licence 2). Une méthode est une sorte de fonction ou d'instruction qui va agir sur un objet et retourner ou pas une valeur en résultat. La syntaxe générale d'application d'une méthode à un objet est la suivante&nbsp;:

In [None]:
objet.methode(paramètres)

où&nbsp;:

* `objet` est l'objet ou la variable référençant l'objet sur lequel s'applique la méthode
* `methode` est le nom de la méthode appliquée
* `paramètres` est l'énumération des valeurs ou variables passées en paramètres de la méthode

#### L'ajout d'un élément en fin de liste : la méthode **append()**

La méthode **append()** prend en paramètre l'élément à ajouter à la liste. Elle ajoute cette élément à la fin de la liste et ne retourne aucune valeur. Elle peut donc être utilisée comme une instruction.

In [18]:
liste = ['A', 'B']
liste.append('C')
print(liste)

['A', 'B', 'C']


#### L'extension d'une liste : la méthode **extend()**

La méthode **append()** s'applique à une liste initiale et prend en paramètre une seconde liste. Elle ajoute cette seconde liste à la fin de la liste initiale (ce qui revient à concaténer les deux listes). Elle ne retourne aucune valeur et peut être utilisée comme une instruction.

In [19]:
liste = ['A', 'B']
liste.extend(['C', 'D'])
print(liste)

['A', 'B', 'C', 'D']


#### Insertion d'un élément à une position précise dans une liste : la méthode **insert()**

La méthode **insert()** prend en paramètres&nbsp;:

* un nombre entier correspondant à une position dans la liste
* un élément à ajouter à la liste

et ajoute l'élément dans la liste, à la position indiquée en paramètre. Elle ne retourne aucune valeur et peut être utilisée comme une instruction.
Si la position est égale à 0, l'insertion de l'élément se fait au début de la liste. Si la position correspond à la longueur de la liste, l'insertion s'effectue en fin de liste.

In [21]:
liste = ['B', 'D']
liste.insert(0, 'A')
print(liste)
liste.insert(2, 'C')
print(liste)
liste.insert(len(liste), 'E')
print(liste)

['A', 'B', 'D']
['A', 'B', 'C', 'D']
['A', 'B', 'C', 'D', 'E']


#### Suppression d'un élément dans une liste : la méthode **remove()**

La méthode **remove()** prend en paramètre l'élément à supprimer de la liste et supprime de la liste la première occurrence de cet élément. Elle ne retourne aucune valeur et peut être utilisée comme une instruction. Si l'élément passé en paramètre ne figure pas dans la liste, une exception est levée et un message d'erreur s'affiche. La notion d'exception sera vue en licence 2.

In [24]:
liste = ['A', 'B', 'C', 'B', 'D', 'B']
liste.remove('B')
print(liste)
liste.remove('C')
print(liste)
liste.remove('C')

['A', 'C', 'B', 'D', 'B']
['A', 'B', 'D', 'B']


ValueError: list.remove(x): x not in list

#### Position d'un élément dans une liste : la méthode **index()**

La méthode **index()** prend en paramètre un élément et retourne la position de la première occurrence de cet élément dans la liste. Une exception est levée si l'élément ne figure pas dans la liste.

In [25]:
liste = ['A', 'B', 'C', 'B', 'D', 'B']
print(liste.index('C'))
print(liste.index('B'))
print(liste.index('E'))

2
1


ValueError: 'E' is not in list

#### Comptage du nombre d'occurrences d'un élément : la méthode **count()**

La méthode **count()** prend en paramètre un élément et retourne le nombre d'occurrences de cet élément dans la liste.

In [26]:
liste = ['A', 'B', 'C', 'B', 'D', 'B']
nb_C = liste.count('C')
nb_B = liste.count('B')
nb_E = liste.count('E')
print(f"Dans la liste, la lettre C apparaît {nb_C} fois, la lettre B {nb_B} fois et la lettre E {nb_E} fois.")

Dans la liste, la lettre C apparaît 1 fois, la lettre B 3 fois et la lettre E 0 fois.


#### Tri des éléments d'une liste : la méthode **sort()**

#### Inversion d'une liste : la méthode **reverse()**

### Test d'appartenance à une liste

### Parcours d'une liste