# Cours 2: Les structures de données en Python

## Introduction

Les structures de données sont des outils essentiels en programmation. Elles permettent de stocker et d’organiser l’information efficacement. Aujourd’hui, nous allons découvrir trois structures de données fondamentales en Python :

- **Les listes** (`list`), qui permettent de stocker plusieurs valeurs et de les modifier.
- **Les tuples** (`tuple`), qui ressemblent aux listes mais sont immuables.
- **Les ensembles** (`set`), qui stockent des éléments uniques sans ordre particulier.
- **Les dictionnaires** (`dict`), qui collectionnent des paires clé-valeur, permettant une recherche rapide. Nous ne l'abordons pas dans le cours d'aujourd'hui.

Ces structures sont très utilisées en sciences humaines pour stocker et manipuler des données textuelles, des résultats d’enquête ou des collections d’éléments.


## Les listes (`list`)

Une liste est une **collection ordonnée et modifiable** d’éléments, comme une liste de cours, une liste de pays ou une série de nombres. On la définit avec des crochets `[]` et on peut y stocker des nombres, des chaînes de caractères ou d'autres objets. Comme nous l’avons vu dans le cours précédent, il est nécessaire de leur attribuer un nom de variable au moment de leur création. Ce nom doit être explicite et représentatif du contenu de la liste afin d’en faciliter la compréhension et l’utilisation dans le code.

Nous allons créer ici la liste de tous les premiers ministres belges depuis 1830:

In [1]:
prime_ministers = [
    "Étienne de Gerlache", "Joseph Lebeau", "Félix de Mûelenaere", "Albert Goblet d'Alviella", "Barthélemy de Theux de Meylandt",
    "Joseph Lebeau", "Jean-Baptiste Nothomb", "Sylvain Van de Weyer", "Barthélemy de Theux de Meylandt", "Charles Rogier", "Henri de Brouckère", 
    "Pierre De Decker", "Charles Rogier", "Walthère Frère-Orban", "Jules d'Anethan", "Barthélemy de Theux de Meylandt", "Jules Malou", "Walthère Frère-Orban",
    "Jules Malou", "Auguste Beernaert", "Jules de Burlet", "Paul de Smet de Naeyer", "Jules Vandenpeereboom", "Paul de Smet de Naeyer", "Jules de Trooz",
    "François Schollaert", "Charles de Broqueville", "Gérard Cooreman", "Léon Delacroix", "Henry Carton de Wiart", "Georges Theunis", "Aloys Van de Vyvere",
    "Prosper Poullet", "Henri Jaspar", "Jules Renkin", "Charles de Broqueville", "Georges Theunis", "Paul Van Zeeland", "Paul-Émile Janson", "Paul-Henri Spaak",
    "Hubert Pierlot", "Achille van Acker", "Paul-Henri Spaak", "Achille van Acker", "Camille Huysmans", "Paul-Henri Spaak", "Gaston Eyskens", "Jean Duvieusart",
    "Joseph Pholien", "Jean Van Houtte", "Achille van Acker", "Gaston Eyskens", "Théo Lefèvre", "Pierre Harmel", "Paul Vanden Boeynants", "Gaston Eyskens",
    "Edmond Leburton", "Leo Tindemans", "Paul Vanden Boeynants", "Wilfried Martens", "Mark Eyskens", "Wilfried Martens", "Jean-Luc Dehaene", "Guy Verhofstadt",
    "Yves Leterme", "Herman Van Rompuy", "Yves Leterme", "Elio Di Rupo", "Charles Michel", "Sophie Wilmès", "Alexander De Croo", "Bart De Wever"
]

### Accéder aux éléments d’une liste

Puisque les listes sont ordonnées, il est possible de récupérer un élément en utilisant sa position dans la liste. Attention, en Python, la numérotation commence à `0`, ce qui peut sembler contre-intuitif au début.

Par exemple, pour obtenir le premier Premier Ministre belge dans notre liste, on procède de la façon suivante :

In [None]:
print(prime_ministers[0])

Pour récupérer le 5e Premier Ministre dans la liste, il faut se rappeler que les indices en Python commencent à 0 et non à 1.

Cela signifie que :
- Le 1er élément est à l’index `0`,
- Le 2e élément est à l’index `1`,
- Le 3e élément est à l’index `2`,
- ...et ainsi de suite.

Sur cette base-là, modifiez le code ci-dessous pour obtenir le 21e Premier Ministre belge

In [None]:
print(prime_ministers[0])

On peut également _lire_ la liste à l'envers. L'indice `-1` permet de récupérer le dernier élément de la liste, l'indice `-2` l'avant-dernier, et ainsi de suite.

En suivant cette logique, modifiez le code ci-dessous afin de récupérer le 5ᵉ Premier Ministre en partant de la fin.

In [None]:
print(prime_ministers[-1])

Il est également possible d’extraire une portion de la liste en utilisant la notation de **slicing**, qui permet de spécifier une plage d’indices. Par exemple, pour obtenir les 2e à 17e Premiers Ministres, on peut utiliser cette méthode:

In [None]:
print(prime_ministers[1:5])

Dans le slicing, l'indice de début (avant les `:`) est compris, tandis que l'indice de fin (après les `:`) est exclus. Il est aussi possible d’utiliser des indices négatifs pour sélectionner des éléments en partant de la fin de la liste. Dans ce cas, l'indice de début (à droite des `:`) est inclus tandis que l'indice de fin (à gauche des  `:`) est exclus.

Sur la base de ce qu'on a vu plus haut, modifiez le code ci-dessous pour récupérer les 5 derniers Premiers Ministres belge:

In [None]:
print(prime_ministers[0:5])

Lorsqu’on utilise le **slicing** sans préciser l’un des indices, Python applique des valeurs par défaut :  

- Si **l’indice de début** est omis (`liste[:n]`), la sélection commence automatiquement **depuis le premier élément**.  
- Si **l’indice de fin** est omis (`liste[n:]`), la sélection s’étend **jusqu’au dernier élément inclus**.  
- Si **les deux indices** sont omis (`liste[:]`), cela crée une **copie complète** de la liste.  

Cette notation est particulièrement utile pour récupérer une portion flexible de la liste sans avoir à compter précisément les indices.

Modifiez le code ci-dessous pour afficher les 10 premiers et les 10 derniers Premiers Ministres:

In [None]:
# Les 10 premiers
print(prime_ministers[0:10])
# Les 10 derniers
print(prime_ministers[-11:-1])

### Opérations sur les listes

En plus d'être ordonnées, les listes sont également modifiables. Les principales opérations sont:

- `append("xxx")`: ajouter un élément `"xxx"` en fin de liste
- `remove("xxx)`: supprimer la première occurence de la valeur `"xxx"`
- `pop(i)`: supprimer l'élément à de la liste qui se trouve à l'indice `i`
- `reverse()`: inverser l'ordre des éléments de la liste
- `sort()`: trier la liste dans l'ordre croissant
- `sort(reverse=True)`: trier la liste dans l'ordre décroissant
- On peut également modifier un élément de la liste en changeant sa valeur.
- `in` permet de vérifier si un élément est dans la liste ou non. Il renvoie une valeur booléenne (`True` ou `False`)

Utilisons toutes ces opérations séquentiellement dans les blocs de code suivants en se focalisant sur une copie de la liste des premiers ministres qui ne contient que les 10 derniers:

In [None]:
# Extraction des 10 derniers premiers ministres et affichage de la liste
last_prime_ministers = prime_ministers[-10:]
print(last_prime_ministers)

In [None]:
# Ajout d'un Premier Ministre à la liste
last_prime_ministers.append("Paul Van Haver")
print(last_prime_ministers)

In [None]:
# Suppression de l'élément ajouté
last_prime_ministers.remove("Paul Van Haver")
print(last_prime_ministers)

In [None]:
# Suppression du premier élément de la liste
last_prime_ministers.pop(0)
print(last_prime_ministers)



In [None]:
# Supression du dernier élément de la liste
last_prime_ministers.pop(-1)
print(last_prime_ministers)

In [None]:
# Inversion de la liste
last_prime_ministers.reverse()
print(last_prime_ministers)

In [None]:
# Affichage dans l'ordre alphabétique
last_prime_ministers.sort()
print(last_prime_ministers)

# Et dans l'ordre alphabétique inverse
last_prime_ministers.sort(reverse=True)
print(last_prime_ministers)

In [None]:
# Changer le nom du premier élément de la liste par ses initiales
last_prime_ministers[0] = "YL"
print(last_prime_ministers)

In [None]:
# Vérifier si "Guy Verhofstadt" est dans la liste
print("Guy Verhofstadt" in last_prime_ministers)

# Vérifie si "Paul Van Haver" est dans la liste
print("Paul Van Haver" in last_prime_ministers)

### Un peu de maths

Il est également possible de réaliser des opérations mathématiques simples sur les listes:

- `len()` renvoie la taille de la liste
- `sum()` renvoie la somme des éléments
- `min()` renvoie la valeur minimale de la liste
- `max()` renvoie la valeur maximale de la liste

Imaginons que nous avons une liste contenant la population (en millions) de différents pays européens :

In [None]:
populations = [67, 83, 60, 47, 11, 38]  # France, Allemagne, Italie, Espagne, Belgique, Pologne

# Taille de la liste (nombre de pays étudiés)
print(f"Nombre de pays étudiés : {len(populations)}")

# Population totale
print(f"Population totale : {sum(populations)} millions d'habitants")

# Pays le plus peuplé
print(f"Population maximale : {max(populations)} millions d'habitants")

# Pays le moins peuplé
print(f"Population minimale : {min(populations)} millions d'habitants")

## Les tuples (`tuple`)

Un tuple est une **collection ordonnée mais immuable**. Une fois défini, on ne peut plus modifier son contenu. 

On le définit avec des crochets `()` et, comme dans les listes, on peut y stocker des nombres, des chaînes de caractères ou d'autres objets.

Il est intéressant de les utiliser quand on veut protéger des données contre des modifications accidentelles. On peut par exemple stocker les informations d'une capitale européenne en référençant son nom, sa latitude et sa longitude:


In [None]:
# Création d'un tuple
city = ("Bruxelles", 50.499527, 4.475403)

Bien qu’il soit possible d’accéder aux éléments d’un tuple par leur indice et d’en connaître la taille, toute tentative de modification entraînera une erreur:

In [None]:
# Ces opérations fonctionnent
print(city[0])
print(len(city))

In [None]:
# Ces opérations ne fonctionnent pas
city.sort()
city.reverse()
city[0] = "Paris"

Il est intéressant aussi de combiner les deux types de structures de données. On peut par exemple stocker les informations de capitales européennes dans des listes de tuples !

In [None]:
cities = [
    ("Bruxelles", 50.499527, 4.475403),
    ("Paris", 48.856578, 2.351828),
    ("Berlin", 52.524370, 13.410530),
    ("Madrid", 40.416775, -3.703790),
    ("Rome", 41.902783, 12.496366),
    ("Varsovie", 52.229676, 21.012229)
]

# Afficher le premier élément de la liste et son type
print(cities[0])
print(type(cities[0]))


**Exercice**: Ajoutez les informations de Londres à la liste et affiche la dernière capitale de la liste 

In [None]:
# Votre code ici

## Les ensembles (`set`)

Un ensemble (`set`) est une collection **non ordonnée** d’éléments **uniques**. Il est utile pour:
- Eliminer les doublons dans une liste.
- Vérifier si un élément appartient à un ensemble. Cette opération est beaucoup plus rapide que dans une liste, car l’opération bénéficie d’une complexité optimisée, rendant la recherche quasi-instantanée.
- Comparer des groupes d’éléments, comme en théorie des ensembles (union, intersection...)

On le définit avec des crochets `{}`

Créons un ensemble contenant les noms de toutes les provinces belges. Comme pour les listes et les tuples, nous pouvons ensuite afficher sa taille.

In [None]:
# Création d'un ensemble des provinces belges
provinces = {"Anvers", "Brabant flamand", "Brabant wallon", "Flandre-Occidentale", "Flandre-Orientale", "Hainaut", "Liège", "Limbourg", "Luxembourg", "Namur"}
print(provinces)
print(type(provinces))
print(len(provinces))

Les ensembles sont **modifiables**. Il est donc possible d'y ajouter ou d'y enlever des éléments

In [None]:
# Ajout d'un élément
provinces.add("Bruxelles")
print(provinces)
print(len(provinces))

# Suppression d'un élément
provinces.remove("Bruxelles")
print(len(provinces))

Les ensembles étant **non-ordonnées**, il n'est par contre pas possible d'afficher un élément selon sa position ou de trier les éléments: 

In [None]:
print(provinces[0])

Une utilisation courante des ensembles consiste à extraire les **éléments uniques** d’une liste. Pour cela, il suffit de convertir (caster) la liste en set, ce qui élimine automatiquement les doublons.

Par exemple, en appliquant cette méthode à la liste des Premiers Ministres belges définie précédemment, on peut facilement déterminer le **nombre de personnes distinctes** ayant occupé cette fonction.

In [None]:
# Affichons d'abord le nombre de premiers ministres de notre liste de base
print(len(prime_ministers))

In [None]:
# Transformons ensuite la liste en un ensemble et affichons le nombre d'éléments
prime_ministers_set = set(prime_ministers)
print(len(prime_ministers_set))

Comme mentionné précédemment, les opérations de recherche dans un ensemble sont bien plus rapides que dans une liste.

- Dans une liste, Python doit parcourir tous les éléments un par un jusqu’à trouver une correspondance (ou arriver à la fin si l’élément n’est pas présent). Cette opération a une complexité de `O(n)` (`n` corresponsant à la taille de la liste). Cela signifie qu’elle devient plus lente si la liste est longue.
- Dans un ensemble, grâce à l’optimisation des tables de hachage, la recherche se fait en temps quasi constant (`O(1)` en moyenne), ce qui la rend beaucoup plus rapide, même avec un grand nombre d’éléments.

Lorsqu’on doit vérifier souvent la présence d’un élément dans une collection de données, un ensemble est donc bien plus efficace qu’une liste.

Faisons la comparaison ici en recherchant `Sophie Wilmès` dans la liste et dans l'ensemble des premiers ministres et en calculant le temps d'exécution des deux opérations.


In [None]:
import time

# Recherche de "Sophie Wilmès" dans la liste
start = time.perf_counter()
"Sophie Wilmès" in prime_ministers
end = time.perf_counter()
print(f"Temps d'exécution : {end - start:.6f} secondes")

# Recherche de "Sophie Wilmès" dans l'ensemble
start = time.perf_counter()
"Sophie Wilmès" in prime_ministers_set
end = time.perf_counter()

print(f"Temps d'exécution : {end - start:.6f} secondes")

### Opérations logiques

Les sets permettent de comparer des groupes d’éléments, comme en théorie des ensembles.

On peut par exemple comparer les thèmes saillants chez deux philosophes en utilisant deux ensembles:

In [26]:
rousseau = {"nature", "société", "contrat", "homme", "égalité", "morale"}
voltaire = {"raison", "liberté", "contrat", "morale", "tolérance", "homme"}

**Intersection**: concepts communs:

In [None]:
print(rousseau & voltaire)
# Ou: rousseau.intersection(voltaire)

**Union**: tous les concepts ensemble:

In [None]:
print(rousseau | voltaire)
# Ou: rousseau.union(voltaire)


**Différence**: les concepts utilisés uniquement par un des auteurs

In [None]:
print(rousseau - voltaire)
# Ou print(rousseau.difference(voltaire))

**Différence symétrique**: mots mentionnés par l’un ou l’autre, mais pas par les deux


In [None]:
print(rousseau ^ voltaire)
#Ou print(rousseau.symmetric_difference(voltaire))

## Conclusion

Les listes, tuples et ensembles sont des structures de données fondamentales en Python :

- **Les listes** sont modifiables et ordonnées.
- **Les tuples** sont ordonnés mais immuables.
- **Les ensembles** stockent des éléments uniques et ne garantissent pas l’ordre.

La tableau ci-dessous récapitule ce que nous avons vu dans ce cours:

| Caractéristique       | Listes (`list`)            | Tuples (`tuple`)           | Ensembles (`set`)         |
|-----------------------|---------------------------|----------------------------|---------------------------|
| **Définition**        | `[]` crochets             | `()` parenthèses           | `{}` accolades           |
| **Ordre préservé**    | ✅ Oui                     | ✅ Oui                      | ❌ Non                    |
| **Modifiable (mutable)** | ✅ Oui                   | ❌ Non                      | ✅ Oui                    |
| **Éléments dupliqués** | ✅ Autorisés              | ✅ Autorisés               | ❌ Uniques seulement      |
| **Accès par index**   | ✅ Oui (`liste[i]`)       | ✅ Oui (`tuple[i]`)       | ❌ Non (pas d'indexation) |
| **Ajout d'éléments**  | `.append()` / `.insert()` | ❌ Impossible              | `.add()`                 |
| **Suppression**       | `.remove()`, `.pop()`     | ❌ Impossible              | `.remove()` |
| **Tri possible**      | ✅ `.sort()`              | ❌ Non modifiable          | ❌ Non applicable         |
| **Utilisation typique** | Données modifiables     | Données fixes/protégées    | Unicité, ensembles mathématiques |

Nous verrons lors du prochain cours comment les parcourir efficacement avec des **boucles**, et comment prendre des décisions avec des **conditions**.

En attendant, essayez de réfléchir à des cas où ces structures pourraient vous être utiles dans tes études ou ton travail !
