# II-3. Cours Python : Les collections
> Python - Chapter2 - LESSON 3.

- toc: false 
- badges: true
- comments: false
- categories: [Python-Novice, Python-Collections]
- layout: post
- permalink: /python/chapter/2/lesson/3/

-Python
    -Les collections
        -lesson = Les collections

Nous avons déjà rencontré quelques types Python simples comme les nombres (`int`, `float`), les strings (`str`) et les booléens (`bool`). Nous allons maintenant voir comment regrouper plusieurs valeurs dans une collection, comme une liste de nombres ou un dictionnaire que nous pouvons utiliser pour stocker et récupérer des paires clé-valeur. De nombreuses collections utiles sont des types intégrés dans Python, et nous les rencontrerons assez souvent.

## 1. Les listes (`list`)


Le type de liste en Python est appelé `list`. Nous pouvons l'utiliser pour stocker plusieurs valeurs et y accéder séquentiellement ou par leur position (leur index). Les listes sont définis avec un ensemble de valeurs séparées par des virgules entre crochets (`[` et `]`) :

In [1]:


# une liste vide
my_list = []
print(type(my_list))

<class 'list'>


In [2]:
one_variable = 2
another_variable = "4 strings"
third_variable = 3.9
# une liste de variables définies ailleurs dans le code
things = [
    one_variable,
    another_variable,
    third_variable, # Cette virgule peut être utilisée en Python 3
]

In [3]:

print(things)

[2, '4 strings', 3.9]


Comme vous pouvez le voir, nous avons utilisé des noms au pluriel pour nommer la plupart de nos variables de liste. Il s'agit d'une convention courante et il est utile de la suivre dans la plupart des cas.

Pour accéder à un élément de la liste, nous utilisons l'identifiant de la liste suivi de l'index entre crochets. Les index sont des entiers qui commencent à zéro :

In [4]:
print(animals[0]) # cat
print(numbers[1]) # 7



NameError: name 'animals' is not defined

In [None]:
# Ceci va nous donner une erreur,puisque la liste contient uniquement 4 elements
print(animals[6])

On peut aussi retrouver des éléments en partant de la fin :

In [None]:
print(animals[-1]) # Le dernier élément de la liste
print(numbers[-2]) # L'avant dernier élément de la liste

Nous pouvons aussi extraire un sous-ensemble d'une liste (qui sera elle-même une liste) à l'aide d'un `slice`. Cela utilise presque la même syntaxe que pour accéder à un seul élément, mais au lieu de spécifier un seul index entre les crochets, nous devons spécifier une limite supérieure et inférieure. Notez que notre sous-liste inclura l'élément à la limite inférieure, mais exclura l'élément à la limite supérieure :

In [None]:
# une liste de strings
animals = ['cat', 'dog', 'fish', 'bison', 'lion']

# une liste d'entiers
numbers = [1, 7, 34, 20, 12]

In [None]:
print(animals[1:4]) # ['dog', 'fish'[

In [None]:
print(animals[1:-1]) # ['dog', 'fish']

Si l'une des limites est l'une des extrémités de la liste, nous pouvons la laisser de côté.

In [None]:
print(animals[2:]) # ['fish', 'bison']

In [None]:

print(animals[-:]) # ['cat', 'dog']
print(animals[:]) # Une copie de la liste entière

Nous pouvons même inclure un troisième paramètre pour spécifier la taille du pas :

In [None]:

print(animals[::3]) # ['cat', 'fish']

Les listes sont mutables, nous pouvons modifier des éléments, en ajouter ou en supprimer. Une liste changera de taille automatiquement lorsque nous ajoutons ou supprimons des éléments :

In [None]:
print(type(animals))

In [None]:
print(animals)
# Assigner une nouvelle valeur à un élément de la liste
animals[3] = "hamster"

# Ajout d'un élément à la fin de la liste
animals.append("squirrel")

# Suppression d'un élément de la liste
del animals[2]
print(animals)


Comme les `list` sont mutables, nous pouvons modifier une variable d'une `list` sans lui affecter une valeur complètement nouvelle. N'oubliez pas que si nous attribuons la même valeur de `list` à deux variables, toute modification faite à l'une des deux variables sera refleté sur l'autre :

In [None]:
animals = ['cat', 'dog', 'goldfish', 'canary']
pets = animals # Les deux variables référencent la même liste

animals.append('aardvark')
print(pets) # pets est toujours la même liste que animals

animals = ['rat', 'gerbil', 'hamster'] # Affectation d'un nouvelle liste de valeurs à animals
print(pets) # pets référence toujours l'ancienne liste

pets = animals[:] # affectation par *copy* des valeurs de la liste à pets
animals.append('aardvark')
print(pets) # pets contient toujours les mêmes valeurs affectées initialement

Executez ce code sur pythontutor.com et regardez l'allocation de mémoire effectuée par l'interpréteur

On peut mélanger les types de valeurs que l'on stocke dans une liste :

In [None]:
my_list = ['cat', 12, 35.8]

Comment vérifier si une liste contient une valeur particulière ? Nous utilisons les opérateurs `in` ou `not in` : 

In [None]:
numbers = [34, 67, 12, 29]
number = 57

if number not in numbers:
    print("%d is not in the list!" % number)

number = 90
if number not in numbers:
    print("%d is not in the list!" % number)


### Les fonctions des listes


Il existe des fonctions `built-in` que nous pouvons utiliser sur les listes et autres séquences :

In [None]:
# la taille d'une liste
len(animals)

# la somme d'une liste d'entiers
sum(numbers)

# Est ce qu'une des valeurs de la liste est True ?
any([1,0,1,0,1])

# Est ce que TOUTES les valeurs de la liste sont True ?
all([1,0,1,0,1])

In [None]:
# Est ce qu'une des valeurs de la liste est True ?
print(any([1,0,1,0,1]))

# Est ce que TOUTES les valeurs de la liste sont True ?
print(all([1,"True",1,0,1]))

In [None]:
print(numbers)
print(sum(numbers))

In [None]:
nums = [1, "1", 1]
print(sum(nums))

L'objet `list` possède lui aussi de nombreuses fonctions utiles :

In [None]:
numbers = [1, 2, 3, 4, 5, 5]


# Compter le nombre d'éléments dans la liste
print(numbers.count(5))

In [None]:
animals

In [None]:
animals.index('fisfffh')

In [None]:
print(numbers)
a = numbers.pop(0)
print(numbers)
print(a)

In [None]:

# ajouter plusieurs valeurs (en une fois) à la fin
numbers.extend([56, 2, 12])

# Trouver l'index d'une valeur de la liste
numbers.index(3)
# Si la valeur est présente plusieurs fois, on obtient le premier index
numbers.index(2)
# Si la valeur n'est pas présente dans la liste, l'erreur ValueError est retournée !
numbers.index(42)

# insertion d'une valeur à un index donné
numbers.insert(0, 45) 

# supprimer un élément de la liste
my_number = numbers.pop(0)

# supprimer un élément de la liste en spécifiant sa valeur
numbers.remove(12)
# Si la valeur est présente plsuieurs fois, Seulement la première occurance est supprimée
numbers.remove(5)

Nous pouvons aussi trier les listes de plusieurs façons :

In [None]:
numbers = [3, 2, 4, 1]

# Ces fonctions retournes une copie modifiéee
print(sorted(numbers))
print(list(reversed(numbers)))

# La première liste reste inchangée
print(numbers)

# Modification sur place
numbers.sort()
numbers.reverse()

print(numbers)

In [None]:
numbers = [3, 2, 4, 1]
list(reversed(sorted(numbers)))

### Les opérateurs arithmétiques

Nous pouvons combiner des listes et les étendre grace aux opérateurs arithmétiques `+` et `*` :

In [None]:
print([1, 2, 3] - [2, 3])

In [None]:
# Concaténation de deux listes
print([1, 2, 3] + [4, 5, 6])

# on peut concaténer une liste avec elle-même en la multipliant par un entier (Pythonic style)
print([1, 2, 3] * 3)

# tous les opérateurs arithmétiques ne peuvent pas être utilisés sur les listes -- cette instruction nous donnera une erreur !
print([1, 2, 3] - [2, 3])

## 2. Les tuples (`tuple`)

Python a un autre type de séquence appelé `tuple`. Les tuples sont similaires aux listes, mais ils sont immuables. Les tuples sont définis avec un ensemble de valeurs séparées par des virgules entre parenthèses (`(` et `)`) :

In [None]:
WEEKDAYS = ('Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday')

Nous pouvons utiliser des tuples de la même manière que nous utilisons des listes, sauf que nous ne pouvons pas les modifier :

In [None]:
animals = ('cat', 'dog', 'fish')

# an empty tuple
my_tuple = ()

# we can access a single element
print(animals[0])

# we can get a slice
print(animals[1:]) # note that our slice will be a new tuple, not a list

# we can count values or look up an index
animals.count('cat')
animals.index('cat')

# ... but this is not allowed:
animals.append('canary')
animal[1] = 'gerbil'

A quoi servent les tuples ? Nous pouvons les utiliser pour créer une séquence de valeurs que nous ne voulons pas modifier.

## 3. Les sets (`set`)


Il existe encore un autre type de séquence appelé `set`. Un `set` est une collection d'éléments uniques. Si nous ajoutons plusieurs copies du même élément à un `set`, les doublons seront éliminés et il nous restera un de chaque élément. Les sets sont définis avec un ensemble de valeurs séparées par des virgules entre accolades (`{` et `}`) :

In [None]:
animals = {'cat', 'dog', 'goldfish', 'canary', 'cat'}
print(animals) # Ce set contient un seul élément 'cat'

Nous pouvons faire plusieurs opérations sur les sets :

In [None]:
even_numbers = {2, 4, 6, 8, 10}
big_numbers = {6, 7, 8, 9, 10}

# soustraction
print(big_numbers - even_numbers)

# union
print(big_numbers | even_numbers)

# intersection
print(big_numbers & even_numbers)

# numbers which are big or even but not both
print(big_numbers ^ even_numbers)

In [None]:
print(big_numbers, even_numbers)
print(big_numbers ^ even_numbers)

Il est important de noter que contrairement aux listes et aux tuples, les sets ne sont pas ordonnés. Lorsque nous affichons un ensemble, l'ordre des éléments sera aléatoire. Nous pouvons toujours l'ordoner si besoin (cependant la fonction `sorted` nous renverra une liste):

In [None]:
print(animals)
print(sorted(animals))

Comment fait-on pour déclarer un `set` vide ? Nous devons utiliser la fonction `set`. Les dictionnaires, dont nous parlerons dans la section suivante, utilisaient des accolades avant que les ensembles ne les adoptent, donc un ensemble vide d'accolades est en fait un dictionnaire vide :

In [None]:
# dictionnaire vide
a = {}
l = []
t = ()
# set vide

b = set()

## 4. Les  `range`

Nous pouvons générer une séquence d'entier (appelé `range`) grace à la fonction `built-in` : `range`. Les `range` sont des générateurs, nous verrons ces derniers en détail dans la prochaine partie. Pour l'instant, nous avons juste besoin de savoir que les nombres de la plage sont générés un à un, et pas tous à la fois.
 
Dans les exemples ci-dessous, nous convertissons chaque `range` en `list` afin que tous les nombres soient générés et que nous puissions les afficher

In [None]:
print(list(range(1,10, 2)))

In [None]:
# affiche des entiers de 0 à 9
print(list(range(10)))

# affiche des entiers de 1 to 10
print(list(range(1, 11)))

# affiche les entiers impairs entre 1 et 10
print(list(range(1, 11, 2)))

Comme vous pouvez le voir, si nous passons un seul paramètre à la fonction range, il est utilisé comme borne supérieure. Si nous utilisons deux paramètres, le premier est la borne inférieure et le second est la borne supérieure. Si nous en utilisons trois, le troisième paramètre est la taille du pas. La limite inférieure par défaut est zéro et la taille de pas par défaut est un. Notez que la plage inclut la limite inférieure et exclut la limite supérieure.

## 5. Les dictionnaires `dict`

Le type de dictionnaire Python est appelé `dict`. Nous pouvons utiliser un dictionnaire pour stocker des paires clé-valeur. Les `dict` sont définis avec un ensemble de paires clé-valeur séparées par des virgules entre des accolades (`{` et `}`). Nous utilisons deux points pour séparer chaque clé de sa valeur. Nous accédons aux valeurs du dictionnaire de la même manière que les éléments de liste ou de tuple, mais nous utilisons des clés au lieu d'indices :

In [None]:
marbles = {"red": 34, "green": "string", "brown": 31, "yellow": 29}


In [None]:
print(marbles["greenn"])

In [None]:
marbles["brown"] = "test"

In [None]:
print(marbles)

In [None]:
marbles = {"red": 34, "green": 30, "brown": 31, "yellow": 29 }

personal_details = {
    "name": "Jane Doe",
    "age": 38,
}


print(personal_details["name"])

# Erreur de clé
print(marbles["blue"])

# Modification ou création de valeur
marbles["red"] += 3
personal_details["name"] = "Jane Q. Doe"

Les clés d'un dictionnaire n'ont pas besoin d'être des `string`, elles peuvent être de n'importe quel type immuable, y compris des nombres et même des tuples. Nous pouvons mélanger différents types de clés et différents types de valeurs dans un dictionnaire. Les clés sont uniques, si nous répétons une clé, nous écraserons l'ancienne valeur avec la nouvelle. Lorsque nous stockons une valeur dans un dictionnaire, la clé n'a pas besoin d'exister - elle sera créée automatiquement :

In [None]:
battleship_guesses = {
    (3, 4): False,
    (2, 6): True,
    (2, 5): True,
}

In [None]:
battleship_guesses = {
    (3, 4): False,
    (2, 6): True,
    (2, 5): True,
}

surnames = {}
surnames["John"] = "Smith"
surnames["John"] = "Doe"
print(surnames) # 

marbles = {"red": 34, "green": 30, "brown": 31, "yellow": 29 }
marbles["blue"] = 30 # this will work
marbles["purple"] += 2 # this will fail -- the increment operator needs an existing value to modify!


Voici quelques fonctions couramment utilisées pour les objets `dict` :

In [None]:
marbles = {"red": 34, "green": 30, "brown": 31, "yellow": 29 }

print(marbles.keys())
print(marbles.values())
print(marbles.items())

In [None]:
# Get a value by its key, or None if it doesn't exist
marbles.get("orange")
# We can specify a different default
marbles.get("orange", 0)

# Add several items to the dictionary at once
marbles.update({"orange": 34, "blue": 23, "purple": 36})

# All the keys in the dictionary
marbles.keys()
# All the values in the dictionary
marbles.values()
# All the items in the dictionary
marbles.items()

On peut vérifier si une clé est dans le dictionnaire en utilisant `in` et `not in` :

In [None]:
print(marbles)
#print(31 not in marbles)
print(31 in marbles.values())

In [None]:
print("purple" in marbles.keys())
print("white" not in marbles)

print(31 in marbles.values())

## 6. Converstion des collections


### Conversions implicites

Si nous essayons d'itérer sur une collection dans une boucle `for` (quelque chose dont nous discuterons dans le prochain chapitre), Python essaiera de la convertir en quelque chose que nous pouvons parcourir s'il sait comment le faire. Par exemple, les `dict` que nous avons vues ci-dessus ne sont pas réellement des itérateurs, mais Python sait comment les transformer en itérateurs, nous pouvons donc les utiliser dans une boucle `for` sans avoir à les convertir nous-mêmes.

Parfois, l'itérateur que nous obtenons par défaut peut ne pas être ce à quoi nous nous attendions, si nous parcourons un dictionnaire dans une boucle `for`, nous parcourrons les clés. Si ce que nous voulons réellement faire est d'itérer sur les valeurs, ou les paires clé et valeur, nous devrons le spécifier nous-mêmes en utilisant les fonctions `values` et `items`.


### Conversions explicites

Nous pouvons convertir les différents types de séquences en utilisant les fonctions `built-in` (correspondant au type) pour convertir les séquences dans les types souhaités :

In [None]:
animals = ['cat', 'dog', 'goldfish', 'canary', 'cat']
animals_set = set(animals)
animals_unique_list = list(animals_set)
animals_unique_tuple = tuple(animals_unique_list)


marbles = {"red": 34, "green": 30, "brown": 31, "yellow": 29 }
colours = list(marbles) # the keys will be used by default
counts = tuple(marbles.values()) # but we can use a view to get the values
marbles_set = set(marbles.items()) # or the key-value pairs


# Python doesn't know how to convert this into a dictionary
dict([1, 2, 3, 4])

# but this will work
dict([(1, 2), (3, 4)])

In [None]:
dict([(1, 2), (3, 4)])

## 7. Les `string` sont des séquences

Les  `string` sont également une sorte de type de séquence. Ce sont des séquences de caractères et partagent certaines propriétés avec d'autres séquences. Par exemple, nous pouvons trouver la longueur d'une `string` ou l'index d'un caractère dans la `string`, et nous pouvons accéder à des éléments individuels de la `string` ou des `slice` :

In [None]:
s = "abracadabra"

print(len(s))
print(s.index("a"))
print(s[0])
print(s[3:11:3])
print('a' in 'abcd') # True

In [None]:
print('montpellier' in 'montpellier est la meilleure ville de france') # also True

N'oubliez pas que les chaînes sont immuables, la modification des caractères sur place n'est pas autorisée :

In [None]:
# this will give us an error
s[0] = "b"

Les opérateurs `in` et `not in` ont un comportement spécial lorsqu'il est appliqué aux `string` : nous pouvons l'utiliser pour déterminer si une `string` contient un seul caractère en tant qu'élément, mais nous pouvons également l'utiliser pour vérifier si une `string` en contient une autre :

In [None]:
print('a' in 'abcd') # True
print('ab' in 'abcd') # also True

# this doesn't work for lists
print(['a', 'b'] in ['a', 'b', 'c', 'd']) # False

On peut convertir une `string` en `list` :

In [None]:
abc_list = list("abracadabra")
print(abc_list)

Et si on voulait convertir une liste de caractères en chaîne ? L'utilisation de la fonction `str` sur la liste nous donnera simplement une chaîne affichable de la liste, y compris les virgules, les guillemets et les crochets. Pour fusionner des séquence de caractères (ou de `string`) en une seule `string`, nous devons utiliser la fonction `join`.

Cette fonction, attachée à une `string` fonction comme tel :

In [None]:
a = "abcd"
a.replace('a', 'x')

In [None]:
print(a)

In [None]:
l = ['a', 'b', 'r', 'a', 'c', 'a', 'd', 'a', 'b', 'r', 'a']

s = "".join(l)
print(s)
animals = ('cat', 'dog', 'fish')

# a space-separated list
str_animals = "-".join(animals)
print(str_animals, type(str_animals))

In [None]:


# a comma-separated list
print(",".join(animals))

# a comma-separated list with spaces
print(", ".join(animals))

L'opposé de la fonction `join` est la fonction `split`. Nous pouvons diviser une `string` en une liste de `string` en utilisant la fonction `split`. S'il est appelé sans aucun paramètre, split divise une chaîne en mots, en utilisant n'importe quel nombre de caractères blancs consécutifs comme délimiteur. Nous pouvons utiliser des paramètres supplémentaires pour spécifier un délimiteur différent ainsi qu'une limite sur le nombre maximum de fractionnements à effectuer :

In [None]:
str_splt = "cat    dog fish\n".split()

In [None]:
print(str_splt)
print("cat|dog|fish".split("|"))
print("cat, dog, fish".split(", "))
print("cat, dog, fish".split(", ", 1))

## Les séquences à 2 dimensions

La plupart des séquences que nous avons vues jusqu'à présent étaient unidimensionnelles : chaque séquence est une ligne d'éléments. Que se passe-t-il si nous voulons utiliser une séquence pour représenter une structure de données bidimensionnelle, qui comporte à la fois des lignes et des colonnes ? La façon la plus simple de le faire est de créer une séquence dans laquelle chaque élément est également une séquence. Par exemple, nous pouvons créer une liste de listes :

In [None]:
my_table = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9],
    [10, 11, 12],
]

In [None]:
print(my_table[3][0])

La liste extérieure a quatre éléments, et chacun de ces éléments est une liste avec trois éléments (qui sont des nombres). Pour accéder à l'un de ces nombres, nous devons utiliser deux indices - un pour la liste externe et un pour la liste interne :

In [None]:
print(my_table[0][0])

# lists are mutable, so we can do this
my_table[0][0] = 42

orsque nous utilisons une séquence bidimensionnelle pour représenter des données tabulaires, chaque séquence interne aura la même longueur, car un tableau est rectangulaire, mais rien ne nous empêche de construire des séquences bidimensionnelles qui n'ont pas cette propriété :

In [None]:
my_2d_list = [
    [0],
    [1, 2, 3, 4],
    [5, 6],
]

On peut aussi faire une séquence tridimensionnelle en faisant une liste de listes de listes :

In [None]:
my_3d_list = [
    [[1, 2], [3, 4]],
    [[5, 6], [7, 8]],
]

print(my_3d_list[0][0][0])

### Exemple : emploi du temps

Si nous voulions faire une liste en deux dimensions pour représenter un emploi du temps hebdomadaire, nous pourrions soit avoir des jours comme liste extérieure et des créneaux horaires comme liste intérieure ou l'inverse - nous devrons nous rappeler quelle plage nous avons choisie pour être la lignes et dont les colonnes.

Supposons que nous voulions initialiser l'horaire avec une chaîne vide dans chaque plage horaire – disons que nous avons 24 plages horaires d'une heure chaque jour. Cela fait sept listes de 24 éléments chacune :

In [None]:
day = [""][:] * 24
timetable =  [day][:] * 7
timetable[0][15] = "meeting with Jane"
print(timetable)

Mais que se passe-t-il si nous répétons un jour sept fois pour faire une semaine ?

Voyons ce qui se passe lorsque nous essayons de programmer une réunion pour le lundi après-midi :

Chaque jour a la même réunion l'après-midi ! Qu'est ce qui s'est passé ? Lorsque nous avons multiplié notre liste de jours par sept, nous avons rempli notre emploi du temps avec le même objet `list`, répété sept fois. Tous les éléments de notre emploi du temps sont le même jour, donc peu importe celui que nous modifions, nous les modifions tous en même temps.

Pourquoi cela n'avait-il pas d'importance lorsque nous avons fait la liste des jours en multipliant la même chaîne vide 24 fois ? Parce que les `string` sont immuables. Nous ne pouvons modifier les valeurs des `string` dans la liste des jours qu'en leur attribuant de nouvelles valeurs, nous ne pouvons pas les modifier directement, donc peu importe qu'elles commencent toutes par le même objet de chaîne.
   
Ce que nous voulons en fait, ce sont sept copies d'une liste de jours dans notre emploi du temps :

In [None]:
timetable = [[""] * 24 for day in range(7)]