<a href="https://colab.research.google.com/github/EMSIMa/ADD3IIR/blob/main/04_Structures_de_donnees_predefinies.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Structures de données intégrées

Nous avons vu les types simples de Python : ``int``, ``float``, ``complex``, ``bool``, ``str``, et ainsi de suite.
Python possède également plusieurs types composés intégrés, qui agissent comme des conteneurs pour d'autres types.
Ces types composés sont les suivants :

| Nom du Type | Exemple                   |Description                            |
|-----------|---------------------------|---------------------------------------|
| ``list``  | ``[1, 2, 3]``             | Collection ordonnée                    |
| ``tuple`` | ``(1, 2, 3)``             | Collection ordonnée Immutable |
| ``dict``  | ``{'a':1, 'b':2, 'c':3}`` | Mappage non ordonné (clé, valeur) |
| ``set``   | ``{1, 2, 3}``             | Collection non ordonnée de valeurs uniques |

Comme vous pouvez le constater, les parenthèses rondes, carrées et bouclées ont des significations distinctes en ce qui concerne le type de collection produite.
Nous allons faire un tour rapide de ces structures de données.

## Listes
Les listes sont le type de collection de données *ordonnées* et *mutables* de base en Python.
Elles peuvent être définies avec des valeurs séparées par des virgules entre crochets ; par exemple, voici une liste des premiers nombres premiers :

In [None]:
L = [2, 3, 5, 7]

Les listes disposent d'un certain nombre de propriétés et de méthodes utiles.
Nous allons ici jeter un coup d'œil rapide à quelques-unes des plus courantes et des plus utiles d'entre elles :

In [None]:
# Length of a list
len(L)

4

In [None]:
# Append a value to the end
L.append(11)
L

[2, 3, 5, 7, 11]

In [None]:
# Addition concatenates lists
L + [13, 17, 19]

[2, 3, 5, 7, 11, 13, 17, 19]

In [None]:
# sort() method sorts in-place
L = [2, 5, 1, 6, 3, 4]
L.sort()
L

[1, 2, 3, 4, 5, 6]

En outre, il existe de nombreuses autres méthodes de liste prédéfinies ; elles sont décrites en détail dans la [documentation en ligne de Python](https://docs.python.org/3/tutorial/datastructures.html).

Bien que nous ayons montré des listes contenant des valeurs d'un seul type, l'une des caractéristiques puissantes des objets composés de Python est qu'ils peuvent contenir des objets de n'importe quel type, ou même un mélange de types. Par exemple :

In [None]:
L = [1, 'two', 3.14, [0, 3, 5]]

Cette flexibilité est une conséquence du système de type dynamique de Python.
Créer une telle séquence mixte dans un langage à typage statique comme C peut s'avérer un véritable casse-tête !
Nous voyons que les listes peuvent même contenir d'autres listes en tant qu'éléments.
Cette flexibilité des types est un élément essentiel qui rend le code Python relativement rapide et facile à écrire.

Jusqu'à présent, nous avons considéré les manipulations de listes dans leur ensemble ; un autre élément essentiel est l'accès à des éléments individuels.
En Python, cela se fait par *indexation* et *slicing*, que nous explorerons plus loin.

### Indexation et tranchage de listes
Python permet d'accéder aux éléments des types composés par *indexation* pour les éléments simples, et par *tranchage* pour les éléments multiples.
Comme nous le verrons, les deux sont indiqués par une syntaxe de crochets.
Supposons que nous revenions à notre liste des premiers nombres premiers :

In [None]:
L = [2, 3, 5, 7, 11]

Python utilise l'indexation *basée sur zéro*, ce qui nous permet d'accéder au premier et au deuxième élément en utilisant la syntaxe suivante :

In [None]:
L[0]

2

In [None]:
L[1]

3

Les éléments en fin de liste sont accessibles par des nombres négatifs, à partir de -1 :

In [None]:
L[-1]

11

In [None]:
L[-2]

7

Vous pouvez visualiser ce schéma d'indexation de la manière suivante :

![List Indexing Figure](https://github.com/jakevdp/WhirlwindTourOfPython/blob/master/fig/list-indexing.png?raw=1)

Ici, les valeurs de la liste sont représentées par des grands nombres dans les carrés ; les indices de la liste sont représentés par des petits nombres au-dessus et au-dessous.
Dans ce cas, ``L[2]`` renvoie ``5``, car c'est la valeur suivante à l'index ``2``.

Alors que l'*indexation* permet d'extraire une seule valeur de la liste, le *tranchage* permet d'accéder à plusieurs valeurs dans des sous-listes.
Il utilise deux points pour indiquer le point de départ (inclusif) et le point d'arrivée (non inclusif) de la sous-liste.
Par exemple, pour obtenir les trois premiers éléments de la liste, nous pouvons écrire :

In [None]:
L[0:3]

[2, 3, 5]

Remarquez où se trouvent ``0`` et ``3`` dans le diagramme précédent, et comment la tranche ne prend que les valeurs entre les indices.
Si nous omettons le premier indice, ``0`` est présumé, de sorte que nous pouvons écrire de façon équivalente :

In [None]:
L[:3]

[2, 3, 5]

De même, si nous omettons le dernier indice, il correspond par défaut à la longueur de la liste.
Ainsi, les trois derniers éléments peuvent être accédés comme suit :

In [None]:
L[-3:]

[5, 7, 11]

Enfin, il est possible de spécifier un troisième entier qui représente la taille du pas ; par exemple, pour sélectionner un élément sur deux de la liste, on peut écrire :

In [None]:
L[::2]  # equivalent to L[0:len(L):2]

[2, 5, 11]

Une version particulièrement utile de cette méthode consiste à spécifier un pas négatif, qui inversera le tableau :

In [None]:
L[::-1]

[11, 7, 5, 3, 2]

L'indexation et le tranchage peuvent tous deux être utilisés pour définir des éléments et y accéder.
La syntaxe est telle que l'on peut s'y attendre :

In [None]:
L[0] = 100
print(L)

[100, 3, 5, 7, 11]


In [None]:
L[1:3] = [55, 56]
print(L)

[100, 55, 56, 7, 11]


Une syntaxe de tranchage très similaire est également utilisée dans de nombreux packages orientés vers la science des données, y compris NumPy et Pandas (mentionnés dans l'introduction).

Maintenant que nous avons vu les listes Python et la manière d'accéder aux éléments dans les types composés ordonnés, examinons les trois autres types de données composés standard mentionnés précédemment.

## Tuples
Les tuples sont en de nombreux points similaires aux listes, mais ils sont définis avec des parenthèses plutôt qu'avec des crochets :

In [None]:
t = (1, 2, 3)

Ils peuvent également être définis sans aucune parenthèse :

In [None]:
t = 1, 2, 3
print(t)

(1, 2, 3)


Comme les listes, les tuples ont une longueur et les éléments individuels peuvent être extraits à l'aide de l'indexation par crochets :

In [None]:
len(t)

3

In [None]:
t[0]

1

La principale caractéristique des tuples est qu'ils sont *immuables* : cela signifie qu'une fois créés, leur taille et leur contenu ne peuvent pas être modifiés :

In [None]:
t[1] = 4

TypeError: 'tuple' object does not support item assignment

In [None]:
t.append(4)

AttributeError: 'tuple' object has no attribute 'append'

Les tuples sont souvent utilisés dans un programme Python ; un cas particulièrement courant est celui des fonctions qui ont plusieurs valeurs de retour.
Par exemple, la méthode ``as_integer_ratio()`` des objets à virgule flottante renvoie un numérateur et un dénominateur ; cette double valeur de retour se présente sous la forme d'un tuple :

In [None]:
x = 0.125
x.as_integer_ratio()

(1, 8)

Ces valeurs de retour multiples peuvent être attribuées individuellement comme suit :

In [None]:
numerator, denominator = x.as_integer_ratio()
print(numerator / denominator)

0.125


La logique d'indexation et de découpage décrite précédemment pour les listes fonctionne également pour les tuples, ainsi qu'un grand nombre d'autres méthodes.
Reportez-vous à la [documentation Python](https://docs.python.org/3/tutorial/datastructures.html) pour obtenir une liste plus complète de ces méthodes.

## Dictionnaires
Les dictionnaires sont des correspondances extrêmement flexibles entre les clés et les valeurs.

Ils peuvent être créés via une liste de paires ``clé:valeur`` séparées par des virgules et placées entre accolades :

In [None]:
numbers = {'one':1, 'two':2, 'three':3}

Les éléments sont accessibles et définis via la syntaxe d'indexation utilisée pour les listes et les tuples, sauf qu'ici l'index n'est pas un ordre basé sur zéro mais une clé valide dans le dictionnaire :

In [None]:
# Access a value via the key
numbers['two']

2

L'indexation permet également d'ajouter de nouveaux éléments au dictionnaire :

In [None]:
# Set a new key:value pair
numbers['ninety'] = 90
print(numbers)

{'three': 3, 'ninety': 90, 'two': 2, 'one': 1}


Gardez à l'esprit que les dictionnaires ne maintiennent aucun ordre pour les paramètres d'entrée ; ceci est voulu.
Cette absence d'ordre permet aux dictionnaires d'être mis en œuvre de manière très efficace, de sorte que l'accès à des éléments aléatoires soit très rapide, quelle que soit la taille du dictionnaire (si vous êtes curieux de savoir comment cela fonctionne, lisez ce qui concerne le concept de *table de hachage*).  
La [documentation python](https://docs.python.org/3/library/stdtypes.html) contient une liste complète des méthodes disponibles pour les dictionnaires.

## Sets

La quatrième collection de base est l'ensemble, qui contient des collections non ordonnées d'éléments uniques.
Ils sont définis de la même manière que les listes et les tuples, sauf qu'ils utilisent les parenthèses des dictionnaires :

In [None]:
primes = {2, 3, 5, 7}
odds = {1, 3, 5, 7, 9}

Si vous êtes familier avec les mathématiques des ensembles, vous connaissez des opérations telles que l'union, l'intersection, la différence, la différence symétrique, etc.
Les ensembles de Python intègrent toutes ces opérations, par le biais de méthodes ou d'opérateurs.
Pour chacune d'entre elles, nous montrerons les deux méthodes équivalentes :

In [None]:
# union: items appearing in either
primes | odds      # with an operator
primes.union(odds) # equivalently with a method

{1, 2, 3, 5, 7, 9}

In [None]:
# intersection: items appearing in both
primes & odds             # with an operator
primes.intersection(odds) # equivalently with a method

{3, 5, 7}

In [None]:
# difference: items in primes but not in odds
primes - odds           # with an operator
primes.difference(odds) # equivalently with a method

{2}

In [None]:
# symmetric difference: items appearing in only one set
primes ^ odds                     # with an operator
primes.symmetric_difference(odds) # equivalently with a method

{1, 2, 9}

De nombreuses autres méthodes et opérations sont disponibles.
Vous avez probablement déjà deviné ce que je vais dire ensuite : reportez-vous à la [documentation en ligne](https://docs.python.org/3/library/stdtypes.html) pour une référence complète.

## Structures de données plus spécialisées

Python contient plusieurs autres structures de données que vous pourriez trouver utiles ; elles se trouvent généralement dans le module intégré ``collections``.
Le module collections est entièrement documenté dans [la documentation en ligne de Python](https://docs.python.org/3/library/collections.html), et vous pouvez en savoir plus sur les différents objets qui y sont disponibles.

En particulier, j'ai trouvé l'objet suivant très utile à l'occasion :

- ``collections.namedtuple`` : Comme un tuple, mais chaque valeur a un nom
- ``collections.defaultdict`` : Comme un dictionnaire, mais les clés non spécifiées ont une valeur par défaut spécifiée par l'utilisateur.
- ``collections.OrderedDict`` : Comme un dictionnaire, mais l'ordre des clés est conservé.

Une fois que vous avez vu les types de collection standard intégrées, l'utilisation de ces fonctionnalités étendues est très intuitive, et je vous suggère de [lire à propos de leur utilisation](https://docs.python.org/3/library/collections.html).