# Structures de données

## Introduction

Dans `fondamentals.ipynb`, nous avons introduit l'idée de variables, que nous pourrions utiliser pour stocker plusieurs types d'informations. Nous pourrions stocker du texte, des nombres ou des valeurs de vérité. Ces différents types d'informations correspondent à différents types de données en python.

In [None]:
print(type('du text'))
print(type(10))
print(type(10.3))
print(type(True))

Nous avons également brièvement présenté la `list`, qui peut être utilisée pour stocker une collection de données.

Parfois, on stock des données dans des variables individuelles, mais souvent on travaille avec plusieurs informations qu'on souhaite regrouper en raison de leur relation. Par exemple, si on achete des produits dans une épicerie, on peut stocker chaque article que nous allons acheter dans des variables séparées ou nous pourrions stocker tous les articles dans une liste.

In [None]:
article_a = 'pomme'
article_b = 'oignons'
article_c = 'riz'
article_d = 'poisson'
article_e = 'lait'

article_list = ['pomme', 'oignons', 'riz', 'poisson', 'lait']

Laquelle de ces approches vous semble la plus utile? 

Écrivons une fonction `achat` pour effectuer l'achat des articles dont nous avons besoin.

In [None]:
def achat_article_individuel(item_a, item_b, item_c, item_d, item_e):
    print('Achat {}...'.format(item_a))
    print('Achat {}...'.format(item_b))
    print('Achat {}...'.format(item_c))
    print('Achat {}...'.format(item_d))
    print('Achat {}...'.format(item_e))

In [None]:
def achat_article_list(items):
    for item in items:
        print('Achat {}...'.format(item))

In [None]:
achat_article_individuel(article_a, article_b, article_c, article_d, article_e)

In [None]:
achat_article_list(article_list)

En utilisant `list`, la fonction est beaucoup plus courte à l'aide de la boucle `for`. Mais encore le plus important c'est que `achat_article_list` est beaucoup plus flexible. 

Et si au lieu d'acheter cinq articles, nous voulions en acheter plus ou moins?
A votre avis quel sera le problème?

Nous allons rencontrer une erreur lorsque nous essayons d'utiliser `achat_article_individuel` car elle attend exactement 5 arguments. Et ce n'est pas le cas avec `achat_article_list`, car la boucle` for` peut fonctionner avec des listes de n'importe quelle longueur.

Les collections (ou **conteneurs** comme on les appelle en Python) peuvent être très utiles pour résoudre des problèmes avec des données complexes. Python fournit plusieurs types de conteneurs, que nous allons explorer. Chacun a des propriétés et une structure différentes qui les rendent utiles pour des tâches spécifiques.

## `list`

Les listes sont créés en utilisant des crochets `[]`.

On peut stocker n'importe quel `type` de données dans une `list`. 

In [None]:
int_list = [2, 6, 3049, 18, 37]
float_list = [3.7, 8.2, 178.245, 63.1]

print(int_list)
print(float_list)

On peut même mettre une `list` à l'intérieur d'une autre `list`.

In [None]:
liste_de_listes = [['une', 'liste', 'de', 'mots'], [1, 5, 209], [True, False]]
print(liste_de_listes)

La `list` Python est décrite comme hétérogène car elle peut contenir une collection d'objets mixtes. C'est l'une des principales propriétés de définition de la `list` Python.

In [None]:
heter_list = [[23, 73, 50], 'des mots', 12.308, [[False, True], 'autres mots']]
print(heter_list)

Lorsque nous mettons des données dans une `list` dans un ordre particulier, elles restent dans cet ordre lorsque nous utilisons la `list` dans une boucle `for`. Parce que `list` préserve l'ordre, nous disons que c'est __ordonnée__. On peut utiliser cette propriété pour récupérer des éléments particuliers d'une `list` en fonction de leur position (ou __index__) dans la liste.

In [None]:
print(article_list)
print(article_list[2])

Les listes en python sont `zéro-indexées`, c'est pourquoi il a renvoyé le troisième élément lorsque nous avons demandé l'élément d'index 2.

In [None]:
print(article_list[0])
print(article_list[1])
print(article_list[2])

Nous pouvons également récupérer une __slice__ d'éléments à partir d'une liste.

In [None]:
print(article_list)
print(article_list[1:4])
print(article_list[3:])

Python a également une syntaxe d'indexation négative, qui permet d'accéder à la liste depuis la fin au lieu du début. Le dernier élément est indexé par -1.

In [None]:
print(article_list)
print(article_list[-1])
print(article_list[-3:])

Nous pouvons également effectuer le slicing (decoupage) en utilisant un pas différent de 1. Par exemple, nous pouvons découper tous les autres éléments de la liste, ou même inverser la liste en effectuant des étapes négatives.

In [None]:
print(article_list)
print(article_list[::2])
print(article_list[4:1:-1])

__[debut : fin : pas]__


ce qui signifie que le slicing commence au __debut__ jusqu'au __fin__ avec un nombre de pas égale à __pas__.
  La valeur par défaut de __debut__ est 0, __fin__ est le dernier index de la liste  et pour __pas__ c'est 1.

Nous pouvons bien sûr aussi récupérer des informations à partir d'une liste en utilisant une boucle `for`.

In [None]:
for element in article_list:
    print(element)

Généralement pour `for` la syntaxe est `for element in list`, mais nous pouvons parfois combiner une boucle` for` avec l'indexation. La fonction `range` est utile pour cela.

In [None]:
for i in range(0, len(article_list), 2):
    print(i, article_list[i])

La fonction `range` crée une liste d'entiers entre le premier et le deuxième argument, en utilisant le troisième argument comme __pas__. Notez que la limite supérieure (c'est-à-dire le deuxième argument) n'est pas incluse dans la sortie.

In [None]:
print(range(0, 10, 3))
print(range(104, 100, -1))
print(range(5))

On peut également utiliser __indexing/slicing__ pour remplacer les éléments de la liste.

In [None]:
article_list = ['pomme', 'oignons', 'riz', 'poisson', 'lait']
print(article_list)
article_list[-1] = 'orange' # remplacer lait par orange
print(article_list)
article_list[1:3] = ['carottes', 'couscous'] #remplacer oignons et riz par carottes et couscous
print(article_list)

Puisque nous pouvons modifier les listes après leur création, nous les appelons __mutable__ (les modifications sont appelées __mutations__). Certains types de données Python sont __immuables__, ce qui signifie qu'une fois sont créés, ils ne peuvent pas être modifiés. Nous allons voir cela en plus en détail aprés.

Une autre façon de faire muter une `list` est d'ajouter de nouveaux éléments.

In [None]:
article_list = ['pomme', 'oignons', 'riz', 'poisson', 'lait']
print(article_list)
article_list.append('squash')
print(article_list)
article_list.append(['pain', 'sel'])
print(article_list) #Que s'est-il passé?

Étant donné qu'une `list` peut contenir des listes, il faut faire attention lors de l'ajoue de plusieurs éléments à la `list`. Au lieu de `append`, on doit utiliser `extend`.

In [None]:
article_list = ['pomme', 'oignons', 'riz', 'poisson', 'lait']
print(article_list)
article_list.extend(['pain', 'sel'])
print(article_list)

Pour supprimer un élément d'une liste:

In [None]:
print(article_list)
del article_list[-1] # supprimer le dernier élément
print(article_list)

In [None]:
print(article_list)
print(article_list.pop(-1)) # supprimer le dernier élément et retourner sa valeur
print(article_list)

Une autre mutation qu'on peut effectuer à une liste est de la trier.

In [None]:
article_list.sort()
print(article_list)

A cause de la flexibilité de la `list` (ordonnée, hétérogène et mutable). Nous devons faire attention aux changements que nous apportons à une `list`, car ils peuvent être très imprévisibles. Nous pourrions perdre des données!

### Exercices

1. Créez une liste de 10 éléments et ne sélectionnez que les 2 derniers éléments.
2. Prenez la même liste et sélectionnez tous les éléments en commençant par le premier élément.
3. Sélectionnez tous éléments en commençant par le deuxième élément.

## `tuple`

Un `tuple` Python est très similaire à une` list` avec la majeure différence  - il est immuable. 

Nous créons un `tuple` en utilisant des parenthèses `()`.

In [None]:
example_tuple = ('Ali', 26, 167.6, True)
print(example_tuple)

Bien que nous puissions récupérer des données via l'indexation (car un `tuple` est ordonné), nous ne pouvons pas le modifier (car un` tuple` est immuable).

In [None]:
print(example_tuple[2])

167.6


In [None]:
example_tuple[2] = 169.3

In [None]:
# La suppression aussi n'est pas alouée
del example_tuple[-1]

Pour une question de clarté, on doit entourer les tuples avec `()`. Mais si aucun symbole n'est utilisé pour entourer les valeurs séparées par des virgules, python assume que nous voulons un `tuple`

In [None]:
example_tuple = 'Ali', 26, 167.6, True
print(example_tuple)
print(type(example_tuple))

Ce `tuple` implicite apparaît le plus souvent lorsqu'on travaille avec des fonctions qui renvoient plusieurs sorties.

In [None]:
def carre_cube(nombre):
    return nombre**2, nombre**3

res = carre_cube(3)
print(res)

Bien sûr on peut stocker les multiples sorties dans des variables séparées (__unpacking__).

In [None]:
car, cub = carre_cube(4)

print(car)
print(cub)

`list` et `tuple` sont tous les deux ordonnés et hétérogènes. Cependant, contrairement à la `liste`, le` tuple` est immuable, ce qui signifie qu'il ne peut pas être modifié après sa création. 

Par conséquent, une `list` pourrait être meilleure pour représenter des données qui devraient changer au long d'un programme. Un `tuple` est préférable pour représenter des données qui doivent rester fixes, comme les coordonnées géographiques d'une ville par exemple.

## `set`

Un `set` (ensemble) est similaire à une` liste`, sauf qu'il n'est pas ordonné. Il peut contenir des données hétérogènes et il est aussi mutable (modifiable). 

Nous pouvons créer un `set` en plaçant nos données entre accolades `{}`.

In [None]:
example_set = {'Ahmed', 26, 167.6, True}
print(example_set)

Même si nous avons saisi les données dans un ordre, le `set` les retourne dans un ordre différent. Plus important encore, on peut pas effectuer ni l'indexation ni le slicing avec un `set`.

In [None]:
print(example_set[0])

Mais on a toujours la possibilté d'ajouter ou de supprimer un élémeent.

In [None]:
print(example_set)
example_set.remove(26)
print(example_set)

In [None]:
example_set.add('True')
print(example_set)
example_set.update([58.1, 'noir'])
print(example_set)

La fonction `add` d'un `set` est similaire à la fonction `append` d'une `list`. La fonction `update` d'un` set` fonctionne de manière similaire à la fonction `extend` de `list`.

### Exercises

Soit les deux sets suivants: 
`
set1 = {1,2,3,4,5} et 
set2 = {4,5,6,7,8}
`


2. Ecrivez un programme pour supprimer l'intersection des deux sets `set2` et `set1`.

## `dict`

Recommençons avec la `list`, pour comprendre le `dict`. 

In [None]:
p = ['Ahmed', 30, 172.5, 74.8, 'noir', 'noir', True]

Cette `list` décrit une personne `p`: son nom, âge, taille (cm), poids (kg), la couleur de ses cheveux, la couleur de ses yeux et si elle est mariée ou pas. Nous savons qu'on peut accéder à ces informations individuellement par l'index.

In [None]:
print('Nom: %s' % p[0])
print('Cheveux de couleur: %s' % p[4])

Il serait facile de se tromper sur quelles données on parle (par exemple, `noir` est-ce la couleur des cheveux ou bien des yeux?), l'âge sera-t-il toujours à l'indice 1?.

Une meilleure solution serait une structure de données où nous pourrions indexer en utilisant des valeurs significatives. Par exemple, au lieu d'utiliser `p[0]` pour récupérer `Ahmed`, on peut utiliser `p['nom']`.... Cette fonctionnalité est la caractéristique centrale de `dict` en python.

In [None]:
p_dict = {'nom': 'Ahmed', 'age': 30, 'taille': 172.5, 'poids': 74.8, 'cheveux': 'noir', 'yeux': 'noir', 'mariee': True}

print('Nom: %s' % p_dict['nom'])
print('Cheveux de couleur: %s' % p_dict['cheveux'])

Nom: Ahmed
Cheveux de couleur: noir


On appel l'index `nom`  et `cheveux` **clés**. Chaque clé est associée à une **valeur** dans une **paire clé-valeur**. Chaque paire clé-valeur est séparée par une virgule `,` et à l'intérieur d'une paire, la clé et la valeur sont séparées par deux-points `:`.

`dict` est également mutable. Nous pouvons ajouter de nouvelles paires clé-valeur par une simple affectation.

In [None]:
print(p_dict)
p_dict['repas favori'] =  'Couscous'
print(p_dict)

On peut également utiliser `update`, similaire à un `set`, sauf maintenant avec des paires clé-valeur.

In [None]:
print(p_dict)
p_dict.update({'tel': '0666666666', 'freres': 1, 'soeures': 0})
print(p_dict)

On peut remplacer ou supprimer des paires clé-valeur d'un `dict`.

In [None]:
print(p_dict)
p_dict['soeures'] = 4
print(p_dict.pop('freres'))
print(p_dict)

In [None]:
del p_dict['repas favori']
print(p_dict)

In [None]:
print(p_dict.pop('freres'))
print(p_dict)

On peut récupérer une liste des clés et des valeurs directement, ou sous forme de paires clé-valeur, en utilisant les méthodes appropriées de `dict`.

In [None]:
print(p_dict.keys())
print(p_dict.values())
print(p_dict.items())

## Comprehension

Python a une syntaxe spéciale appelée __comprehension__ pour combiner l'itération avec la création d'une structure de données. Il s'agit essentiellement d'une boucle `for` placée entre les crochets appropriés pour créer la structure de données.

In [None]:
carres = [x**2 for x in range(10)]
carres_dict = {x: x**2 for x in range(10)}

print(carres)
print(carres_dict)

Les compréhensions sont très utiles pour faire des transformations simples sur des structures de données. Par exemple, on peut ecrire une fonction qui analyse `p_dict`. Il peut être utile d'avoir un `dict` des types de données des valeurs dans `p_dict`.

In [None]:
p_dict_dtypes = {k: type(v) for k, v in p_dict.items()}
print(p_dict_dtypes)

Les compréhensions rendent également le code plus lisible. 

Comparons l'implémentation de la boucle `for` de `carres_dict` avec la compréhension.

In [None]:
carres_dict = {}
for x in range(10):
    carres_dict[x] = x**2

print(carres_dict)

carres_dict = {x: x**2 for x in range(10)}

print(carres_dict)