# D'autres structures de données

Après les tableaux, nous allons aborder d'autres manières de stocker des collections de données.

## Les p-uplets
Un p-uplet est une suite de valeurs finies. En Python, on utilise le type `tuple`.

Pour créer un `tuple`, on procède un peu comme pour un tableau, sauf qu'on utilise des parenthèses `()` au lieu de crochets `[]`.


In [1]:
a = (5, 7, 2, 6, 4)
print(a)

(5, 7, 2, 6, 4)


Pour accéder aux éléments, on procède comme pour un tableau: en indiquant le numéro de l'élément entre crochets après le nom du tuple.

In [2]:
print(a[3])

6


> A part les parenthèses à la place des crochets, il n'y a pas de différences alors?

En lecture, non. Mais essayez d'écrire dans un `tuple`:

In [3]:
a[0] = 1

TypeError: 'tuple' object does not support item assignment

> Ca marche pas!

Et si on essaye d'ajouter un élément à la fin du `tuple`?

In [4]:
a.append(12)

AttributeError: 'tuple' object has no attribute 'append'

> Ca marche pas non plus.

Effectivement, un `tuple` n'est accessible qu'en lecture. Une fois qu'on l'a créé, il n'est pas modifiable comme une `list`.

> C'est nul. Ca fait moins de choses qu'un tableau. Autant toujours utiliser des tableaux. Qui peut le plus peut le moins.

Si les deux existent, c'est bien qu'il doit y avoir un intérêt.

Pour comprendre, écrivons une fonction qui calcule la distance entre deux points dans un espace en 2 dimensions.

Un point sera représenté par un tuple de 2 valeurs, la première correspondant à son abscisse et la deuxième à son ordonnée. [Ce petit rappel mathématique vous explique comment faire.](https://www.kartable.fr/ressources/mathematiques/methode/calculer-la-distance-entre-deux-points-dans-un-repere-orthonorme/3536)

Voici une manière d'écrire cette fonction:

In [1]:
def distance(pointA, pointB):
    dx = pointA[0] - pointB[0]
    dy = pointA[1] - pointB[1]
    dist = (dx ** 2 + dy ** 2) ** 0.5   # Remarque: la racine carrée est la même chose que la puissance 1/2
    return dist

Testons notre fonction:

In [6]:
a = (1, 3)
b = (4, -1)
d = distance(a, b)
print(d)

5.0


Puisque l'accès à un `tuple` se fait comme l'accès à une `list`, rien ne nous empêche de donner les coordonnées des points en utilisant une `list`.

In [7]:
a = [1, 3]
b = [4, -1]
d = distance(a, b)
print(d)

5.0


On pourrait aussi écrire la fonction de la manière suivante:

In [14]:
def distanceV2(pointA, pointB):
    dist = 0
    for i in range(2):
        pointA[i] -= pointB[i]
        dist += pointA[i] ** 2
    dist = dist ** 0.5
    return dist

C'est une façon un peu étrange de l'écrire. En particulier, on utilise pointA pour stocker les différences des coordonnées.

Testons le résultat avec des `list`.

In [9]:
a = [1, 3]
b = [4, -1]
d = distanceV2(a, b)
print(d)

5.0


Cela fonctionne, mais:

In [10]:
print(a)
print(b)

[-3, 4]
[4, -1]


Le point `a` est modifié. En effet, une variable de type simple est copiée lorsqu'elle est passée en argument à une fonction, et donc lorsque l'on passe une variable en argument, la fonction travail sur une copie. Si on modifie le contenu de la variable dans la fonction, on touche à la copie.

Exemple:

In [11]:
def f(x):
    x += 1
    print(x)

y = 5
f(y)
print(y)

6
5


Quand on passe la variable `y` à la fonction `f`, tout se passe comme si on avait un `x = y` au début de la fonction. La valeur contenue dans `y` est copiée dans `x`. Modifier le contenu de `x` n'a donc pas d'impact sur le contenu de `y`.

Oui, mais...

In [12]:
original = [ 1, 5, 8 ]
copie = original
copie[0] = 2
print(copie)
print(original)

[2, 5, 8]
[2, 5, 8]


Quand on écrit `copie = original`, avec des tableaux, cela ne réalise pas une vraie copie du tableau. Cela copie simplement la référence à l'emplacement occupé par le tableau dans la mémoire. On travaille sur le même endroit de la mémoire et donc nos modifications s'appliquent autant à la copie qu'à l'original.

Une fonction qui prend un tableau en argument et qui modifie le contenu du tableau va donc réellement modifier le tableau. Le concepteur de `distanceV2` n'y a pas pensé et le premier point sera modifié par l'appel à sa fonction.

Mais si on utilise des `tuple`:

In [15]:
a = (1, 3)
b = (4, -1)
d = distanceV2(a, b)
print(d)

TypeError: 'tuple' object does not support item assignment

Cette fois, on obtient une erreur puisqu'un `tuple` ne peut pas être modifié. Cela nous protège d'une modification accidentelle.

### Valeur de retour d'une fonction
Puisqu'une fonction ne modifie pas ses arguments (sauf cas particulier), le seul moyen pour une fonction de transmettre une information à la partie du programme qui l'a appelée est de renvoyer une valeur de retour.

Comment faire si la fonction doit nous renvoyer plusieurs informations? Puisqu'on ne peut renvoyer qu'une chose, on va renvoyer un `tuple` qui contiendra tout ce qu'on veut renvoyer.

Exemple: écrire une fonction `divisionEntiere` qui prend en argument deux nombres entiers et renvoi un `tuple` constitué, dans l'ordre, du quotient et du reste de la division entière du premier nombre par le deuxième.

In [11]:
def divisionEntiere(n1, n2):
    return (n1//n2, n1 % n2)
divisionEntiere(13, 4)

(3, 1)

Pourquoi renvoyer un `tuple` plutôt qu'une `list`? Et bien parce que la valeur de retour forme un tout. Si on modifie son contenu, cela n'a plus de sens. Il faut donc que le contenu ne soit pas modifiable.

### Taille d'un `tuple`
Puisqu'un `tuple` n'est pas modifiable, la seule manière de modifier une variable contenant un `tuple` est de remplacer l'ancien `tuple` par un nouveau. Il faut donc que la suite de valeurs ne soit pas trop longue.

## Les p-uplets nommés
Imaginons que l'on veuille représenter un élève par un `tuple` constitué de son nom, son prénom et sa classe. Si on veut gérer une liste d'élèves, il faudra se souvenir que, chaque fois que l'on crée un nouveau `tuple`, il faut indiquer dans l'ordre exact le nom, le prénom et la classe.

Si on a besoin d'accéder au nom, il faut savoir qu'il est dans le premier élément du `tuple` et donc rajouter `[0]` après le nom du `tuple`. Pour la classe, il faudra le faire suivre de `[2]`. 

Il est possible de se tromper et l'ensemble rend le programme difficile à lire. Il faudrait pouvoir créer des `tuple` en donnant un nom à leurs éléments et ainsi pouvoir accéder aux éléments par leur nom. On peut aussi créer le `tuple` sans se soucier de l'ordre dans lequel on rentre les données, mais en les identifiants par leur nom. C'est ce que l'on peut faire avec des p-uplets nommés.

En Python, on parle de `namedtuple`. Ce type n'est pas disponible directement. Il faut l'importer depuis la bibliothèque `collections`:

In [2]:
from collections import namedtuple

Il faut ensuite définir un type de p-uplet nommé:

In [3]:
Eleve = namedtuple("Eleve", ["nom", "prenom", "classe"])

Puis, on peut créer des `namedtuple` de type `Eleve`:

In [4]:
a = Eleve(nom = "DUPONT", prenom = "Jean", classe = "P03")
print(a)

Eleve(nom='DUPONT', prenom='Jean', classe='P03')


Il n'est pas obligatoire de rentrer les données dans l'ordre nom, prénom et classe:

In [5]:
b = Eleve(prenom = "Paul", classe = "P05", nom = "DURAND")
print(b)

Eleve(nom='DURAND', prenom='Paul', classe='P05')


On peut rentrer les informations comme pour un `tuple` sans avoir à préciser les noms des champs. Dans ce cas, il faut entrer les valeurs des champs dans le bon ordre:

In [6]:
c = Eleve("BOND", "James", "P007")
print(c)

Eleve(nom='BOND', prenom='James', classe='P007')


Pour accéder à l'un des champs, il suffit d'écrire le nom de la variable contenant un `namedtuple` suivie de `.` et du nom du champ voulu:

In [7]:
print(a.nom)
print(b.classe)
print(c.prenom)

DUPONT
P05
James


On peut aussi accéder aux champs par les numéros de position comme pour des `tuple` classiques:

In [8]:
print(a[1])
print(b[2])
print(c[0])

Jean
P05
BOND


Si on veut créer un nouveau type de `namedtuple`, il faut:

_1_ donner un nom à ce type avant d'écrire `=`. C'est ce qui servira à créer de nouveaux `namedtuple` de ce type en écrivant ce nom avant les parenthèses. Par convention, on commence ce nom par une majuscule.

_2_ donner le nom d'affichage. C'est un `str` qui s'affichera si on passe un `namedtuple` à la fonction `print`. Il est conseillé de mettre dans ce `str` la même chose qu'en _1_, mais ce n'est pas obligatoire.

_3_ donner la liste des noms des champs. Chaque nom de champ est un `str`.

```python
_1_ = namedtuple( _2_, _3_ )
```

Autre exemple:

In [19]:
Prof = namedtuple("Professeur", ["nom", "prenom", "classes"])
p = Prof(prenom = "Tryphon", nom = "TOURNESOL", classes = ["S4", "P3", "P8"])
print(p)
print(p.classes)

Professeur(nom='TOURNESOL', prenom='Tryphon', classes=['S4', 'P3', 'P8'])
['S4', 'P3', 'P8']


On voit ici que les champs peuvent être de n'importe quel type. Ici, le champ `classes` est une `list` de `str` alors que `nom` est un simple `str`.

Créez un type de `namedtuple` pour stocker des informations sur un pays avec pour champ, son nom, sa capitale, sa superficie, sa population et créez quelques variables de ce type en affichant tout le `namedtuple` ou seulement l'un de ses champs.

In [21]:
Pays = namedtuple("Monde", ["nom_du_pays", "nombre_dhabitants", "capital", "superficie"])
france = Pays(nom_du_pays = "France", nombre_dhabitants = "67,5 Millions d'habitants", capital = "Paris", superficie="552000KM²" )
#print(france)
print(france.nom_du_pays)
canada = Pays("Canada", "38.2Millions", "Ottawa", "10Millions de km²")
print(canada.superficie)

France
10Millions de km²


## Les dictionnaires
Un dictionnaire est une structure de données assez particulière. 

Quand nous avons vu les tableaux, nous y avons stocké des valeurs et nous pouvions retrouver ces valeurs par leurs numéros de position. Dans un dictionnaire, il n'y a pas de numéro de position, mais une **clé**. Cette clé peut être n'importe quoi: un nombre (même s'il n'est pas entier), un `str`, un tableau, une image,... Attention cependant avec les types trop complexes. Généralement, les clés des dictionnaires sont des `str`.

Pour créer un dictionnaire (`dict` en Python), on utilise des accolades `{}`. A l'intérieur, on y met des paires `clé: valeur` séparées par des virgules.

Ex:

In [26]:
ingredients = { "farine": "250 g", "sucre": "20 g", "oeufs": 3, "lait": "75 cL" }
print(ingredients)

{'farine': '250 g', 'sucre': '20 g', 'oeufs': 3, 'lait': '75 cL'}


On accède à une valeur en indiquant la clé correspondante entre crochets après le nom du dictionnaire:

In [27]:
print(ingredients["lait"])

75 cL


On peut accéder aux valeurs en lecture mais aussi en écriture:

In [22]:
stock = { "stylo": 48, "crayon": 27, "gomme": 35 }
print(stock)

# vente de 5 stylos:
stock["stylo"] -= 5

print(stock)

{'stylo': 48, 'crayon': 27, 'gomme': 35}
{'stylo': 43, 'crayon': 27, 'gomme': 35}


Si on essaye d'écrire dans une clé qui n'existe pas, elle sera créée:

In [23]:
stock["cahier"] = 59
print(stock)

{'stylo': 43, 'crayon': 27, 'gomme': 35, 'cahier': 59}


Comme on peut mettre ce que l'on veut comme clé, on peut aussi mettre un nombre entier. Dans ce cas, l'accès au dictionnaire fera penser à l'accès à un tableau:

In [30]:
fauxTableau = { 0: "a", 1: "b", 2: "c", 5: "f", 6: "g" }
print(fauxTableau)
print(fauxTableau[2])

{0: 'a', 1: 'b', 2: 'c', 5: 'f', 6: 'g'}
c


Seulement, comme il ne s'agit pas d'un tableau, il peut y avoir des trous dans les index:

In [31]:
print(fauxTableau[4])

KeyError: 4

Et on obtient une `KeyError` quand on essaye de lire la valeur associée à une clé qui n'existe pas.

### Parcourir un dictionnaire
Comme pour les tableaux, si on veut parcourir un dictionnaire, on utilise une boucle `for`. Seulement, comme la clé est rarement un nombre entier, on ne peut pas utiliser `for i in range...`

On utilise donc la boucle `for` sans avoir accès au numéro de position (qui n'existe pas dans un dictionnaire):

In [24]:
for entree in stock:
    print(entree)

stylo
crayon
gomme
cahier


On voit qu'à chaque tour de boucle, la variable `entree` contient une nouvelle clé du dictionnaire. On obtient la même chose avec la méthode `keys` des dictionnaires (une méthode est une fonction. Il faut donc l'appeler. Elle ne prend pas d'arguments).

In [33]:
for cle in stock.keys():
    print(cle)

stylo
crayon
gomme
cahier


Trouvez un moyen d'afficher les valeurs associées à ces clés (soit 43, 27, 35, 59 si vous n'avez pas modifié le dictionnaire).

In [25]:
for cle in stock.keys():
    print(cle)

stylo
crayon
gomme
cahier


Il est possible de le faire plus simplement avec la méthode `values`:

In [26]:
for valeur in stock.values():
    print(valeur)

43
27
35
59


Cette méthode ne permet cependant pas d'avoir accès à la clé, mais seulement à la valeur. Si on a besoin d'avoir accès aux deux, on doit utiliser la méthode `items`:

In [1]:
for x in stock.items():
    print(x)

SyntaxError: invalid syntax (3322446602.py, line 3)

Cette méthode donnant, à chaque tour de boucle, un `tuple` formé de la clé suivie de sa valeur, on peut **dépaqueter** ce `tuple` dans deux variables différentes:

In [28]:
for cle, val in stock.items():
    print("La clé \"" + str(cle) + "\" a pour valeur : \"" + str(val) + "\"")

La clé "stylo" a pour valeur : "43"
La clé "crayon" a pour valeur : "27"
La clé "gomme" a pour valeur : "35"
La clé "cahier" a pour valeur : "59"
