# "Les collections III : Dictionnaires , strings et collections à 2 dimensions"

- toc: false 
- badges: true
- hide_binder_badge: true
- hide_github_badge: true
- comments: false
- layout: post
- author: DataScientist.fr
- permalink: /python-intro-gen/chapter/5/lesson/3/

## 5. Les dictionnaires `dict`

Le type de dictionnaire Python est appelé `dict`. Nous pouvons utiliser un dictionnaire pour stocker des paires clé-valeur. Les `dict` sont définis avec un ensemble de paires clé-valeur séparées par des virgules entre des accolades (`{` et `}`). Nous utilisons deux points pour séparer chaque clé de sa valeur. Nous accédons aux valeurs du dictionnaire de la même manière que les éléments de liste ou de tuple, mais nous utilisons des clés au lieu d'indices :

In [None]:
marbles = {"red": 34, "green": 30, "brown": 31, "yellow": 29 }

personal_details = {
    "name": "Jane Doe",
    "age": 38, # trailing comma is legal
}

print(marbles["green"])
print(personal_details["name"])

# This will give us an error, because there is no such key in the dictionary
print(marbles["blue"])

# modify a value
marbles["red"] += 3
personal_details["name"] = "Jane Q. Doe"

Les clés d'un dictionnaire n'ont pas besoin d'être des `string`, elles peuvent être de n'importe quel type immuable, y compris des nombres et même des tuples. Nous pouvons mélanger différents types de clés et différents types de valeurs dans un dictionnaire. Les clés sont uniques, si nous répétons une clé, nous écraserons l'ancienne valeur avec la nouvelle. Lorsque nous stockons une valeur dans un dictionnaire, la clé n'a pas besoin d'exister - elle sera créée automatiquement :

In [None]:
battleship_guesses = {
    (3, 4): False,
    (2, 6): True,
    (2, 5): True,
}

surnames = {} # this is an empty dictionary
surnames["John"] = "Smith"
surnames["John"] = "Doe"
print(surnames) # we overwrote the older surname

marbles = {"red": 34, "green": 30, "brown": 31, "yellow": 29 }
marbles["blue"] = 30 # this will work
marbles["purple"] += 2 # this will fail -- the increment operator needs an existing value to modify!


Voici quelques fonctions couramment utilisées pour les objets `dict` :

In [None]:
marbles = {"red": 34, "green": 30, "brown": 31, "yellow": 29 }

# Get a value by its key, or None if it doesn't exist
marbles.get("orange")
# We can specify a different default
marbles.get("orange", 0)

# Add several items to the dictionary at once
marbles.update({"orange": 34, "blue": 23, "purple": 36})

# All the keys in the dictionary
marbles.keys()
# All the values in the dictionary
marbles.values()
# All the items in the dictionary
marbles.items()

On peut vérifier si une clé est dans le dictionnaire en utilisant `in` et `not in` :

In [None]:
print("purple" in marbles.keys())
print("white" not in marbles)

print(31 in marbles.values())

## 6. Converstion des collections


### Conversions implicites

Si nous essayons d'itérer sur une collection dans une boucle `for` (quelque chose dont nous discuterons dans le prochain chapitre), Python essaiera de la convertir en quelque chose que nous pouvons parcourir s'il sait comment le faire. Par exemple, les `dict` que nous avons vues ci-dessus ne sont pas réellement des itérateurs, mais Python sait comment les transformer en itérateurs, nous pouvons donc les utiliser dans une boucle `for` sans avoir à les convertir nous-mêmes.

Parfois, l'itérateur que nous obtenons par défaut peut ne pas être ce à quoi nous nous attendions, si nous parcourons un dictionnaire dans une boucle `for`, nous parcourrons les clés. Si ce que nous voulons réellement faire est d'itérer sur les valeurs, ou les paires clé et valeur, nous devrons le spécifier nous-mêmes en utilisant les fonctions `values` et `items`.


### Conversions explicites

Nous pouvons convertir les différents types de séquences en utilisant les fonctions `built-in` (correspondant au type) pour convertir les séquences dans les types souhaités :

In [None]:
animals = ['cat', 'dog', 'goldfish', 'canary', 'cat']
animals_set = set(animals)
animals_unique_list = list(animals_set)
animals_unique_tuple = tuple(animals_unique_list)


marbles = {"red": 34, "green": 30, "brown": 31, "yellow": 29 }
colours = list(marbles) # the keys will be used by default
counts = tuple(marbles.values()) # but we can use a view to get the values
marbles_set = set(marbles.items()) # or the key-value pairs


# Python doesn't know how to convert this into a dictionary
dict([1, 2, 3, 4])

# but this will work
dict([(1, 2), (3, 4)])

## 7. Les `string` sont des séquences

Les  `string` sont également une sorte de type de séquence. Ce sont des séquences de caractères et partagent certaines propriétés avec d'autres séquences. Par exemple, nous pouvons trouver la longueur d'une `string` ou l'index d'un caractère dans la `string`, et nous pouvons accéder à des éléments individuels de la `string` ou des `slice` :

In [None]:
s = "abracadabra"

print(len(s))
print(s.index("a"))

print(s[0])
print(s[3:5])

print('a' in 'abcd') # True
print('ab' in 'abcd') # also True

N'oubliez pas que les chaînes sont immuables, la modification des caractères sur place n'est pas autorisée :

In [None]:
# this will give us an error
s[0] = "b"

Les opérateurs `in` et `not in` ont un comportement spécial lorsqu'il est appliqué aux `string` : nous pouvons l'utiliser pour déterminer si une `string` contient un seul caractère en tant qu'élément, mais nous pouvons également l'utiliser pour vérifier si une `string` en contient une autre :

In [None]:
print('a' in 'abcd') # True
print('ab' in 'abcd') # also True

# this doesn't work for lists
print(['a', 'b'] in ['a', 'b', 'c', 'd']) # False

On peut convertir une `string` en `list` :

In [None]:
abc_list = list("abracadabra")

Et si on voulait convertir une liste de caractères en chaîne ? L'utilisation de la fonction `str` sur la liste nous donnera simplement une chaîne affichable de la liste, y compris les virgules, les guillemets et les crochets. Pour fusionner des séquence de caractères (ou de `string`) en une seule `string`, nous devons utiliser la fonction `join`.

Cette fonction, attachée à une `string` fonction comme tel :

In [None]:
l = ['a', 'b', 'r', 'a', 'c', 'a', 'd', 'a', 'b', 'r', 'a']

s = "".join(l)
print(s)


animals = ('cat', 'dog', 'fish')

# a space-separated list
print(" ".join(animals))

# a comma-separated list
print(",".join(animals))

# a comma-separated list with spaces
print(", ".join(animals))

L'opposé de la fonction `join` est la fonction `split`. Nous pouvons diviser une `string` en une liste de `string` en utilisant la fonction `split`. S'il est appelé sans aucun paramètre, split divise une chaîne en mots, en utilisant n'importe quel nombre de caractères blancs consécutifs comme délimiteur. Nous pouvons utiliser des paramètres supplémentaires pour spécifier un délimiteur différent ainsi qu'une limite sur le nombre maximum de fractionnements à effectuer :

In [None]:
print("cat    dog fish\n".split())
print("cat|dog|fish".split("|"))
print("cat, dog, fish".split(", "))
print("cat, dog, fish".split(", ", 1))

## Les séquences à 2 dimensions

La plupart des séquences que nous avons vues jusqu'à présent étaient unidimensionnelles : chaque séquence est une ligne d'éléments. Que se passe-t-il si nous voulons utiliser une séquence pour représenter une structure de données bidimensionnelle, qui comporte à la fois des lignes et des colonnes ? La façon la plus simple de le faire est de créer une séquence dans laquelle chaque élément est également une séquence. Par exemple, nous pouvons créer une liste de listes :

In [None]:
my_table = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9],
    [10, 11, 12],
]

La liste extérieure a quatre éléments, et chacun de ces éléments est une liste avec trois éléments (qui sont des nombres). Pour accéder à l'un de ces nombres, nous devons utiliser deux indices - un pour la liste externe et un pour la liste interne :

In [None]:
print(my_table[0][0])

# lists are mutable, so we can do this
my_table[0][0] = 42

orsque nous utilisons une séquence bidimensionnelle pour représenter des données tabulaires, chaque séquence interne aura la même longueur, car un tableau est rectangulaire, mais rien ne nous empêche de construire des séquences bidimensionnelles qui n'ont pas cette propriété :

In [None]:
my_2d_list = [
    [0],
    [1, 2, 3, 4],
    [5, 6],
]

On peut aussi faire une séquence tridimensionnelle en faisant une liste de listes de listes :

In [None]:
my_3d_list = [
    [[1, 2], [3, 4]],
    [[5, 6], [7, 8]],
]

print(my_3d_list[0][0][0])

### Exemple : emploi du temps

Si nous voulions faire une liste en deux dimensions pour représenter un emploi du temps hebdomadaire, nous pourrions soit avoir des jours comme liste extérieure et des créneaux horaires comme liste intérieure ou l'inverse - nous devrons nous rappeler quelle plage nous avons choisie pour être la lignes et dont les colonnes.

Supposons que nous voulions initialiser l'horaire avec une chaîne vide dans chaque plage horaire – disons que nous avons 24 plages horaires d'une heure chaque jour. Cela fait sept listes de 24 éléments chacune :

In [None]:
day = [""] * 24
print(day)

Mais que se passe-t-il si nous répétons un jour sept fois pour faire une semaine ?

In [None]:
timetable =  [day] * 7
print(timetable)

Voyons ce qui se passe lorsque nous essayons de programmer une réunion pour le lundi après-midi :

In [None]:
timetable[0][15] = "meeting with Jane"
print(timetable)

Chaque jour a la même réunion l'après-midi ! Qu'est ce qui s'est passé ? Lorsque nous avons multiplié notre liste de jours par sept, nous avons rempli notre emploi du temps avec le même objet `list`, répété sept fois. Tous les éléments de notre emploi du temps sont le même jour, donc peu importe celui que nous modifions, nous les modifions tous en même temps.

Pourquoi cela n'avait-il pas d'importance lorsque nous avons fait la liste des jours en multipliant la même chaîne vide 24 fois ? Parce que les `string` sont immuables. Nous ne pouvons modifier les valeurs des `string` dans la liste des jours qu'en leur attribuant de nouvelles valeurs, nous ne pouvons pas les modifier directement, donc peu importe qu'elles commencent toutes par le même objet de chaîne.
   
Ce que nous voulons en fait, ce sont sept copies d'une liste de jours dans notre emploi du temps :

In [None]:
timetable = [[""] * 24 for day in range(7)]