# Structures de données

## Plus de détails sur les listes

Le type de données liste possède d’autres méthodes. Voici toutes les méthodes des objets listes :

**`append(x)`** équivalent à `a.insert(len(a), x).`
    
**`extend(L)`** rallonge la liste en ajoutant à la fin tous les éléments de la liste donnée ; équivaut à `a[len(a):] = L`. 
    
**`insert(i, x)`** insère un élément à une position donnée. Le premier argument est l’indice de l’élément avant lequel il faut insérer, donc `a.insert(0, x)` insère au début de la liste, et `a.insert(len(a), x)` est équivalent à `a.append(x)`.

**`remove(x)`** enlève le premier élément de la liste dont la valeur est `x`. Il y a erreur si cet élément n’existe pas. 

**`pop([i ])`** enlève l’élément présent à la position donnée dans la liste, et le renvoie. Si aucun indice n’est spécifié, `a.pop()` renvoie le dernier élément de la liste. L’élément est aussi supprimé de la liste.

**`index(x)`** retourne l’indice dans la liste du premier élément dont la valeur est `x`. Il y a erreur si cet élément n’existe pas.

**`count(x)`** renvoie le nombre de fois que `x` apparaît dans la liste. 

**`sort()`** trie les éléments à l’intérieur de la liste.

**`reverse()`** renverse l’ordre des éléments à l’intérieur de la liste.

Un exemple qui utilise toutes les méthodes des listes :

In [1]:
ma_liste = [66.6, 333, 333, 1, 1234.5]
print (ma_liste.count(333), ma_liste.count(66.6), ma_liste.count('x'))

2 1 0


In [5]:
def count(liste, truc):
    decompte = 0
    for element in liste:
        if element == truc:
            decompte = decompte + 1
    return decompte

count(ma_liste, 333)
ma_liste.count(333)

<class 'int'>


In [7]:
ma_liste2 = list(ma_liste)
ma_liste2.sort()
print(ma_liste2)
print(ma_liste)

[1, 66.6, 333, 333, 1234.5]
[66.6, 333, 333, 1, 1234.5]


In [8]:
ma_liste.insert(2, -1)

In [9]:
ma_liste.append(333)

In [10]:
ma_liste

[66.6, 333, -1, 333, 1, 1234.5, 333]

In [11]:
ma_liste.index(333)

1

In [12]:
ma_liste.remove(333)
print(ma_liste)

[66.6, -1, 333, 1, 1234.5, 333]


In [13]:
ma_liste.reverse()
ma_liste

[333, 1234.5, 1, 333, -1, 66.6]

In [14]:
ma_liste.sort()
ma_liste

[-1, 1, 66.6, 333, 333, 1234.5]

### Utiliser les listes comme des piles (*)

Les méthodes des listes rendent très facile l’utilisation d’une liste comme une pile, où le dernier élément ajouté est le premier élément récupéré (LIFO, "last-in, first-out"). Pour ajouter un élément au sommet de la pile, utilisez la méthode `append()`. Pour récupérer un élément du sommet de la pile, utilisez `pop()` sans indice explicite. Par exemple :

In [15]:
pile = [3, 4, 5]
pile.append(6)
pile.append(7)
pile

[3, 4, 5, 6, 7]

In [16]:
pile.pop()

7

In [17]:
pile

[3, 4, 5, 6]

In [18]:
pile.pop()

6

In [19]:
pile.pop()

5

In [20]:
pile

[3, 4]

In [21]:
type(pile)

list

### Utiliser les listes comme des files (*)

Vous pouvez aussi utiliser facilement une liste comme une file, où le premier élément ajouté est le premier élément retiré (FIFO, "first-in, first-out"). Pour ajouter un élément à la fin de la file, utiliser `append()`. Pour récupérer un élément du devant de la file, utilisez `pop()` avec 0 pour indice. Par exemple :

In [22]:
file = ["Eric", "John", "Michael"]
file.append("Terry")                # Terry arrive
file.append("Graham")               # Graham arrive
file.pop(0)

'Eric'

In [23]:
file.pop(0)

'John'

In [24]:
file

['Michael', 'Terry', 'Graham']

### Outils de programmation fonctionnelle (*)

Il y a trois fonctions intégrées qui sont très pratiques avec les listes : `filter()`, `map()`, et `reduce()`. 

'`filter(`*fonction*, *sequence*`)`' renvoit une liste (du même type, si possible) contenant les seul éléments de la
séquence pour lesquels `fonction(`*element*`)` est vraie. Par exemple, pour calculer quelques nombres premiers :

In [84]:
def f(x): return x % 2 != 0 and x % 3 != 0
def pair(x):
    return x % 2 == 0

filter(pair, list(range(2, 25)))

<filter at 0x7f79909083a0>

'`map(`*fonction*, *sequence*`)`' appelle `fonction(`*element*`)` pour chacun des éléments de la séquence et renvoie la liste des valeurs de retour. Par exemple, pour calculer les cubes :

In [29]:
def cube(x): 
    return x*x*x

map(cube, list(range(1, 11)))

<map at 0x7f79b118e5b0>

Plusieurs séquences peuvent être passées en paramètre ; la fonction doit alors avoir autant d’arguments qu’il y a de séquences et est appelée avec les éléments correspondants de chacune des séquences (ou `None` si l’une des séquences est plus courte que l’autre). Si `None` est passé en tant que fonction, une fonction retournant ses arguments lui est substituée.

`reduce(fonction, sequence)` renvoie une valeur unique construite par l’appel de la fonction binaire `fonction` sur les deux premiers éléments de la séquence, puis sur le résultat et l’élément suivant, et ainsi de suite. Par exemple, pour calculer la somme des nombres de 1 à 10 :

In [None]:
def ajoute(x,y): return x+y

reduce(ajoute, range(1, 11))

S’il y a seulement un élément dans la séquence, sa valeur est renvoyée ; si la séquence est vide, une exception est déclenchée.

Un troisième argument peut être transmis pour indiquer la valeur de départ. Dans ce cas, la valeur de départ est renvoyée pour une séquence vide, et la fonction est d’abord appliquée à la valeur de départ et au premier élément de la séquence, puis au résultat et à l’élément suivant, et ainsi de suite. Par exemple,

In [None]:
def somme(seq):
    def ajoute(x,y): return x+y
    return reduce(ajoute, seq, 0)

somme(range(1, 11))

In [None]:
somme([])

### *List Comprehensions* (*)

Les *list comprehensions* fournissent une façon concise de créer des listes sans avoir recours à `map()`, `filter()` et/ou `lambda`. La définition de liste qui en résulte a souvent tendance à être plus claire que des listes construites avec ces outils. Chaque *list comprehension* consiste en une expression suivie d’une clause `for`, puis zéro ou plus clauses `for` ou `if`. Le résultat sera une liste résultant de l’évaluation de l’expression dans le contexte des clauses `for` et `if` qui la suivent. Si l’expression s’évalue en un tuple, elle doit être mise entre parenthèses.

In [33]:
sous_reseau = '192.168.0.'
adresses_locales = []
for i in range(1, 256):
    adresses_locales.append(sous_reseau + str(i))
print(adresses_locales[:5])

['192.168.0.1', '192.168.0.2', '192.168.0.3', '192.168.0.4', '192.168.0.5']


la même chose mais avec la list comprehension:

In [36]:
adresses_locales = [sous_reseau + str(i) for i in range(1, 256)]

print(adresses_locales[:10])

['192.168.0.1', '192.168.0.2', '192.168.0.3', '192.168.0.4', '192.168.0.5', '192.168.0.6', '192.168.0.7', '192.168.0.8', '192.168.0.9', '192.168.0.10']


Un autre exemple avec un test if :

In [30]:
nombres_pairs = []
for i in range(1, 11):
    if i % 2 == 0:
        nombres_pairs.append(i)
print(nombres_pairs)

[2, 4, 6, 8, 10]


la même en list comprehension

In [39]:
nombres_pairs = [i for i in range(1, 11) if i % 2 == 0]
print(nombres_pairs)

[2, 4, 6, 8, 10]


Un autre exemple : 

In [40]:
liste_de_fruits = ['  banane', '  myrtille ', 'fruit de la passion  ']
nouvelle_liste_de_fruits = [fruit.strip() for fruit in liste_de_fruits]
print (nouvelle_liste_de_fruits)

['banane', 'myrtille', 'fruit de la passion']


In [42]:
liste_adresse_mail = ["hello@world.com", "toto@uvsq.fr", "sylvain.uvsq.fr", "a@a.com"]

mails_valides = [adresse for adresse in liste_adresse_mail if "@" in adresse]
print(mails_valides)

['hello@world.com', 'toto@uvsq.fr', 'a@a.com']


In [43]:
vec = [2, 4, 6]
[3*x for x in vec]

[6, 12, 18]

In [44]:
[3*x for x in vec if x > 3]

[12, 18]

In [45]:
[3*x for x in vec if x <= 2]

[6]

In [None]:
[{x: x**2} for x in vec]

In [None]:
[[x,x**2] for x in vec]

In [None]:
[x, x**2 for x in vec] # erreur : parenthèses obligatoires pour les tuples

In [None]:
[(x, x**2) for x in vec]

In [None]:
vec1 = [2, 4, 6]
vec2 = [4, 3, -9]
[x*y for x in vec1 for y in vec2]

In [None]:
[x+y for x in vec1 for y in vec2]

In [None]:
[vec1[i]*vec2[i] for i in range(len(vec1))]

## L'instruction `del`

Il y a un moyen d’enlever un élément d’une liste en ayant son indice au lieu de sa valeur : l’instruction `del`. Cela peut aussi être utilisé pour enlever des tranches dans une liste (ce que l’on a fait précédemment par remplacement de la tranche par une liste vide). Par exemple :

In [50]:
a = [-1, 1, 66.6, 333, 333, 1234.5]
del a[0]
a

[1, 66.6, 333, 333, 1234.5]

In [51]:
del a[2:4]
a

[1, 66.6, 1234.5]

`del` peut aussi être utilisé pour supprimer des variables complètes :

In [52]:
del a
a

NameError: name 'a' is not defined

Faire par la suite référence au nom `a` est une erreur (au moins jusqu’à ce qu’une autre valeur ne lui soit affectée). Nous trouverons d’autres utilisations de `del` plus tard.

## N-uplets (tuples) et séquences

Nous avons vu que les listes et les chaînes ont plusieurs propriétés communes, telles que l’indexation et les opérations de découpage. Elles sont deux exemples de types de données de type *séquence*. Puisque Python est un langage qui évolue, d’autres types de données de type séquence pourraient être ajoutés. Il y a aussi un autre type de données de type séquence standard : le *tuple* (ou n-uplet).

Un n-uplet consiste en un ensemble de valeurs séparées par des virgules, par exemple :

In [55]:
t = (12345, 54321, 'salut!')
t[0]

12345

In [56]:
t

(12345, 54321, 'salut!')

In [None]:
# Les tuples peuvent être imbriqués:
u = t, (1, 2, 3, 4, 5)
u

Comme vous pouvez le voir, à l’affichage, les tuples sont toujours entre parenthèses, de façon à ce que des tuples de tuples puissent être interprétés correctement ; ils peuvent être saisis avec ou sans parenthèses, bien que des parenthèses soient souvent nécessaires (si le tuple fait partie d’une expression plus complexe).

Les tuples ont plein d’utilisations. Par exemple, les couples de coordonnées (x, y), les enregistrements des employés d’une base de données, etc. Les tuples, comme les chaînes, sont non-modifiables : il est impossible d’affecter individuellement une valeur aux éléments d’un tuple (bien que vous puissiez simuler quasiment cela avec le découpage et la concaténation).

### spécificités des tuples (*)

Un problème particulier consiste à créer des tuples contenant 0 ou 1 élément : la syntaxe reconnaît quelques subtilités pour y arriver. Les tuples vides sont construits grâce à des parenthèses vides ; un tuple avec un élément est construit en faisant suivre une valeur d’une virgule (il ne suffit pas de mettre une valeur seule entre parenthèses). Peu lisible, mais efficace. Par exemple :

In [None]:
empty = ()
singleton = 'salut', # <-- notez la virgule en fin de ligne
len(empty)

In [None]:
len(singleton)

In [None]:
singleton

L’instruction `t = 12345, 54321, 'salut !'` est un exemple d’ emballage en tuple (*tuple packing*) : les valeurs `12345`, `54321` et `'salut !'` sont emballées ensemble dans un tuple. L’opération inverse est aussi possible :

In [None]:
x, y, z = t

Cela est appelé, fort judicieusement, *déballage de tuple* (tuple unpacking). Le déballage d’un tuple nécessite que la liste des variables à gauche ait un nombre d’éléments égal à la longueur du tuple. Notez que des affectations multiples ne sont en réalité qu’une combinaison d’emballage et déballage de tuples !

## Ensembles (*)

Python comporte également un type de données pour représenter des ensembles. Un `set` est une collection (non rangée) sans éléments dupliqués. Les emplois basiques sont le test d’appartenance et l’élimination des entrée dupliquées. Les objets ensembles supportent les opérations mathématiques comme l’union, l’intersection, la différence et la différence symétrique.
Voici une démonstration succincte :

In [59]:
liste_ip = ['192.168.0.2', '192.168.0.4' , '192.168.0.3', 
            '192.168.0.2', '192.168.0.6', '192.168.0.2', 
            '192.168.0.3', '192.168.0.4' , '192.168.0.3']
ip_uniques = set(liste_ip)
ip_uniques

{'192.168.0.2', '192.168.0.3', '192.168.0.4', '192.168.0.6'}

In [61]:
'192.168.0.6' in ip_uniques # test d'appartenance rapide

True

In [60]:
'192.168.0.5' in ip_uniques

False

In [57]:
panier = ['pomme', 'orange', 'pomme', 'poire', 'orange', 'banane']
fruits = set(panier)  # creation d'un set sans éléments dupliqués
fruits

{'banane', 'orange', 'poire', 'pomme'}

In [None]:
'orange' in fruits # test d'appartenance rapide

In [None]:
'ananas' in fruits

Une autre démonstration rapide des ensembles sur les lettres uniques de deux mots

In [62]:
a = set('abracadabra')
b = set('alacazam')
a                       # lettres uniques dans abracadabra

{'a', 'b', 'c', 'd', 'r'}

In [63]:
b                       # lettres uniques dans alacazam

{'a', 'c', 'l', 'm', 'z'}

In [64]:
a - b                   # lettres dans a mais pas dans b

{'b', 'd', 'r'}

In [65]:
a | b                   # lettres soit dans a ou b, c'est l'union de a et b

{'a', 'b', 'c', 'd', 'l', 'm', 'r', 'z'}

In [66]:
a & b                   # lettres dans a et b, c'est intersection de a et b

{'a', 'c'}

In [67]:
a ^ b                   # lettres dans a ou dans b mais pas dans les deux

{'b', 'd', 'l', 'm', 'r', 'z'}

## Dictionnaires

Un autre type de données intégré à Python est le *dictionnaire*. Les dictionnaires sont parfois trouvés dans d’autres langages sous le nom de "mémoires associatives" ou "tableaux associatifs". A la différence des séquences, qui sont indexées par un intervalle numérique, les dictionnaires sont indexés par des *clés*, qui peuvent être de n’importe quel type non-modifiable ; les chaînes et les nombres peuvent toujours être des clés. Les tuples peuvent être utilisés comme clés s’ils ne contiennent que des chaînes, des nombres ou des tuples. Vous ne pouvez pas utiliser des listes comme clés, puisque les listes peuvent être modifiées en utilisant leur méthode **`append()`**.

Il est préférable de considérer les dictionnaires comme des ensembles non ordonnés de couples `clé:valeur`, avec la contrainte que les clés soient uniques (à l’intérieur d’un même dictionnaire). Un couple d’accolades crée un dictionnaire vide : `{}`. Placer une liste de couples `clé:valeur` séparés par des virgules à l’intérieur des accolades ajoute les couples initiaux `clé :valeur` au dictionnaire ; c’est aussi de cette façon que les dictionnaires sont affichés.

Les opérations principales sur un dictionnaire sont le stockage d’une valeur à l’aide d’une certaine clé et l’extraction de la valeur en donnant la clé. Il est aussi possible de détruire des couples `clé:valeur` avec **`del`**. Si vous stockez avec une clé déjà utilisée, l’ancienne valeur associée à cette clé est oubliée. C’est une erreur d’extraire une valeur en utilisant une clé qui n’existe pas.

La méthode **`keys()`** d’un objet de type dictionnaire retourne une liste de toutes les clés utilisées dans le dictionnaire, dans un ordre quelconque (si vous voulez qu’elle soit triée, appliquez juste la méthode **`sort()`** à la liste des clés). Pour savoir si une clé particulière est dans le dictionnaire, utilisez la méthode **`has_key()`** du dictionnaire.
Voici un petit exemple utilisant un dictionnaire :

In [69]:
tel = {'jack': 4098, 'sape': 4139}

In [71]:
tel['jack']  # tel[0] ne marche pas

KeyError: 0

In [72]:
tel['guido'] = 4127
tel

{'jack': 4098, 'sape': 4139, 'guido': 4127}

In [73]:
del (tel['sape'])
tel['irv'] = 4127
tel

{'jack': 4098, 'guido': 4127, 'irv': 4127}

In [74]:
tel.keys()

dict_keys(['jack', 'guido', 'irv'])

In [75]:
tel.values()

dict_values([4098, 4127, 4127])

In [77]:
'guido' in tel

True

Le constructeur **`dict()`** construit des dictionnaires directement à partir de listes de paires `clé:valeur` rangées comme des n-uplets. Lorsque les paires forment un motif, les *list comprehensions* peuvent spécifier de manière compacte la liste de clés-valeurs.

In [78]:
dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])

{'sape': 4139, 'guido': 4127, 'jack': 4098}

In [79]:
dict([(x, x**2) for x in (2, 4, 6)]) # utilisation de la list comprehension

{2: 4, 4: 16, 6: 36}

Lorsque les clés sont de simples chaînes il est parfois plus simple de spécifier les paires en utilisant des arguments à mot-clé :

In [80]:
dict(sape=4139, guido=4127, jack=4098)

{'sape': 4139, 'guido': 4127, 'jack': 4098}

## Techniques de boucles

Lorsqu’on boucle sur un dictionnaire, les clés et les valeurs correspondantes peuvent être obtenues en même temps en utilisant la méthode **`iteritems()`**

In [81]:
chevaliers = {'gallahad': 'le pur', 'robin': 'le brave'}
for c, v in chevaliers.items():
    print (c, v)

gallahad le pur
robin le brave


Lorsqu’on boucle sur une séquence, l’indice donnant la position et la valeur correspondante peuvent être obtenus en même temps en utilisant la fonction **`enumerate()`**.

In [None]:
for i, v in enumerate(['tic', 'tac', 'toe']):
    print (i, v)

Pour boucler sur deux séquences, ou plus, en même temps, les éléments peuvent être appariés avec la fonction **`zip()`**.

In [None]:
questions = ['nom', 'but', 'drapeau']
reponses = ['lancelot', 'le sacre graal', 'le bleu']
for q, r in zip(questions, reponses):
    print ("Quel est ton %s? C'est %s." % (q, r))

Pour boucler à l’envers sur une séquence, spécifiez d’abord la séquence à l’endroit, ensuite appelez la fonction **`reversed()`**.

In [None]:
for i in reversed(xrange(1,10,2)):
    print (i)

Pour boucler sur une séquence comme si elle était triée, utilisez la fonction **`sorted()`** qui retourne une liste nouvelle triée tout en laissant la source inchangée.

In [None]:
panier = ['pomme', 'orange', 'pomme', 'poire', 'orange', 'banane']
for f in sorted(set(panier)):
    print (f)

## Plus de détails sur les conditions (*)

Les conditions utilisées dans les instructions **`while`** et **`if`** peuvent contenir d’autres opérateurs en dehors des comparaisons.

Les opérateurs de comparaison **`in`** et **`not`** in vérifient si une valeur apparaît (ou non) dans une séquence. Les opérateurs **`is`** et **`is not`** vérifient si deux objets sont réellement le même objet ; cela se justifie seulement pour les objets modifiables comme les listes. Tous les opérateurs de comparaison ont la même priorité, qui est plus faible que celle de tous les opérateurs numériques.

Les comparaisons peuvent être enchaînées. Par exemple, `a < b == c` teste si `a` est strictement inférieur à `b` et de plus si `b` est égal à `c`.

Les comparaisons peuvent être combinées avec les opérateurs booléens **`and`** (et) et **`or`** (ou), et le résultat d’une comparaison (ou de n’importe quel autre expression Booléenne) peut être inversé avec **`not`** (pas). Ces opérateurs ont encore une fois une priorité inférieure à celle des opérateurs de comparaison ; et entre eux, **`not`** a la plus haute priorité, et **`or`** la plus faible, de sorte que `A and not B or C` est équivalent à `(A and (not B)) or C`. Bien sûr, les parenthèses peuvent être utilisées pour exprimer les compositions désirées.

Les opérateurs booléens **`and`** et **`or`** sont des opérateurs dits court-circuit : leurs arguments sont évalués de gauche à droite, et l’évaluation s’arrête dès que le résultat est trouvé. Par exemple, si `A` et `C` sont vrais mais que `B ` est faux, `A and B and C` n'évalue pas l'expression `C`. En général, la valeur de retour d'un opérateur court-circuit, quand elle est utilisée comme une valeur générale et non comme un booléen, est celle du dernier argument évalué.

Il est possible d’affecter le résultat d’une comparaison ou une autre expression booléenne à une variable. Par exemple

In [None]:
chaine1, chaine2, chaine3 = '', 'Trondheim', 'Hammer Dance'
non_null = chaine1 or chaine2 or chaine3
non_null

Notez qu’en Python, au contraire du C, les affectations ne peuvent pas être effectuées à l’intérieur des expressions. Les programmeurs C ronchonneront peut-être, mais cela évite une classe de problèmes qu’on rencontre dans les programmes C : écrire `=` dans une expression alors qu’il fallait `==`.

## Comparer les séquences et d’autres types (*)

Les objets de type séquence peuvent être comparés à d’autres objets appartenant au même type de séquence. La comparaison utilise l’ordre *lexicographique* : les deux premiers éléments sont d’abord comparés, et s’ils diffèrent cela détermine le résultat de la comparaison ; s’ils sont égaux, les deux éléments suivants sont comparés, et ainsi de suite, jusqu’à ce que l’une des deux séquences soit épuisée. Si deux éléments à comparer sont eux-mêmes des séquences du même type, la comparaison lexicographique est reconsidérée récursivement. Si la comparaison de tous les éléments de deux séquences les donne égaux, les séquences sont considérées comme égales. Si une séquence est une sous-séquence initiale de l’autre, la séquence la plus courte est la plus petite (inférieure). L’ordonnancement lexicographique pour les chaînes utilise l’ordonnancement ASCII pour les caractères. Quelques exemples de comparaisons de séquences du même type :

In [None]:
(1, 2, 3) < (1, 2, 4)

In [None]:
[1, 2, 3] < [1, 2, 4]

In [None]:
'ABC' < 'C' < 'Pascal' < 'Python'

In [None]:
(1, 2, 3, 4) < (1, 2, 4)

In [None]:
(1, 2) < (1, 2, -1)

In [None]:
(1, 2, 3) == (1.0, 2.0, 3.0)

In [None]:
(1, 2, ('aa', 'ab')) < (1, 2, ('abc', 'a'), 4)

Notez que la comparaison d’objets de types différents est licite. Le résultat est déterministe mais arbitraire : les types sont triés selon leur nom. Ainsi une liste (list) est toujours inférieure à une chaîne (string), une chaîne (string) est toujours inférieure à un n-uplet (tuple), etc. Les types numériques mélangés sont comparés en fonction de leur valeur numérique, ainsi 0 est égal à 0.0, etc.

*Ce notebook est une adaptation de la traduction française, dirigée par Olivier Berger et mise à jour par Henri Garreta, du tutoriel Python édité par Guido van Rossum et Fred L. Drake.*