<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat &amp; Arnaud Legout</span>
</div>

# les listes

* permet de créer une liste de n’importe quels objets
  * techniquement, c’est un tableau de pointeurs vers les objets
  * les listes sont dynamiques, de taille variable
  * comme une liste est un objet, on peut avoir une liste de listes

### les listes

In [None]:
L = []
L = [4, 'bob', 10 + 1j, True]

In [None]:
L

In [None]:
# les indices en python
# commencent à 0
L[2]

In [None]:
L[0] = 10

In [None]:
L

# modification des listes

In [None]:
L

In [None]:

L[2:]

In [None]:
L[2:] = [6, 7, 8, 'alice']
L

In [None]:
L[1:4] = []
L

#### attention

* `L[i] = L2`
  * **remplace** le i-ème élément de `L` par la liste `L2`
* `L[i:j] = L2`
  * **insère** tous les éléments de la liste `L2` à la position `i`
  * après avoir supprimé les éléments `i` jusqu’à `j-1` dans `L`

### modification des listes

In [None]:
L = [1, 2, 3, 4, 5]
L

In [None]:
L[2:4] = [10, 11, 12]
L

In [None]:
L[3] = [3, 4]
L

In [None]:
%load_ext ipythontutor

In [None]:
%%ipythontutor curInstr=1 width=800
L = [1, 2, 3, 4, 5]
L[2:4] = [10, 11, 12]
L[3] = [3, 4]


# méthodes sur les listes

* toutes les méthodes sur les séquences
* optimisé pour les ajouts **à la fin** de la liste

In [None]:
L = []
for i in range(4):
    L.append(i)

In [None]:
while L:
    print(L.pop())

si nécessaire, envisager la liste **doublement chainée**

In [None]:
from collections import deque
deque?

### méthodes sur les listes

* des méthodes spécifiques aux types mutables  
  (modifications *in-place*)

  * `L.append(x)` ajoute `x` à la fin de `L`
  * `L.extend(L2)` ajoute chaque élément de `L2` à la fin de `L`
  * `L.insert(i, x)` ajoute x à la position `i`
  * `L.sort()`  trie `L`
  * `L.reverse()` renverse les éléments de `L`

### méthodes sur les listes

* `L.pop(i)` supprime l’élément à la position `i`, si i n’est pas fourni, supprime le dernier élément. La fonction retourne l’élément supprimé
  * utilisé pour faire une pile d’éléments
* `L.remove(x)` supprime la première occurrence de `x` dans `L`. S’il n’y a pas de `x`, une exception est retournée
* `del L[i:j:k]` supprime tous les éléments entre `i` et `j-1` par pas de `k` éléments
  * si `i == j` supprime l’élément `i`

# digression: `range()`

* `range()` est une fonction *builtin* ou native
* qui retourne un objet **itérateur**
* c'est-à-dire sur lequel on peut faire un `for`
* on y reviendra longuement

In [None]:
for i in range(4):
    print(i, end=" ")

### digression: `range()`

* essentiellement, **même logique que le slicing**
* `range(j)` balaie de `0` à `j-1`
* `range(i, j)` balaie de `i` à `j-1`
* `range(i, j, k)` balaie de `i` à `j-1` par pas de `k`
* pour obtenir une liste on transforme (*cast*)  
  en liste en appelant `list()`

In [None]:
for i in range(1, 21, 5):
    print(i, end=" ")

In [None]:
list(range(1, 21, 5))

# méthodes sur les listes

In [None]:
L = list(range(5))
L.append(100)
L

In [None]:
# comme si append(10)
#     puis append(20)
L.extend([10, 20])
L

In [None]:
L.remove(10)
L

In [None]:
L.sort()
L

# tri sur les listes

* le tri des listes est très puissant en Python
  * tri **en place** méthode `list.sort()`
* il a aussi la fonction built-in `sorted()`  
  qui trie toutes les séquences

In [None]:
L = [10, -5, 3, 100]

# tri en place
L.sort()
L

In [None]:
L1 = [10, -5, 3, 100]

# crée une copie
L2 = sorted(L1)
print(L1)
print(L2)

* https://docs.python.org/3.5/howto/sorting.html

# avertissement sur les listes

* outil très très pratique
* **mais** parfois (souvent) pas nécessaire
* car nécessite de la mémoire
* alors qu'on veut juste itérer sur le contenu
* dans ce cas, techniques + adaptées : itérateurs et autres générateurs
* sujet avancé que l’on verra plus tard

# les tuples

* comme des listes, mais **immutables**
* syntaxe: `()` au lieu de `[]`
* mais attention si un seul élément

In [None]:
# syntaxe pour un tuple vide
T = ()
T

In [None]:
# syntaxe pour un singleton
T1 = (4,)
# ou encore
T2 = 4,

T1 == T2

* **attention** `(4)` est un **entier** et `(4,)` est un **tuple**
* c'est la virgule qui est importante
* on peut omettre les `()` - la plupart du temps

### les tuples

In [None]:
# syntaxe pour plusieurs éléments
T1 = (3, 5, 'alice', 10+1j)
# ou encore
T2 =  3, 5, 'alice', 10+1j
# ou encore
T3 =  3, 5, 'alice', 10+1j,

In [None]:
T1 == T2

In [None]:
T1 == T3


* un tuple est **non mutable**
* les fonctions faisant des modifications *in-place* ne s’appliquent donc pas aux tuples


In [None]:
try: T1[3] = 5   # python n'est pas content
except Exception as e: print("OOPS", e)

# problème avec les séquences 

In [None]:
a = range(30000000)
'x' in a      # c’est long !

In [None]:
a[3]          # on peut utiliser un indice entier

In [None]:
a = []
# on ne peut pas indexer avec un nom ou autre chose qu'un entier
try:
    a['alice'] = 10
except TypeError as e:
    print("OOPS", e)

# problème avec les séquences

* une séquence est une liste ordonnée d’éléments  
  indexés par des entiers

  * les recherches sont longues *O(n)*
  * impossible d’avoir un index autre qu’entier
  * comment faire, par exemple, un annuaire ?
* on voudrait
  * une insertion, effacement et recherche en *O(1)*
  * une indexation par clef quelconque

# la solution : les tables de hash

* une table de hash T indexe des valeurs par des clefs
  * chaque clef est unique
  * T[clef] = valeur
  * insertion, effacement, recherche en O(1)

# table de hash

![hash](pictures/hash.png)

# table de hash

* la fonction de hash *f()* choisie de façon à ce que
  * *f(key, size)* retourne toujours la même valeur 
  * *key* doit être **immutable**
* minimise le risque de collision
  * *f(key1, size)* == *f(key2, size)*
* une bonne façon de minimiser les collisions  
  est de garantir une distribution uniforme

# table de hash et Python

* le dictionnaire `dict` est une table de hash  
  qui utilise comme clef un **objet immutable**  
  et comme valeur n’importe quel objet

  * association clé → valeur  

* l'ensemble `set` est une table de hash  
  qui utilise comme clef un **objet immutable**  
  et qui n’associe pas la clef à une valeur

  * notion d’ensemble mathématique

# le `set`

* collection non ordonnée d’objets uniques et **immutables**
* utile pour tester l’appartenance
  * optimisé, beaucoup + rapide que `list`
* et éliminer les entrées doubles d’une liste
* test d’appartenance plus rapide que pour les listes
* les sets autorisent les opérations sur des ensembles
  * union (|), intersection (&), différence (-), etc.

### le `set`

In [None]:
# attention: {} c'est 
# un DICTIONNAIRE vide 
set()          # ensemble vide

In [None]:
L1 = [1, 2, 3, 1, 1, 6, 4]
S1 = set(L1)
S1

### le `set`

In [None]:
# attention: il faut passer 
# à set UN itérable
try:
    S = set(1, 2, 3, 4, 5)
except Exception as exc:
    print(f"OOPS {type(exc)}")    

### le `set`

In [None]:
S1


In [None]:
L2 = [3, 4, 1]
S2 = set(L2)
S2

In [None]:
4 in S2

In [None]:
S1 - S2            # différence

In [None]:
S1 | S2            # union

In [None]:
S1 & S2            # intersection

### le `set`: méthodes

In [None]:
# ensemble littéral
S3 = {1, 2, 3, 4}        
S3

In [None]:
# ajout d'un élément

S3.add('spam')
S3

In [None]:
# pas de duplication
# et pas d'ordre particulier
S3.update([10, 11, 10, 11])
S3

In [None]:
S3.remove(11)
S3

### le `set`

* un `set` est un objet **mutable**
* le `frozenset` est équivalent mais **non mutable**
* un peu comme `list` et `tuple`
* par exemple pour servir de clé dans un hash

In [None]:
fs = frozenset([1, 2, 3, 4])

In [None]:
# frozenset pas mutable
try:
    fs.add(5)
except AttributeError as e:
    print("OOPS", e)   

# rapide test de performance

pour la recherche d’un élément  
les sets sont **beaucoup plus rapides**

In [None]:
import timeit

In [None]:
timeit.timeit(setup= "x = list(range(100000))", stmt = '"c" in x',
              number = 300)

In [None]:
timeit.timeit(setup= "x = set(range(100000))", stmt = '"c" in x',
              number = 300)

### rapide test de performance

In [None]:
timeit.timeit(setup= "x = list(range(2))", stmt = '"c" in x',
              number = 6000000)

In [None]:
timeit.timeit(setup= "x = set(range(2))", stmt = '"c" in x',
              number = 6000000)

même si la liste est très petite

### remarque 

avec `ipython` vous pouvez faire vos benchmarks un peu plus simplement

In [None]:
# en Python pur

timeit.timeit(setup= "x = set(range(2))", stmt = '0 in x',
              number = 6000000)

In [None]:
# avec ipython / notebook vous pouvez 
# faire comme ceci à la place

x = set(range(2))
%timeit -n 6000000 0 in x

# les dictionnaires

* généralisation d’une table de hash
* collection non ordonnée d’objets
* techniquement, uniquement les pointeurs sont stockés, mais pas une copie des objets
* on accède aux objets à l’aide d’une clef (et non d’un indice comme pour une liste)
* une **clef** peut être n’importe quel objet **immutable**: chaîne, nombre, tuple d’objets immutables...
* c’est une structure de données très puissante
* le dictionnaire est un type **mutable**

### les dictionnaires

* on peut voir les dictionnaires comme une collection non ordonnée de couples (clef, valeur)
* chaque clef est unique** et permet d’accéder à **une** valeur qui pointe vers un objet

### les dictionnaires

* construction

In [None]:
# ATTENTION : {} est pas un ensemble
# les dictionnaires étaient là avant les ensembles !
D = {}
D

In [None]:
# un dictionnaire créé de manière littérale
{ 'douze' : 12, 1: 'un', 'liste' : [1, 2, 3] }

In [None]:
# une autre façon quand 
# les clés sont des chaînes
dict( a = 'A', b = 'B')

In [None]:
# à partir d'une liste de couples
dict( [ ('a', 'A'), ('b', 'B') ] )

### méthodes sur les dictionnaires

* `len(D)` retourne le nombre de clefs dans D
* `D[clef]` retourne la valeur pour la clef
* `D[clef] = x` change la valeur pour la clef
* `del D[clef]` supprime la clef et la valeur
* `clef in D` teste l’existence de clef dans D
* `clef not in D` teste la non existence
* `D.copy()` *shallow copy* de D

In [None]:
d = {'alice': 35, 'bob' : 9, 'charlie': 6}
d

In [None]:

len(d)

In [None]:
d['alice']

In [None]:
'bob' in d

In [None]:
d['jim'] = 32
d

In [None]:
del d['jim']
d

### méthodes sur les dictionnaires

* `D.get(clef)`
  * retourne la valeur associée à cette clé si elle est présente, `None` sinon
  * notez bien que `D[clef]` lance une exception si la clé n'est pas présente
  * `D.get(clef, un_truc)` retourne `un_truc` quand la clé n'est pas présente

In [None]:
d

In [None]:
# la clé n'est pas présente
try:
    d['marc']
except KeyError as e:
    print("OOPS", e)

In [None]:
# on peut utiliser `get` plutôt si on préfère un retour de fonction
d.get('marc', '?')

### méthodes sur les dictionnaires

In [None]:
from collections import defaultdict

# les valeurs sont des listes
dd = defaultdict(list)
# ici on n'a pas encore de valeur 
# pour la clé '0' mais defaultdict 
# crée pourr nous à la volée une liste vide
dd[0].append(1)
dd[0]

### méthodes sur les dictionnaires

* `D.items()` retourne **une vue** sur les (clef, valeur) de `D`
* `D.keys()` retourne une vue sur les clefs de `D`
* `D.values()` retourne une vue sur les valeurs de `D`

# qu’est-ce qu’une vue ?

* c’est un objet qui donne une vue **dynamique** sur un dictionnaire `D`
  * permet le test d’appartenance avec `in`
  * permet l’itération (une vue est itérable)
* si on ne modifie pas `D` en cours d’itération
  * on a la garantie d’itérer dans le même ordre sur les clefs et sur les valeurs

In [None]:
clefs = d.keys()
clefs

In [None]:
d['bob'] = 20
d

In [None]:
clefs

### méthodes sur les dictionnaires

* [beaucoup d’autres méthodes](https://docs.python.org/3/tutorial/datastructures.html#dictionaries)

### ordre des éléments dans un dictionnaire

##### remarque d'ordre historique

* jusque et y-compris 3.5, un dictionnaire ne préservait pas l'ordre
  * ce qui est logique par rapport à la technologie de hachage
  * mais peut être déroutant pour les débutants, - et les autres aussi...
* depuis 3.6, l'ordre de création est préservé
  * d'abord annoncé comme un "détail d'implémentation"
* maintenant (3.7) annoncé comme un *feature* sur laquelle on peut compter