# Listes

Les listes en Python sont un ensemble ordonnés d'objets. Les objets peuvent être de type variés. Une liste peux contenir une liste.

## Une liste est une séquence
* Une liste est délimité par des crochets `[]`
* Les éléments sont séparé par une virgule `,`
* Un élément peut être accédé par son indice `L[1]`
* Une list peut être vide `L=[]`

In [7]:
a = [10, 20, 30]
fruits = ['banane', 'orange', 'pomme']

In [4]:
a = [1, 12, 132]
a

[1, 12, 132]

In [8]:
fruits

['banane', 'orange', 'pomme']

In [16]:
fruits[2]

'pomme'

Une **indice** permet d'accéder à un élément de liste.

In [23]:
(a[1], b[2])

(20, 'pomme')

Une liste peux **contenir différents types** d'éléments.

In [28]:
c = [1, 1.2, True, None, 'abc', [], (), {}]
for i in c:
    print(i, '  -  ', type(i))

1   -   <class 'int'>
1.2   -   <class 'float'>
True   -   <class 'bool'>
None   -   <class 'NoneType'>
abc   -   <class 'str'>
[]   -   <class 'list'>
()   -   <class 'tuple'>
{}   -   <class 'dict'>


Une liste à l'intérieur d'une autre liste est dite **imbriquée**.

In [35]:
L = [1, 2, [3, 4]]
print(L[2])
print(L[2][0])

[3, 4]
3


Une liste qui ne contient aucun élément est une liste **vide**.

In [37]:
[]

[]

## Les listes sont modifiables

Contairement à une chaines de caractères, une liste est **modifiable**

In [38]:
a = [10, 20, 30]
a

[10, 20, 30]

In [39]:
a[1] = 'twenty'
a

[10, 'twenty', 30]

In [44]:
s = 'hello'
L = list(s)
L[1] = 'a'
L

['h', 'a', 'l', 'l', 'o']

Le deuxième élément `a[1]` contenant la valeur numérique 20 a été remplacé par une chaine `'twenty'`.

In [60]:
L = list(range(6))
print('L = ', L)
print('L[2:4] =', L[2:4])
L[3] = [1, 2, 3] 
print('L = ', L)

L =  [0, 1, 2, 3, 4, 5]
L[2:4] = [2, 3]
L =  [0, 1, 2, [1, 2, 3], 4, 5]


Un tranche d'une liste peux être remplacé par un élément.

In [53]:
L[3:7] = 'x'
L

[0, 1, 2, 'x', 7, 8, 9]

Un élément peux être remplacé par une liste.

In [61]:
b[4] = [10, 20]
b

[0, 1, 2, 3, [10, 20], 5, 6, 7, 8, 9]

Un élément peut être remplacé par une référence à une liste.

In [62]:
b[5] = a
b

[0, 1, 2, 3, [10, 20], [10, 'twenty', 30], 6, 7, 8, 9]

Si la liste insérée `a` est modifié, la liste contenante `b` est également modififiée.  
Une variable pour une liste ne contient donc pas une copie de la liste, mais une référence vers cette liste.

In [64]:
a

['xxx', 'twenty', 30]

## Parcourir une liste

La boucle `for` permet de parcourir une liste, exactement de la même façon comme pour les chaînes.

In [66]:
for i in b:
    print(i)

0
1
2
3
[10, 20]
['xxx', 'twenty', 30]
6
7
8
9


Pour modifier une liste, on a besoin de l'indice. La boucle parcourt la liste et multiplie chaque élément par 2.

In [69]:
n = len(b)
for i in range(n):
    b[i] = b[i] * 2
b

[0,
 4,
 8,
 12,
 [10, 20, 10, 20, 10, 20, 10, 20],
 ['xxxxxx',
  'twentytwenty',
  60,
  'xxxxxx',
  'twentytwenty',
  60,
  'xxxxxx',
  'twentytwenty',
  60,
  'xxxxxx',
  'twentytwenty',
  60],
 24,
 28,
 32,
 36]

Si une liste est vide, la boucle n'est jamais parcourue.

In [70]:
for x in []:
    print('this never prints')

**Exercice**  
Compare l'itération à travers: une liste `[1, 2, 3]`, une chaine de caractère `'abc'` et une plage `range[3]`


In [78]:
L = ['banane', 'orange', 'apple']
n = len(L)
for i in range(n):
    print(i, '=', L[i])
    L[i] *= 3
L

0 = banane
1 = orange
2 = apple


['bananebananebanane', 'orangeorangeorange', 'appleappleapple']

## Opérations sur listes
Les opérateurs d'adition `+` et de multiplication `*` des nombres, ont une interprétation différents pour les listes.

In [79]:
a = [1, 2, 3]
b = ['a', 'b']

L'opérateur `+` concatène des listes.

In [80]:
a+b

[1, 2, 3, 'a', 'b']

L'opérateur `*` répète une liste.

In [81]:
b * 3

['a', 'b', 'a', 'b', 'a', 'b']

In [98]:
def null(n):
    return [[0] * n] * n

null(5)

[[0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0]]

In [103]:
def identity(n):
    L = null(n)
    for i in range(n):
        L[i][i] = 1
    return L

identity(5)

[[1, 1, 1, 1, 1],
 [1, 1, 1, 1, 1],
 [1, 1, 1, 1, 1],
 [1, 1, 1, 1, 1],
 [1, 1, 1, 1, 1]]

La fonction `list` transforme un itérable comme `range(10)` en vraie liste.

In [104]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

La fonction `list` transforme aussi des chaines en vraie liste.

In [105]:
list('hello')

['h', 'e', 'l', 'l', 'o']

## Tranches de listes

In [106]:
t = list('abcdef')
t

['a', 'b', 'c', 'd', 'e', 'f']

L'opérateur de **tranche** `[m:n]` peut être utilisé avec des listes.

In [107]:
t[1:3]

['b', 'c']

Tous les éléments depuis le début:

In [108]:
t[:4]

['a', 'b', 'c', 'd']

Tous les éléments jusqu'à la fin:

In [109]:
t[4:]

['e', 'f']

In [110]:
a = list(range(10))
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [111]:
a[:4]

[0, 1, 2, 3]

In [118]:
a[2:10:3]

[2, 5, 8]

## Méthodes de listes

La méthode `append` ajoute un élément à la fin d'une liste.

In [119]:
a = [1, 2, 3]
a.append('a')
a

[1, 2, 3, 'a']

La méthode `extent` ajoute les éléments d'une liste à la fin d'une liste.

In [120]:
a.extend([10, 20])
a

[1, 2, 3, 'a', 10, 20]

La méthode `sort` trie les éléments d'une liste. Elle ne retourne pas une nouvelle liste trié, mais modifie la liste.

In [121]:
c = [23, 12, 54, 2]
c.sort()
c

[2, 12, 23, 54]

Le paramètre optionnel `reverse` permet d'inverser l'ordre du tri.

In [126]:
c.sort(reverse=True)
c

[54, 23, 12, 2]

On peut trier des lettres

In [137]:
print(1, 2, 3, sep=' ')

1 2 3


In [None]:
a = list('world')
a.sort()
a

La pluspart des méthodes de liste renvoie rien (`None`).

In [None]:
b = a.sort()
print(a)
print(b)

La méthode `sorted(L)` par contre retourne une nouvelle list trié.

In [None]:
a = list('world')
b = sorted(a)
print(a)
print(b)

## Mapper, filtrer et réduire

Pour additionner toutes les éléments d'une liste vous pouvez initialiser la variable `total` à zéro, et additionner à chaque itération un élément de la liste. Une variable utilisée d'une telle façon est appelé un **accumulateur**.

In [None]:
def somme(t):
    total = 0
    for i in t:
        total += i
    return total

In [None]:
b = [1, 2, 32, 42]
somme(b)

L'addition des éléments d'une liste est fréquente et Python proprose une fonction `sum`.

In [None]:
sum(b)

In [None]:
def tout_en_majuscules(t):
    """t: une liste de mots."""
    res = []
    for s in t:
        res.append(s.capitalize())
    return res

In [None]:
tout_en_majuscules(['good', 'hello', 'world'])

La méthode `isupper` est vrai si toutes les lettres sont majuscules. 

In [None]:
def seulement_majuscules(t):
    res = []
    for s in t:
        if s.isupper():
            res.append(s)
    return res

In [None]:
b = ['aa', 'AAA', 'Hello', 'HELLO']
seulement_majuscules(b)

Une fonction comme `seulement_majuscules` s'appelle **filtre** car elle sélectionne certains éléments seuelement.

## Supprimer des éléments

Avec la méthode `pop` vous pouvez supprimer un élément.

In [None]:
a = list('hello')
a

La méthode `pop` modifie la liste et retourne un élément. Utilisé sans argument `pop` enlève le dernière élément de la liste.

In [None]:
a.pop()

In [None]:
a

Utilisé avec un argument, c'est cet élément qui est enlevé de la liste.

In [None]:
a.pop(0)

In [None]:
a

L'opérateur `del` permet également de supprimer un élément.

In [None]:
del(a[0])

In [None]:
a

## Liste de chaines de caractères

Une chaîne est une séquence de caractères, et de caractères uniquement. Une liste par contre est une séquence de n'importe quel type d'éléments. La fonction `list` permet de transformer un itérable comme une chaîne en liste.

In [None]:
s = 'spam'
print(s)
print(list(s))

Comme `list` est le nom d'une fonction interne, il ne faut pas l'utiliser comme nom de variable. 

Evitez d'utiliser la petite lettre L (`l`), car elle est pratiqument identique avec le chiffre un (`1`), donc ici le `t` est utilisé à la place.

La fonction `split` permet de découper une phrase en mots et de les retourner dans une liste. 

In [None]:
s = 'je suis ici en ce moment'
t = s.split()
t

`join` est l'inverse de `split`. 

In [None]:
' - '.join(t)

## Objets et valeurs
Deux variables qui font référence à la même chaine pointent vers le même objet. L'opérateur `is` retourne vrai si les deux variables pointent vers le même objet. 

In [None]:
a = 'banane'
b = 'banane'
a is b

Deux variables qui sont initialisé avec la même liste ne sont pas les même objets.

In [None]:
a = [1, 2, 3]
b = [1, 2, 3]
a is b

Dans ce cas on dit que les deux listes sont **équivalentes**, mais pas identiques, car il ne s'agit pas du même objet.

## Aliasing

Si une variable est initialisé avec une autre variable, alors les deux pointent vers le même objet.

In [None]:
a = [1, 2, 3]
b = a
a is b

Si un élément de `b` est modifié, la variable `a` change également.

In [None]:
b[0] = 42
print(a)
print(b)

L'association entre une variable est un objet s'appelle **référence**. Dans cet exemple il existent deux références `a` et `b` vers le même objet.

Si les objets sont immuable (chaines, tuples) ceci ne pose pas de problème, mais avec deux variables qui font référence à la même liste, il faut faire attention de ne pas modifier une par inadvertance.

## Arguments de type liste

Si une liste est passée comme argument de fonction, la fonction peut modifier la list.

In [None]:
def modifie_list(t):
    t[0] *= 2  # multiplie par deux
    t[1] = 42  # nouveelle affectation
    del t[2]   # suppression

In [None]:
a = [1, 2, 3, 4, 5]
print(a)
modifie_list(a)
a

In [None]:
b = list('abcde')
modifie_list(b)
b

La méthode `append` modifie une liste, mais l'opérateur `+` crée une nouvelle liste.

In [None]:
a = [1, 2]
b = a.append(3)
print('a =', a)
print('b =', b)

`append` modifie la liste et retourne `None`.

In [None]:
b = a + [4]
print('a =', a)
print('b =', b)

## Exercices

**Exercice 1**  
Écrivez une fonction appelée `nested_sum` qui prend une liste de listes d'entiers et additionne les éléments de toutes les listes imbriquées.

In [154]:
def nested_sum(L):
    s = 0
    for sublist in L:
        for item in sublist:
            s = s + item
        #print(sublist, s)
    return s

In [155]:
t = [[1, 2], [3], [4, 5, 6]]
nested_sum(t)

21

**Exercice 2**  
Écrivez une fonction appelée `cumsum` qui prend une liste de nombres et renvoie la somme cumulative ; c'est-à-dire une nouvelle liste où le n-ième élément est la somme des premiers n + 1 éléments de la liste originale. 

In [None]:
def cumsum(t):
    pass

In [None]:
t = range(5)
cumsum(t)

**Exercice 3**  
Écrivez une fonction appelée `middle` qui prend une liste et renvoie une nouvelle liste qui contient tous les éléments, sauf le premier et le dernier.

In [None]:
def middle(t):
    pass

In [None]:
t = list(range(10))
print(t)
print(middle(t))
print(t)

**Exercice 4**  
Écrivez une fonction appelée `chop` qui prend une liste, la modifie en supprimant le premier et le dernier élément, et retourne `None`.

In [None]:
def chop(t):
    pass

In [None]:
t = list(range(10))
print(t)
print(chop(t))
print(t)

**Exercice 5**  
Écrivez une fonction appelée `is_sorted` qui prend une liste comme paramètre et renvoie True si la liste est triée par ordre croissant et False sinon. 

In [None]:
def is_sorted(t):
    pass

In [None]:
is_sorted([11, 2, 3])

**Exercice 6**  
Deux mots sont des anagrammes si vous pouvez réarranger les lettres de l'un pour en former l'autre (par exemple ALEVIN et NIVELA sont des anagrammes). Écrivez une fonction appelée `is_anagram` qui prend deux chaînes et renvoie `True` si ce sont des anagrammes.

In [None]:
def is_anagram(s1, s2):
    pass

In [None]:
is_anagram('ALEVIN', 'NIVELA')

In [None]:
is_anagram('ALEVIN', 'NIVEL')

**Exercice 7**  
Écrivez une fonction appelée `has_duplicates` qui prend une liste et renvoie `True` s'il y a au moins un élément qui apparaît plus d'une fois. La méthode ne devrait pas modifier la liste originale.

In [None]:
def has_duplicates(t):
    pass

In [None]:
t = [1, 2, 3, 4, 1]
has_duplicates(t)

In [None]:
t = [1, 2, 3, 4, '1']
has_duplicates(t)

**Exercice 8**  
Cet exercice est relatif à ce que l'on appelle le paradoxe des anniversaires, au sujet duquel vous pouvez lire sur https://fr.wikipedia.org/wiki/Paradoxe_des_anniversaires .

S'il y a 23 étudiants dans votre classe, quelles sont les chances que deux d'entre vous aient le même anniversaire ? Vous pouvez estimer cette probabilité en générant des échantillons aléatoires de 23 anniversaires et en vérifiant les correspondances. Indice : vous pouvez générer des anniversaires aléatoires avec la fonction randint du module random.

In [None]:
import random

def birthdays(n):    
    pass

In [None]:
m = 1000
n = 0
for i in range(m):
    pass
        
print(n/m)

**Exercice 9**
Écrivez une fonction qui lit le fichier mots.txt du chapitre précédent et construit une liste avec un élément par mot. Écrivez deux versions de cette fonction, l'une qui utilise la méthode append et l'autre en utilisant la syntaxe `t = t + [x]`. Laquelle prend plus de temps pour s'exécuter ? Pourquoi ? 

In [None]:
%%time
fin = open('mots.txt')
t = []
for line in fin:
    pass
    
len(t)

In [None]:
%%time
fin = open('mots.txt')
t = []
i = 0
for line in fin:
    pass

La deuxième version devient de plus en plus lente car elle doit chaque fois copier et créer une nouvelle liste. 

**Exercice 10**
Pour vérifier si un mot se trouve dans la liste de mots, vous pouvez utiliser l'opérateur `in` , mais cela serait lent, car il vérifie les mots un par un dans l'ordre de leur apparition.

Si les mots sont dans l'ordre alphabétique, nous pouvons accélérer les choses avec une recherche dichotomique (aussi connue comme recherche binaire), qui est similaire à ce que vous faites quand vous recherchez un mot dans le dictionnaire. Vous commencez au milieu et vérifiez si le mot que vous recherchez vient avant le mot du milieu de la liste. Si c'est le cas, vous recherchez de la même façon dans la première moitié de la liste. Sinon, vous regardez dans la seconde moitié.

Dans les deux cas, vous divisez en deux l'espace de recherche restant. Si la liste de mots a 130 557 mots, il faudra environ 17 étapes pour trouver le mot ou conclure qu'il n'y est pas.

Écrivez une fonction appelée `in_bisect` qui prend une liste triée et une valeur cible et renvoie l'index de la valeur dans la liste si elle s'y trouve, ou si elle n'y est pas. N'oubliez pas qu'il faut préalablement trier la liste par ordre alphabétique pour que cet algorithme puisse fonctionner ; vous gagnerez du temps si vous commencez par trier la liste en entrée et la stockez dans un nouveau fichier (vous pouvez utiliser la fonction sort de votre système d'exploitation si elle existe, ou sinon le faire en Python), vous n'aurez ainsi besoin de le faire qu'une seule fois.

In [None]:
fin = open('mots.txt')
t = []
for line in fin:
    mot = line.strip()
    t.append(mot)
t.sort()
len(t)

In [None]:
def in_bisect(t, val):
    a = 0
    b = len(t)-1
    
    while b > a:
        i = (b+a) // 2
        print(t[a], t[i], t[b], sep=' - ')

        if val == t[i]:
            return True
        if val > t[i]:
            a = i
        else:
            b = i
          
    return False

in_bisect(t, 'MAISON')