<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat &amp; Arnaud Legout</span>
</div>

In [None]:
from plan import plan; plan("syntaxe", "itération")

# les itérations en Python

* la boucle `for` est la méthode **préférée**   
  pour itérer sur un ensemble de valeurs

* en général préférable au `while` en Python
  * on peut faire un `for` sur n'importe quel itérable
  * ce n'est pas le cas pour le `while`
  * dans ce cas c'est l'itérable qui se charge de la logique
* de nombreuses techniques pour itérer de manière optimisée
  * compréhensions
  * itérateurs
  * générateurs

## la boucle `for`

```python
for item in iterable:
    bloc
    aligné
else:
    bloc     # exécuté lorsque la boucle sort "proprement"
    aligné   # c'est-à-dire pas avec un break
```

In [None]:
liste = [10, 20, 40, 80, 120]
for item in liste:
    print(item, end=" ")

In [None]:
# et **non pas** d'ailleurs:
for i in range(len(liste)):
    item = liste[i]
    print(item, end=" ")    

### boucle `for`

C'est quoi un itérable ?

* par définition, c'est un objet .. sur lequel on peut faire un `for`
* notamment avec les séquences natives : chaînes, listes, tuples, ensembles
* et aussi dictionnaires, et des tas d'autres objets, mais patience

In [None]:
chaine = "un été"
for char in chaine:
    print(char, end=" ")

In [None]:
# attention, ordre pas garanti
ensemble = {10, 40, 80} 
for element in ensemble:
    print(element, end=" ")

### boucle `for` sur un dictionnaire

* on peut facilement itérer sur un dictionnaire
* mais il faut choisir si on veut le faire 
  * sur les clés,
  * sur les valeurs,
  * ou sur les deux
* c'est à ça que servent les méthodes
  * `keys()`
  * `values()`
  * `items()`

### boucle `for` sur un dictionnaire

In [None]:
agenda = {
    'paul': 12, 
    'pierre': 14,
    'jean': 16,
}

In [None]:
# l'unpacking permet d'écrire 
# un code élégant
for key, value in agenda.items():
    print(f"{key} → {value}")

---

In [None]:
# un raccourci
for key in agenda:      # ou agenda.keys()
    print(key, end=" ")

In [None]:
for value in agenda.values():
    print(value, end=" ")

### opérations sur les itérables

Python propose des outils pour **créer** et **combiner** les itérables:

* fonctions natives *builtin* :
  * `range`, `enumerate`, et `zip`
* dans un module dédié `itertools`:
  * `chain`, `cycle`, ...

### `range`

* `range` crée un itérable qui itère sur des nombres entiers
* arguments: même logique que le slicing
  * début (inclus), fin (exclus), pas
* curiosité:
  * si un seul argument, c'est **la fin**

In [None]:
# les nombres pairs de 10 à 20
for i in range(10, 21, 2):
    print(i, end=" ")

In [None]:
# le début par défaut est 0
for i in range(5):
    print(i, end=" ")

### un itérateur n'est **pas une liste**

* l'objet retourné par `range` **n'est pas une liste**
* au contraire il crée un objet tout petit
* qui contient seulement la logique de l'itération
* la preuve:

In [None]:
iterateur = range(10**20)
iterateur

In [None]:
for item in iterateur:
    if item >= 5:
        break
    print(item, end=" ")

### un itérateur n'est **pas une liste**

Du coup un itérateur peut même .. ne jamais terminer:

In [None]:
from itertools import count

In [None]:
for i in count():
    print(i, end=" ")
    if i >= 5:
        break

### quand **ne pas** utiliser `range` 

C'est un rappel, mais:


In [None]:
# les débutants ont parfois 
# tendance à faire ceci qui
# est **très vilain !!**

for i in range(len(L)):
    print(L[i])

In [None]:
# au lieu de tout simplement
for item in L:
    print(item)

* voir [une revue de code intéressante ici](http://sametmax.com/revue-de-code-publique/)

### `enumerate`

* si on a vraiment besoin de l'index, il suffit d'utiliser la *builtin* `enumerate`

In [None]:
L = [1, 10, 100, 1000]
# quand on a besoin de l'indice dans la boucle
for i in range(len(L)):
    print("{}: {}".format(i, L[i]))

In [None]:
# on utiliser enumerate
for i, item in enumerate(L):
    print("{}: {}".format(i, item))

![](pictures/iter-enumerate.png)

### `enumerate`

* typiquement utile sur un fichier
* pour avoir le numéro de ligne 
* remarquez le deuxième argument de `enumerate` pour commencer à 1 

In [None]:
with open("data/une-charogne2.txt") as feed:
    for lineno, line in enumerate(feed, 1):
        print(f"{lineno}:{line}", end="")

# `zip`

`zip` fonctionne un peu comme `enumerate` mais entre deux itérables:

![](pictures/iter-zip.png)

### `zip`

In [None]:
liste1 = [10, 20, 30]
liste2 = [100, 200, 300]

In [None]:
for a, b in zip(liste1, liste2):
    print(f"{a}x{b}", end=" ")

**NOTES**: 

* `zip` fonctionne avec autant d'argument qu'on veut
* elle s'arrête dès que l'entrée la plus courte est épuisée
* du coup on pourrait voir `enumerate` comme: 
  * `enumerate(iterable)` $\Leftrightarrow$ `zip(count(), iterable)`

# le module `itertools`

On trouve dans le module `itertools` plusieurs utilitaires très pratiques:

* `chain` pour chainer plusieurs itérables
* `cycle` pour rejouer un itérable en boucle

In [None]:
from itertools import chain, cycle
data1 = (10, 20, 30)
data2 = (100, 200, 300)

In [None]:
for i, d in enumerate(chain(data1, data2)):
    print(f"{i}x{d}", end=" ")

In [None]:
for i, d in enumerate(cycle(data1)):
    print(f"{i}x{d}", end=" ")
    if i >= 8:
        break

### le module `itertools`

Le module `itertools` propose aussi quelques combinatoires usuelles:

* `product`: produit cartésien de deux itérables
* `permutations`: les permutations ($n!$)
* `combinations`: *p parmi n*
* et d'autres... 
* https://docs.python.org/3/library/itertools.html

### le module `itertools`

In [None]:
from itertools import product

dim1 = (1, 2, 3)
dim2 = (10, 20, 30)

for i, (d1, d2) in enumerate(product(dim1, dim2)):
    print(f"i={i}, d1={d1} d2={d2}")

### exercice: code de Vigenère

Voir [sur wikipedia](https://fr.wikipedia.org/wiki/Chiffre_de_Vigen%C3%A8re)

In [None]:
from string import ascii_lowercase
ascii_lowercase

In [None]:
from string import ascii_letters
ascii_letters

In [None]:
ord('a')

In [None]:
chr(97)

# boucles `for` : limite importante

* **règle très importante:** à l'intérieur d'une boucle
* il ne faut **pas modifier l’objet** sur lequel on itère
* on peut, par contre, en faire une copie

ce code-ci provoque une boucle infinie
```
L = ['a', 'b', 'c']
for i in L:
    if i == 'c':
        L.append(i)
```

In [None]:
# il suffit de prendre la précaution
# de faire une shallow copie
L = ['a', 'b' , 'c']
for i in L[:]:
    if i == 'c':
        L.append(i)
L

# exemple de boucles

In [None]:
# boucle (1)
for n in range(2, 10):
    # boucle (2)
    for x in range(2, n):
        if n % x == 0:
            print(n, ' = ' , x , '*', n//x)
            # on sort de la boucle (2)
            break
    else:
        print(n, 'est un nombre premier')

# compréhensions

très fréquemment on veut construire un mapping

* appliquer une fonction à un ensemble de valeurs: `map`

![](pictures/iter-map.png)

* idem en excluant certaines entrées: `map` + `filter`

![](pictures/iter-map-filter.png)

### compréhension de liste

c'est le propos de la compréhension (de liste):

```python
[expression(x) for x in iterable
                 if condition(x)]
```

Équivalent à 

```python
result = []
for x in iterable:
    if condition(x):
        result.append(expression(x))
```

### compréhensions de liste

In [None]:
[x**3 for x in range(6) if x % 2 == 0]

In [None]:
result = []
for x in range(6):
    if x % 2 == 0:
        result.append(x**3)
result

### compréhension de liste

* la clause `if condition` est bien entendu optionnelle
* on peut imbriquer plusieurs niveaux de boucle
  * la profondeur du résultat dépend du nombre de `[`

In [None]:
# une liste toute plate comme résultat
# malgré deux boucles for imbriquées
[x+y for x in (1, 2) for y in (3, 4)]

### compréhensions imbriquées

l'ordre dans lequel se lisent les compréhensions imbriquées:

In [None]:
[(x, y) for x in range(7) 
        if x % 2 == 0 
            for y in range(x) 
                if y % 2 == 1]

In [None]:
# est équivalent à
L = []
for x in range(7):
    if x % 2 == 0:
        for y in range(x):
            if y % 2 == 1:
                L.append((x, y))
L

### compréhension d'ensemble

même principe exactement, mais avec des `{}` au lieu des `[]`

In [None]:
# en délimitant avec des {} on construit 
# compréhension d'ensemble
{x**2 for x in range(-4, 5) if x % 2 == 0}

In [None]:
# attention, {} est un dict
result = set()

for x in range(-4, 5):
    if x % 2 == 0:
        result.add(x**2)
        
result
        

### compréhension de dictionnaire

syntaxe voisine, avec un `:` pour associer clé et valeur

In [None]:
# créer une table qui permet un accès direct à partir du nom
personnes = [
    {'nom': 'Martin', 'prenom': 'Julie', 'age': 18},
    {'nom': 'Dupont', 'prenom': 'Jean', 'age': 32},
    {'nom': 'Durand', 'prenom': 'Pierre', 'age': 25},  
]

hash = {personne['nom']: personne for personne in personnes}
hash

In [None]:
hash['Martin']

### performance des compréhensions

In [None]:
# une fonction qui ne parcourt pas
# entièrement son entrée
def search_100(iterable):
    for i in iterable:
        if i == 100:
            return True

In [None]:
# cherchons 100 parmi les <n> premiers carrés
n = 10**6

# avec une compréhension 
# on fait beaucoup de travail
# pour rien
%timeit search_100([x**2 for x in range(n)])

In [None]:
# avec un générateur ...
# 100.000 fois plus rapide, c'est normal 
# on n'a pas eu besoin de créer
# la liste des carrés 
%timeit search_100(x**2 for x in range(n))

# expression génératrice

* les compréhensions de dictionnaire et d'ensemble sont souvent justifiées
* par contre, pour les listes: **toujours bien se demander**  
  si on a vraiment besoin de **construire la liste**

* ou si au contraire on a juste **besoin d'itérer** dessus  
  souvent une seule fois d'ailleurs

* si on a vraiment besoin de cette liste  
  alors la compréhension est OK

* mais dans le cas contraire  
  utiliser une **expression génératrice**

* qui souvent revient à simplement enlever les `[]`  
  ou les remplacer par des `()`

* exemple...

### expression génératrice

In [None]:
# j'ai un ensemble de valeurs
# je cherche à trouver la somme des carrés de ces valeurs
data = [-10, 5, -9, 15, -21, 7, 12]

In [None]:
# je peux faire ceci
# je calcule la liste des carrés
carres = [x**2 for x in data]
carres

In [None]:
# j'utilise ensuite la builtin `max` 
sum(carres)

In [None]:
# mais en fait je peux remplacer ceci
sum([x**2 for x in data])

In [None]:
# par juste ceci - remarquez l'absence des []
sum(x**2 for x in data)

### expression génératrice

In [None]:
# on peut examiner ces deux objets
[x**2 for x in data]

In [None]:
# attention ici il faut les parenthèses
(x**2 for x in data)

In [None]:
# c'est un itérateur !
generator1 = (x**2 for x in data)

In [None]:
next(generator1)

In [None]:
next(generator1)

### expression génératrice

In [None]:
# remplissons une classe imaginaire
from random import randint

matieres = ('maths', 'français', 'philo')
eleves = ('jean', 'julie', 'marie', 
          'apolline', 'mathilde', 'adrien')

def eleve_alea():
    return [randint(0, 20) f 

In [None]:
# la moyenne de la classe en maths
notes_maths = [maths for maths, *_ in classe]
notes_maths

In [None]:
moyenne = sum(notes_maths) / len(notes_maths)
moyenne

In [None]:
# observez l'absence des []
sum(maths for maths, *_ in classe) / len(eleves)

# fonction génératrice

* une dernière forme très commune d'itérateurs
* décrite sous la forme d'une fonction  
  qui fait `yield` au lieu de `return`

* c'est plus clair avec un exemple

In [None]:
def squares(n):
    for i in range(n):
        yield i**2

In [None]:
for square in squares(3):
    print(square, end=" ")

### fonction génératrice

In [None]:
# voyons un peu cet objet
generator2 = squares(4)
generator2

In [None]:
# ça ressemble beaucoup 
# à une expression génératrice
next(generator2)

In [None]:
# c'est en effet un iterateur
iter(generator2) is generator2

### expression génératrice *vs* fonction génératrice

In [None]:
# generator1 provient d'une expression génératrice
# generator2 provient d'une fonction génératrice

In [None]:
type(generator1)

In [None]:
type(generator2)

* les deux formes de générateur sont de même type
* la fonction a une puissance d'expression supérieure
* notamment elle permet de conserver l'état  
  sous la forme de variables locales

* et même en fait c'est plus fort que ça  
  car la fonction génératrice peut en appeler d'autres

# `yield from`

partant d'une fonction génératrice qui énumère  
tous les diviseurs d'un entier (1 et lui-même exclus)


In [None]:
def divs(n):
    for i in range(2, n):
        if n % i == 0:
            yield i

In [None]:


for div in divs(30):
    print(div, end=" ")

* maintenant si je veux écrire une fonction génératrice  
  qui énumère tous les diviseurs des diviseurs de `n`

* il s'agit donc d'une fonction génératrice qui en appelle une autre
* il y a nécessité pour une syntaxe spéciale: `yield from`

### `yield from`

In [None]:
def divdivs(n):
    for i in divs(n):
        yield from divs(i)

In [None]:
for div in divdivs(30):
    print(div, end=" ")

### fonctions génératrices - epilogue

pour évaluer la boucle `for` dans ce dernier cas:

* la **pile** principale (de la fonction qui fait `for`)
* **et** une **pile** annexe qui évalue la fonction génératrice
* et qui se fait "mettre au congélateur" à chaque itération de la boucle
* l'état de l'itération: toutes les variables locales de la pile annexe
  * les deux `i` dans l'exemple précédent

c'est cette propriété qui est utilisée pour implémenter la librairie asynchrone `asyncio` 

# objets itérables

* en python, avec les classes, on peut 
  * se définir des types utilisateur
  * et bien les intégrer dans le langage 
* par exemple, il existe un *protocole* 
  * pour rendre un objet itérable
  * i.e. pour pouvoir l'utiliser dans un for
* deux moyens
  * via `__getitem__` (une séquence - accès direct)
  * via `__iter__()` qui doit retourner un itérateur

# itérable avec `__getitem__`

* si votre objet est une séquence
* vous pouvez définir la méthode `__getitem__()`
  * qui sera alors appelée par le `for` 
  * avec en argument `0`, `1`, ...
  * jusqu'à ce que `__getitem__` lève `StopIteration`
* c'est adapté pour des objets qui ont un accès direct 
  * à leurs sous-composants
* technique assez *old-school* 
  * conservé pour compatibilité
  * mais on n'en parle plus dans la suite du cours

In [None]:
# un itérable implémenté avec __getitem__

class PseudoSequence:
    
    def __init__(self, top):
        self.top = top
        
    def __getitem__(self, index):
        if not isinstance(index, int):
            raise TypeError
        if 0 <= index < self.top: 
            return 2 ** index
        else:
            raise IndexError

In [None]:
seq = PseudoSequence(4)
for i in seq:
    print(i)

In [None]:
seq[0], seq[2]

# itérable avec itérateur

* on peut rendre un objet **itérable**
  * en écrivant la méthode magique `__iter__()`  
    qui doit retourner un itérateur

* Q: d'accord, mais alors c'est quoi un itérateur ?  
  A: ici à nouveau il y a un *protocole*

* protocole **itérateur**
  * une méthode `__next__()`  
    qui à chaque appel retourne l’élément suivant
    ou qui lève une exception `StopIteration`  
    lorsqu’il n’y a plus d’élément à retourner

  * une méthode `__iter__()` qui retourne l’itérateur lui-même
    * et donc un itérateur est lui-même itérable

# sous le capot de la boucle `for`

lorsqu'on itère sur un itérable avec itérateur

In [None]:
iterable = [10, 20, 30]

sous le capot, la boucle `for` va faire:

  * créer l'itérateur en appelant `iter()`
  * appeler `next()` sur cet itérateur
  * jusqu'à obtenir l'exception `StopIteration`

In [None]:
for item in iterable:
    print(item)

In [None]:
iterateur = iter(iterable)
while True:
    try:
        item = next(iterateur)
        print(item)
    except StopIteration:
        # print("fin")
        break

### sous le capot de la boucle `for`

* `next()` et `iter()` sont des fonctions natives
* et naturellement:
  * `iter(obj)` appelle `obj.__iter__()`
  * `next(obj)` appelle `obj.__next__()`

# séparer itérateur et itérable

* le plus souvent possible
  * on définit les itérateurs "sans donnée"
  * comme `range()` ou `count()`
  * ou comme des générateurs
* lorsqu'on définit un itérateur sur une "vraie" structure de données
  * l'itérable contient les données
  * l'iterateur ne contient **que** la logique/état d'itération
  * il est important alors **séparer** les deux objets
  * ne serait-ce que pour pouvoir faire des boucles imbriquées

### séparer itérateur et itérable

In [None]:
liste = [0, 10, 100]

In [None]:
for item in liste:
    print(item, end=" ")

In [None]:
# avec une seule boucle, 
# on peut itérer sur l'itérateur
iterator = iter(liste)

for item in iterator:
    print(item, end=" ")

In [None]:
# avec deux boucles par contre
for item1 in liste:
    for item2 in liste:
        print(f"{item1}x{item2}")

In [None]:
# ça ne fonctionne plus du tout !
iterator = iter(liste)

for item1 in iterator:
    for item2 in iterator:
        print(f"{item1}x{item2}")

# utilisation des itérables


* on a défini les itérables par rapport à la boucle `for` 
* mais plusieurs fonctions acceptent en argument des itérables
* `sum`, `max`, `min`
* `map`, `filter`
* etc...

# exemple de la puissance des itérateurs

* imaginons que je veuille afficher toutes les lignes d’un fichier qui contienne le mot 'matin'
* est-ce possible de le faire en seulement 4 lignes ?
* sans notation cryptique et incompréhensible

In [None]:
with open('data/une-charogne.txt') as feed:
    for lineno, line in enumerate(feed, 1):
        if 'matin' in line:
            print(f"{lineno}:{line}", end="")

# quel objet est itérable ?

* il existe beaucoup d’objets itérables en python
  * tous les objets séquence: listes, tuples, chaînes, etc.
  * les sets, les dictionnaires
  * les vues (dict.keys(), dict.values()), etc.
  * les fichiers
  * les générateurs
* il faut les utiliser, c’est le plus rapide et le plus lisible

# quel objet est un itérateur ?

* on peut voir si  
  `iter(obj) is obj`


In [None]:
def is_iterator(obj):
    return iter(obj) is obj

* à la lumière de ce qu'on a vu
  * une liste **n'est pas** son propre itérateur
  * un fichier **est** son propre itérateur

In [None]:
# un fichier est son propre itérateur
with open("data/une-charogne.txt") as F:
    print("propre itérateur ? ",
          is_iterator(F))

In [None]:
# la liste non
L = list(range(5))
print("propre itérateur ? ",
      is_iterator(L))

In [None]:
# range() non plus 
R = range(5)
print("propre itérateur ? ",
      is_iterator(R))

In [None]:
# range() non plus 
Z = zip(L, L)
print("propre itérateur ? ",
      is_iterator(Z))

* de manière générale, un objet qui est un itérateur  
  ne peut être itéré qu'une seule fois

* attention donc par exemple à ne pas essayer  
  d'itérer plusieurs fois sur le même objet `zip` 

# boucles pythoniques

In [None]:
D = {
    'alice': 35,
    'bob': 9,
    'charlie': 6,
}

# pas pythonique (implicite)
for t in D.items():         
    print(t[0], t[1])

In [None]:
# pythonique (explicite)

for nom, age in D.items():
    print(nom, age)