----
## **Python pour la Data Science**
## **Les boucles**
----

Dans un algorithme, il arrive fr√©quemment que l'on ait besoin de r√©p√©ter plusieurs fois les m√™mes lignes de code.
Pour cela, il est plus commode d'utiliser des **boucles**, qui vont ex√©cuter une s√©rie d'op√©rations autant de fois que n√©cessaire.

Il existe deux clauses pour d√©finir les boucles en Python : Les clauses `for` et `while`.

## **1. La boucle while**

Le mot-cl√© **while** signifie "tant que" en anglais. La boucle `while` permet de r√©p√©ter un bloc d'instructions **tant que** la condition de d√©part est vraie (ou **jusqu'√†** ce qu'elle soit fausse).

Par exemple, pour d√©terminer l'indice du mot `"trouv√©"` dans une liste de mots, il suffit de parcourir tous les indices de la liste jusqu'√† trouver la cha√Æne `"trouv√©"` :
```python
# La liste de mots dans laquelle nous voulons trouver le mot "trouv√©".
phrase = ['La', 'boucle', 'while', 'parcourt', 'tous', 'les', '√©l√©ments', 'de', 'la', 'liste', "jusqu'√†", 'ce', "qu'elle", 'ait', 'trouv√©', 'ce', "qu'elle", 'cherche', '.']

# La variable i va stocker l'indice dans lequel nous sommes
i=0

# Tant que le mot √† l'indice o√π nous sommes est diff√©rent de "trouv√©"
while phrase[i] != 'trouv√©':
    # On incr√©mente la valeur de i de 1 pour passer √† l'indice suivant
    i += 1

# La boucle s'arr√™te lorsque nous avons trouv√© le bon mot
print("Le mot 'trouv√©' est √† l'indice", i)
>>>> Le mot 'trouv√©' est √† l'indice 14
```

La structure g√©n√©rale d'une boucle **`while`** est la suivante :
```python

while condition:
    instruction1
    ...
    instructionN

autre_instruction   
```

√Ä chaque **it√©ration** de la boucle **`while`**, la condition est √©valu√©e. Si la condition est v√©rifi√©e, le bloc d'instructions est √©x√©cut√©, sinon la boucle se termine.

Les lignes en dehors du bloc d'instruction ne font pas partie de la boucle, elles ne sont donc ex√©cut√©es qu'une fois la boucle termin√©e.

Si la condition est **fausse** d√®s le d√©part, le bloc d'instruction n‚Äôest **jamais ex√©cut√©**.

Inversement, si la condition reste **toujours vraie**, le bloc d'instruction est ex√©cut√© **ind√©finiment**. Il est donc important de **s'assurer que la boucle va se terminer** avant de l'ex√©cuter.

- **(a)** Instancier une variable i avec la valeur 1.
- **(b)** √Ä l'aide d'une boucle while, afficher les 10 premiers entiers naturels.

Si par m√©garde vous lancez une boucle infinie, vous pouvez interrompre son ex√©cution √† l'aide des boutons qui se trouvent en bas √† gauche de votre √©cran :

![interrupt_restart_kernel](https://github.com/diaBabPro/colabs/blob/main/interrupt_restart_kernel.png?raw=true)

In [3]:
# A
i = 1

# B
while i <= 10:
    print(i)
    i += 1

1
2
3
4
5
6
7
8
9
10


> Nous disposons d'une liste contenant les temps effectu√©s par des athl√®tes lors d'une course de 100m.
Les r√©sultats sont **tri√©s par ordre croissant**.

- (c) En utilisant une boucle **'while'**, d√©terminer combien d'athl√®tes ont r√©alis√© un temps **inf√©rieur √† 10s**.

In [13]:
results = [9.81, 9.89, 9.91, 9.93, 9.94, 9.95, 9.96, 9.97, 9.98, 10.03, 10.04, 10.05, 10.06, 10.08, 10.11, 10.23]

# C
i = 0
while results[i] < 10:
    i += 1
print(i, "athl√®tes ont r√©alis√© un temps inf√©rieur √† 10 secondes")

9 athl√®tes ont r√©alis√© un temps inf√©rieur √† 10 secondes


## 2. **La boucle for**

La boucle `for` permet de r√©p√©ter un bloc d'instructions de mani√®re plus contr√¥l√©e. En effet, il n'est pas clair avec une boucle `while` le **nombre de fois** que la boucle va s'ex√©cuter.

La boucle `for` est tr√®s **explicite** par rapport √† la variable qui va √™tre modifi√©e √† chaque it√©ration de la boucle et le nombre d'it√©rations de la boucle effectu√©es est toujours fini.

Par exemple, pour afficher une par une les lettres du mot boucle :
```python
for letter in "boucle":
   print(letter)
>>> b
>>> o
>>> u
>>> c
>>> l
>>> e
```
La structure g√©n√©rale d'une boucle `for` est la suivante :
```python
for element in sequence:
    instruction1
    ...
    instructionN

autre_instruction      
```
La boucle **`for`** ex√©cute le **bloc d'instructions** pour chaque √©l√©ment de la **s√©quence**.

Comme pour la boucle `while`, les lignes en dehors du bloc d'instruction ne font pas partie de la boucle, elles ne sont donc ex√©cut√©es qu'une fois lorsque la boucle est termin√©e.

Les actions se d√©roulent dans l'ordre suivant :

- la variable `element` prend la valeur du **premier** √©l√©ment de `sequence`.
- Le bloc d'instruction est ex√©cut√©.
- La variable `element` prend la valeur du **deuxi√®me** √©l√©ment de `sequence`.
- Le bloc d'instruction est ex√©cut√©.
- ...
- ...
- La variable `element` prend la valeur du **dernier** √©l√©ment de `sequence`.
- Le bloc d'instruction est ex√©cut√© et **la boucle se termine**.
- L'instruction `autre_instruction` est ex√©cut√©e.

La s√©quence peut √™tre tout type d'objet **indexable** comme une `liste`, un `tuple`, une cha√Æne de caract√®res, etc...

Dans la boucle **`for`** il est inutile de modifier la variable `element`, Python s'en charge automatiquement.
Attention cependant √† ne pas oublier dans la syntaxe **`in`** et `:` qui sont indispensables.

Un professeur a sous-√©valu√© ses √©l√®ves, et souhaite r√©hausser les notes de ceux-ci pour obtenir une moyenne de classe sup√©rieure √† 10/20.

Les notes des √©l√®ves ont √©t√© int√©gr√©es √† la liste suivante :
```python
bad_marks = [0, 2, 3, 3, 3, 3, 4, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 8, 8, 8, 8, 8, 8, 9, 10, 10, 10, 11, 12, 14]
```
A l'aide de boucles **`for`** :

- **(a)**Calculer et afficher la moyenne de la classe. Il y a **30 √©l√®ves** dans la classe.
- **(b)** Cr√©er une liste `good_marks` o√π vous stockerez les notes **augment√©es de 4 points**. Pour cela, vous pouvez cr√©er une liste vide puis ajouter les notes une par une.
- **(c)** V√©rifier que la nouvelle moyenne est sup√©rieure √† 10.

In [12]:
bad_marks = [0, 2, 3, 3, 3, 3, 4, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 8, 8, 8, 8, 8, 8, 9, 10, 10, 10, 11, 12, 14]

# A
moyenne = 0
for mark in bad_marks:
    moyenne += mark
moyenne /= len(bad_marks)
print("Ancienne moyenne:", moyenne)

# B
good_marks = []
for mark in bad_marks:
    good_marks.append(mark + 4)

# C
moyenne = 0
for mark in good_marks:
    moyenne += mark
moyenne /= len(good_marks)
print("Nouvelle moyenne:", moyenne)

Ancienne moyenne: 6.7
Nouvelle moyenne: 10.7


- **(d)** D√©terminer le **maximum** et le **minimum** de la liste `l` constitu√©e des √©l√©ments `[2,3,8,1,4]` √† l'aide d'une boucle `for`.

In [11]:
# D
l = [2, 3, 8, 1, 4]
maximum = l[0]
minimum = l[0]
for element in l:
    if element > maximum:
        maximum = element
    if element < minimum:
        minimum = element

print('Max:', maximum)
print('Min:', minimum)

Max: 8
Min: 1


- **(e)** Construire la liste l avec les √©l√©ments suivants : `[2,3,4,5,6,4]` et afficher l'expression **"Le nombre 4 est pr√©sent"** d√®s que le chiffre 4 est d√©tect√©. **Cette expression doit √™tre affich√©e une seule fois en sortie**. Utiliser pour cela une boucle `for` et le mot-cl√© `break`.

In [14]:
# E
l = [2, 3, 4, 5, 6, 4]
for element in l:
    if element == 4:
        print("Le nombre 4 est pr√©sent")
        break

Le nombre 4 est pr√©sent


## **3. La fonction range**

La fonction `range` est souvent utilis√©e avec les boucles **`for`**. Elle prend en argument un **d√©but**, une **fin** et un **pas**. Elle renvoie une suite de nombres allant du d√©but √† la fin (Le nombre de d√©but inclus, mais **le nombre de fin est exclu**) avec comme incr√©ment entre deux nombres le pas.

![range](https://github.com/diaBabPro/colabs/blob/main/Range.png?raw=true)

Par d√©faut le d√©but est 0 et le pas est de 1.

Ainsi :

- la saisie de `range(5)` renvoie la suite des nombres entiers de 0 √† 4.
- la saisie de `range(1, 10)` renvoie la suite des nombres entiers de 1 √† 9.
- la saisie de `range(1, 10, 3)` renvoie la suite 1, 4, 7.
- la saisie de `range(10,-1,-1)` renvoie la suite des nombres entiers de 10 √† 0. La s√©quence de nombres commence √† 10(**d√©but**), se termine √† 0 (**fin**) et va de 0 √† 10 (le **pas** √©tant n√©gatif).

La __[suite de Fibonacci](https://fr.wikipedia.org/wiki/Suite_de_Fibonacci)__ est une suite d'entiers dans laquelle chaque terme est la somme des deux termes qui le pr√©c√®dent.

Pour calculer les termes de la suite de Fibonacci, on fixe les deux premiers termes de la suite :

$ùë¢0=0$

$ùë¢1=1$

Pour  ùëñ‚â•2
 , on calcule les termes  ùë¢ùëñ
  √† l'aide de la formule :

  $ùë¢ùëñ=ùë¢ùëñ‚àí1+ùë¢ùëñ‚àí2$

- **(a)** √Ä l'aide d'une boucle `for` et de la fonction `range`, calculer et stocker dans la liste `u` les 100 premiers termes de la suite de Fibonacci.

In [18]:
# Les deux premiers termes de la suite de Fibonacci
u = [0, 1]

# A
for i in range(2, 100):
    u.append(u[i-1] + u[i-2])
print("Les 100 premiers termes de la liste de Fibonacci sont enregistr√©s")

Les 100 premiers termes de la liste de Fibonacci sont enregistr√©s


- **(b)** La surface d'un terrain est de 2000 m√®tres carr√©es. Chaque ann√©e sa surface est multipli√©e par 2. Calculer la surface du terrain au bout de 10 ans √† l'aide d'une boucle `for`.

In [19]:
# B
surface = 2000
for i in range(10):
    surface *= 2
print(f"La surface du terrain au bout de 10 ans est de {surface} m√®tres carr√©s")

La surface du terrain au bout de 10 ans est de 2048000 m√®tres carr√©s


- **(c)** R√©pondre √† nouveau √† la question **(b)** mais cette fois-ci en utilisant une boucle `while`.

In [32]:
# C
surface = 2000
i = 1
while i < 10:
    surface *= 2
    i += 1
print(f"La surface du terrain au bout de 10 ans est de {surface} m√®tres carr√©s")

La surface du terrain au bout de 10 ans est de 1024000 m√®tres carr√©s


- **(d)** A l'aide d'une boucle `for` uniquement ou en utilisant aussi la fonction `range`, √©crire un programme qui permet d'inverser l'ordre du mot **serre** en utilisant l'**indexation des listes** associ√© √† des cha√Ænes de caract√®res.

In [22]:
# D - For uniquement
mot = "serre"
mot_inverse = ""
for letter in mot:
    mot_inverse = letter + mot_inverse
print(mot_inverse)

# D - En utilisant range
mot = "serre"
mot_inverse = ""
for i in range(len(mot)-1, -1, -1):
    mot_inverse += mot[i]
print(mot_inverse)

erres
erres


- **(e)** Utiliser le m√™me slicing pour inverser l'ordre de la liste constitu√©e des √©l√©ments `[1,2,3,4]`

In [23]:
liste = [1, 2, 3, 4]

# E
for i in range(len(liste)-1, -1, -1):
    print(liste[i])

4
3
2
1


## **4. Boucles embo√Æt√©es**

Il est possible d'emboiter des boucles les unes dans les autres.
Par exemple, lorsque l'on a une liste de listes, il est possible de parcourir tous ses √©l√©ments avec deux boucles embo√Æt√©es.

La syntaxe est la suivante :
```python

# Pour chaque liste dans la liste de listes
for liste in liste_de_listes:
    # Pour chaque √©l√©ment dans la liste
    for element in liste:
        ...
        ...
        ```
**Il faut faire tr√®s attention √† l'indentation des blocs**. Comme pour les clauses if, l'indentation d√©limite le d√©but et la fin des blocs.

- **(a)** D√©terminer le nombre de fois que le caract√®re `'e'` apparait dans le texte suivant. Pour cela, vous pourrez parcourir **chaque mot du texte avec une boucle**, puis parcourir **chaque lettre de chaque mot** en comptant chaque occurence du caract√®re `'e'`.

In [25]:
text = ['Le', 'Br√©sil,', 'seule', '√©quipe', '√†', 'avoir', 'disput√©', 'toutes',
        'les', 'phases', 'finales', 'de', 'la', 'comp√©tition,', 'd√©tient', 'le', 'record',
        'avec', 'cinq', 'titres', 'mondiaux', 'et', "s'est", 'acquis', 'le', 'droit', 'de',
        'conserver', 'la', 'Coupe', 'Jules-Rimet', 'en', '1970', 'apr√®s', 'sa', '3e',
        'victoire', 'finale', 'dans', 'la', 'comp√©tition,', 'avec', 'Pel√©', 'seul',
        'joueur', 'triple', 'champion', 'du', 'monde.', "l'", "Italie", 'et',
        "l'", "Allemagne", 'comptent', 'quatre', 'troph√©es.', "l'", "Uruguay,", 'vainqueur',
        '√†', 'domicile', 'de', 'la', 'premi√®re', '√©dition,', "l'", "Argentine", 'et',
        'la', 'France', 'ont', 'gagn√©', 'chacune', 'deux', 'fois', 'la', 'Coupe,',
        "l'", "Angleterre", 'et', "l'", "Espagne", 'une', 'fois.', 'La', 'derni√®re', '√©dition',
        "s'est", 'd√©roul√©e', 'en', 'Russie', 'en', '2018,', 'la', 'prochaine', 'doit',
        'avoir', 'lieu', 'au', 'Qatar', 'en', '2022.', 'Celle', 'de', '2026,', 'aux',
        '√âtats-Unis,', 'au', 'Canada', 'et', 'au', 'Mexique)', 'sera', 'la', 'premi√®re',
        '√©dition', '√†', '48', '√©quipes', 'participantes.', 'La', 'Coupe', 'du', 'monde',
        'de', 'football', 'est', "l'", "√©v√©nement", 'sportif', 'le', 'plus', 'regard√©', '√†',
        'la', 't√©l√©vision', 'dans', 'le', 'monde', 'avec', 'les', 'Jeux', 'olympiques',
        'et', 'la', 'Coupe', 'du', 'monde', 'de', 'cricket.']

# Ins√©rez votre code ici
compteur = 0
for element in text :
    for caractere in element:
        if caractere == "e":
            compteur +=1
print(compteur)

98


- **(b)** Compter le nombre de fois que la lettre i est pr√©sente dans la liste constitu√©e des √©l√©ments suivant `['serre iconoclaste', 'invraisemblable imaginer']` √† l'aide de boucles **`for`** embo√Æt√©es et de **l'indexation des listes** associ√© √† des cha√Ænes de caract√®res.

In [26]:
# B
liste = ['serre iconoclaste', 'invraisemblable imaginer']
compteur = 0
for element in liste:
    for caractere in element:
        if caractere == 'i':
            compteur += 1
print(compteur)

5


## **5. Compr√©hension de liste**

La compr√©hension de liste est un concept extr√™mement int√©ressant avec Python, et qui s'inscrit dans l'objectif central de simplification des codes et de gain de productivit√©.

En utilisant la syntaxe des boucles **`for`**, il permet de d√©finir de mani√®re tr√®s compacte et √©l√©gante une liste de valeurs.

On souhaite stocker dans une liste les 10 premiers entiers au carr√©. Pour cela, on peut cr√©er une liste vide et utiliser une boucle **`for`** comme pr√©c√©demment :
```python
ma_liste = []
for i in range(10):
    ma_liste.append(i**2)
```
Mais Python nous permet de r√©duire cette √©criture, gr√¢ce √† la compr√©hension de liste :
```python
ma_liste = [i**2 for i in range(10)]
```
Ces deux m√©thodes sont strictement √©quivalentes.

Ainsi, pour un des exercices pr√©c√©dents o√π nous voulions augmenter toutes les notes de 4 points, nous aurions pu faire :
```python
good_marks = [mark + 4 for mark in bad_marks]
```
En utilisant la m√©thode de compr√©hension de liste :

- (a) Stocker dans une liste nomm√©e `puissances_trois` les 10 premi√®res puissances de 3.
- (b) Une liste `liste_nombres` vous est donn√©e. Cr√©er une nouvelle liste `liste_double` contenant le double de chacun de ses √©l√©ments.
- (c) √Ä partir de `liste_nombres`, cr√©er une liste `liste_pairs` qui pour chaque nombre de `liste_nombres` indique `"pair"` si le nombre est pair, et `"impair"` sinon. La parit√© peut √™tre test√©e √† l'aide de l'op√©rateur modulo `%`.

On rappelle la syntaxe de l'assignation conditionnelle :
```python
# Un √©l√®ve redouble si sa moyenne est inf√©rieure √† 10
redouble = True if moyenne < 10 else False

```

In [28]:
##### La liste de donn√©es pour les deux derni√®res questions
liste_nombres = [10, 12, 7, 3, 26, 2, 19]

# A
ma_liste = [i**3 for i in range(10)]
print(ma_liste)

# B
liste_double = [2*element for element in liste_nombres]
print(liste_double)

# C
liste_pairs = ["pair" if element % 2 == 0 else "impair" for element in liste_nombres]
print(liste_pairs)

[0, 1, 8, 27, 64, 125, 216, 343, 512, 729]
[20, 24, 14, 6, 52, 4, 38]
['pair', 'pair', 'impair', 'impair', 'pair', 'pair', 'impair']


## **6. La fonction `enumerate`**

Il est parfois utile d'avoir acc√®s √† l'indice d'un √©l√©ment dans une s√©quence. Pour ce faire, il est possible d'utiliser la fonction `enumerate` dans la clause de la boucle `for` :
```python
for index, element in enumerate(sequence):
    ...
```
Par exemple, si nous souhaitons afficher les diff√©rentes positions du mot `"le"` dans un texte :
```python
texte = ["le", "mot", "le", "est", "le", "mot", "dont", "nous", "cherchons", "la", "position"]

# Pour chaque mot du texte
for position, mot in enumerate(texte):
    # Si le mot est "le"
    if mot == "le":
        # On affiche sa position
        print(position)
>>> 0
>>> 2
>>> 4
```
- **(a)** D√©terminer l'indice du maximum de la liste `L` √† l'aide de la fonction `enumerate`. Pour trouver ce maximum, il suffit de stocker **le plus grand** √©l√©ment vu en parcourant la liste.
- **(b)** Afficher l'indice du maximum de la liste.

In [30]:
L = [22,65,75,93,64,47,91,53,86,53,88,17,94,39]
max = 0

# A
for position, element in enumerate(L):
    if element > max:
        max = element
        max_position = position

# B
print(f"Le maximum se trouve √† la position {max_position}")

Le maximum se trouve √† la position 12


## **7. La fonction ZIP**

La fonction **`zip`** permet de parcourir parall√®lement plusieurs s√©quences de **m√™me longueur** dans une seule boucle **`for`**.
La syntaxe est la suivante :

```python
# A chaque it√©ration, on prend un √©l√©ment de la premi√®re s√©quence et un √©l√©ment de la deuxi√®me
for element1, element2 in zip(sequence1, sequence2):
    ...
```
Cette syntaxe peut √™tre g√©n√©ralis√©e √† un tr√®s grand nombre de s√©quences.

Nous disposons de 2 listes contenant respectivement les revenus et les d√©penses d'individus pendant un mois. Les individus ont le m√™me indice dans les deux listes.

- **(a)** En faisant la **diff√©rence** entre les revenus et les d√©penses de chaque individu, cr√©er une liste contenant les **√©conomies** qu'ils ont r√©alis√©es pendant ce mois.

In [31]:
revenus = [1200, 2000, 1500, 0, 1000, 4500, 1200, 500, 1350, 2200, 1650, 1300, 2300]
depenses = [1000, 1700, 2000, 700, 1200, 3500, 200, 500, 1000, 3500, 1350, 1050, 1850]
economies = []

# A
for revenu, depense in zip(revenus, depenses):
    economies.append(revenu - depense)
print(economies)

[200, 300, -500, -700, -200, 1000, 1000, 0, 350, -1300, 300, 250, 450]


## **Conclusion et r√©cap**

Les boucles sont des outils indispensables de la programmation. Elles permettent de r√©p√©ter des instructions de mani√®re contr√¥l√©e.

Dans ce notebook, vous avez appris √† :

- D√©finir une boucle `while` qui s'ex√©cute tant que la condition la d√©finissant est v√©rifi√©e.
- D√©finir une boucle `for` qui permet de parcourir des s√©quences.
- D√©finir des listes par **compr√©hension**, qui constitue l'un des outils les plus √©l√©gants de Python.
- Utiliser la fonction **`range`** pour parcourir des nombres entiers.
- Utiliser le mot-cl√© **`break`** pour sortir d'une boucle lorsqu'une condition sp√©cifique est valid√©e.
- Utiliser le slicing **`::-1`** pour inverser l'ordre d'une s√©quence.
- Utiliser la fonction **`enumerate`** pour parcourir les **indices** et les **valeurs** d'une s√©quence.
- Utiliser la fonction **`zip`** pour parcourir **plusieurs listes** avec une seule boucle.