# Boucles et tests

## Boucles

Ces notions sont abord√©es en d√©tail ici : <https://python.sdv.u-paris.fr/05_boucles_comparaisons/>

Les boucles sont tr√®s utiles pour r√©p√©ter des actions.

*Ex√©cutez les cellules ci-dessous pour explorer les diff√©rentes notions abord√©es dans ce notebook.*

### It√©ration sur les √©l√©ments d'une liste

Voici les ingr√©dients que j'ai dans mon placard :

In [None]:
placard = ["farine", "oeufs",  "sucre", "lait"]

Pour afficher, les uns apr√®s les autres, les ingr√©dients de mon placard, nous pourrions √©crire :

In [None]:
print(placard[0])
print(placard[1])
print(placard[2])
print(placard[3])

Cette m√©thode est r√©p√©titive et serait tr√®s p√©nible si la liste `placard` contenait 10, 100, 1000 √©l√©ments.

Les boucles ont justement √©t√© cr√©√©es pour automatiser une action (ici afficher chacun des √©l√©ments d'une liste) :

In [None]:
for ingredient in placard:
    print(ingredient)

Remarques :

- La variable *ingredient* est appel√©e *variable d'it√©ration* et change de valeur √† chaque it√©ration (√† chaque r√©p√©tition) de la boucle.
- La ligne d√©butant par `for` se termine toujours par `:`
- Le bloc d'instructions `print(ingredient)` est **indent√©**, c'est-√†-dire qu'il est d√©cal√© vers la droite de quatre espaces.

Un bloc d'instructions peut contenir plusieurs lignes d'instructions :

In [None]:
placard = ["farine", "oeufs",  "sucre", "lait"]

for ingredient in placard:
    print("J'ajoute un ingr√©dient :")
    print(ingredient)
print("La p√¢te √† cr√™pes est pr√™te !")

Ici, le bloc d'instructions de la boucle `for` est compos√© de deux instructions :
```
print("J'ajoute un ingr√©dient :")
print(ingredient)
```

L'instruction `print("La p√¢te √† cr√™pes est pr√™te !")` est en dehors du bloc d'instructions de la boucle. Elle est donc ex√©cut√©e apr√®s la boucle. Visuellement, on s'en rend compte, car elle est align√©e avec le d√©but de la boucle `for`.

### Exercice

- Reprenez la cellule de code pr√©c√©dente et ajoutez un ingr√©dient (par exemple de la vanille) dans la liste `placard`.
- Relancez la boucle pour afficher les diff√©rents ingr√©dients.

:::{admonition} √âl√©ments de r√©ponse
:class: tip
:class: dropdown

```python
placard = ["farine", "oeufs",  "sucre", "lait", "vanille"]

for ingredient in placard:
    print("J'ajoute un ingr√©dient :")
    print(ingredient)
print("La p√¢te √† cr√™pes est pr√™te !")
```

ou pour encore plus de gourmandise :

```python
placard = ["farine", "oeufs",  "sucre", "lait", "vanille", "rhum", "eau de fleur d'oranger"]

for ingredient in placard:
    print("J'ajoute un ingr√©dient :")
    print(ingredient)
print("La p√¢te √† cr√™pes est pr√™te !")
```

Quel que soit le nombre d'ingr√©dients dans mon placard, le code pour afficher ces ingr√©dients est toujours le m√™me. Les boucles sont donc tr√®s utiles pour automatiser le traitement (ici l'affichage d'un ingr√©dient) sur de grandes quantit√©s de donn√©es.

Sans boucle `for`, il aurait fallu √©crire pour obtenir le m√™me r√©sultat :

```python
print("J'ajoute un ingr√©dient :")
print("farine")
print("J'ajoute un ingr√©dient :")
print("oeufs")
print("J'ajoute un ingr√©dient :")
print("sucre")
print("J'ajoute un ingr√©dient :")
print("lait")
print("J'ajoute un ingr√©dient :")
print("vanille")
print("J'ajoute un ingr√©dient :")
print("rhum")
print("J'ajoute un ingr√©dient :")
print("eau de fleur d'oranger")
print("La p√¢te √† cr√™pes est pr√™te !")
```

Ce qui est tr√®s tr√®s p√©nible !

:::

### It√©ration sur les caract√®res d'une cha√Æne de caract√®res

Souvenez-vous, une cha√Æne de caract√®res fonctionne *presque* comme une liste.

On peut parcourir chaque caract√®re les uns apr√®s les autres et les afficher.

In [None]:
sequence = "ATCG"

for base in sequence:
    print(base)

On peut aussi utiliser une *f-string* pour rendre l'affichage plus joli :

In [None]:
sequence = "ATCG"

for base in sequence:
    print(f"La base est : {base}")

### Exercice

Adaptez le code pr√©c√©dent pour afficher chaque acide amin√© du peptide de s√©quence (`VLALPEP`) de la fa√ßon suivante : `Le peptide contient le r√©sidu : X` (avec `X` un acide amin√© de la s√©quence du peptide).

:::{admonition} √âl√©ments de r√©ponse
:class: tip
:class: dropdown

R√©ponse possible :

```python
sequence = "VLALPEP"

for acide_amine in sequence:
    print(f"Le peptide contient le r√©sidu : {acide_amine}")
```

Le code suivant fonctionne aussi :

```python
sequence = "VLALPEP"

for base in sequence:
    print(f"Le peptide contient le r√©sidu : {base}")
```

Mais, le nom de la variable `base` est source de confusion. Un peptide n'est pas constitu√© de bases, mais de r√©sidus ou d'acides amin√©s. Utilisez toujours des noms de variable qui ont un sens par rapport au probl√®me pos√©.

:::

## Tests

Ces notions sont abord√©es en d√©tail ici : https://python.sdv.u-paris.fr/06_tests/

Les tests sont utilis√©s pour prendre des d√©cisions.

In [None]:
nombre = 2

In [None]:
if nombre == 2:
    print("Gagn√© !")

Remarques :

- La ligne d√©butant par  `if` se termine toujours par `:`
- `==` (deux fois le symbole `=`) est un op√©rateur de comparaison d'√©galit√©. On v√©rifie si `nombre` est √©gale √† `2`. Ne confondez par cet op√©rateur d'√©galit√© avec l'op√©rateur d'affectation `=` qui permet de donner une valeur √† une variable (par exemple : `a = 1.8`).
- Un bloc d'instructions suit la ligne contenant `if` et est indent√©, c'est-√†-dire qu'il est d√©cal√© vers la droite de quatre espaces.

### Tests √† deux cas

In [None]:
nombre = 2

if nombre == 2:
    print("Gagn√© !")
else:
    print("Perdu !")

Remarques :

- Le symbole `:` se trouve √† la fin de la ligne d√©butant par `if` et de celle d√©butant par `else`
- Il y a un bloc d'instructions (indent√©) apr√®s la ligne avec le `if`
- Il y a un bloc d'instructions (indent√©) apr√®s la ligne avec le `else`

### Tests √† plusieurs cas

In [None]:
base = "T"

In [None]:
if base == "A":
    print("Choix d'une ad√©nine")
elif base == "T":
    print("Choix d'une thymine")
elif base == "C":
    print("Choix d'une cytosine")
elif base == "G":
    print("Choix d'une guanine")

On peut √©galement d√©finir un cas ¬´ par d√©faut ¬ª avec `else` :

In [None]:
base = "P"

if base == "A":
    print("Choix d'une ad√©nine")
elif base == "T":
    print("Choix d'une thymine")
elif base == "C":
    print("Choix d'une cytosine")
elif base == "G":
    print("Choix d'une guanine")
else:
    print("R√©vise ta biologie !")

## Boucle + tests = automatisation = üöÄ

L'utilisation combin√©e de boucle et de tests permet d'automatiser un traitement de donn√©es et d'adapter le comportement du programme en fonction de chaque donn√©e √† traiter.

In [None]:
sequence = "ATTGCGCA"

for base in sequence:
    if base == "A":
        print("La base est une ad√©nine")
    elif base == "T":
        print("La base est une thymine")
    elif base == "C":
        print("La base est une cytosine")
    elif base == "G":
        print("La base est une guanine")

Remarques :

- Le premier niveau d'indentation concerne la boucle `for`.
- Le second niveau d'indentation concerne les tests (`if` et `elif`).

### Attention √† l'indentation !

Observez avec attention les exemples de code ci-dessous, ex√©cutez-les puis essayez de comprendre ce qui se passe pour la derni√®re ligne.

In [None]:
nombres = [4, 5, 6]

for nb in nombres:
    if nb == 5:
        print("Le test est vrai")
        print(f"car la variable nb vaut {nb}")

In [None]:
nombres = [4, 5, 6]

for nb in nombres:
    if nb == 5:
        print("Le test est vrai")
    print(f"car la variable nb vaut {nb}")

:::{admonition} Explications
:class: note
:class: dropdown

La seule diff√©rence entre les deux cellules de code ci-dessus est l'indentation de la derni√®re ligne : `print(f"car la variable nb vaut {nb}")`

Dans la premi√®re cellule de code, la derni√®re ligne est indent√©e de la m√™me mani√®re que la ligne `print("Le test est vrai")`. Elle ne sera ex√©cut√©e que si le test `if nb == 5:` est vrai. On obtiendra donc comme r√©sultat :

```none
Le test est vrai
car la variable nb vaut 5
```

Dans la seconde cellule de code, la derni√®re ligne est indent√©e de la mani√®re que la ligne `if nb == 5:`. Elle sera ex√©cut√©e **√† chaque iteration** de la boucle `for`, comme le test `if nb == 5:`. On obtiendra alors comme r√©sultat :

```none
car la variable nb vaut 4
Le test est vrai
car la variable nb vaut 5
car la variable nb vaut 6
```

:::

### Combien d'alanines ?

Lors du premier cours, nous avions utilis√© le code suivant pour compter le nombre d'alanines dans une s√©quence de prot√©ine :

In [None]:
sequence = "GWGAWILAGAGA"
nombre_ala = 0

for acide_amine in sequence:
		if acide_amine == "A":
				nombre_ala = nombre_ala + 1

print(nombre_ala)

La r√©ponse √©tait triviale compte tenu de la petite taille de la prot√©ine donn√©e en exemple (on devrait m√™me plut√¥t parler de peptide ici).

Pour la glycoprot√©ine plaquettaire humaine beta 3, c'est un peu diff√©rent. Voici sa s√©quence repr√©sent√©e sous forme d'une cha√Æne de caract√®res en Python :

In [None]:
sequence = """
MRARPRPRPLWATVLALGALAGVGVGGPNICTTRGVSSCQQCLAVSPMCAWCSDEALPLG
SPRCDLKENLLKDNCAPESIEFPVSEARVLEDRPLSDKGSGDSSQVTQVSPQRIALRLRP
DDSKNFSIQVRQVEDYPVDIYYLMDLSYSMKDDLWSIQNLGTKLATQMRKLTSNLRIGFG
AFVDKPVSPYMYISPPEALENPCYDMKTTCLPMFGYKHVLTLTDQVTRFNEEVKKQSVSR
NRDAPEGGFDAIMQATVCDEKIGWRNDASHLLVFTTDAKTHIALDGRLAGIVQPNDGQCH
VGSDNHYSASTTMDYPSLGLMTEKLSQKNINLIFAVTENVVNLYQNYSELIPGTTVGVLS
MDSSNVLQLIVDAYGKIRSKVELEVRDLPEELSLSFNATCLNNEVIPGLKSCMGLKIGDT
VSFSIEAKVRGCPQEKEKSFTIKPVGFKDSLIVQVTFDCDCACQAQAEPNSHRCNNGNGT
FECGVCRCGPGWLGSQCECSEEDYRPSQQDECSPREGQPVCSQRGECLCGQCVCHSSDFG
KITGKYCECDDFSCVRYKGEMCSGHGQCSCGDCLCDSDWTGYYCNCTTRTDTCMSSNGLL
CSGRGKCECGSCVCIQPGSYGDTCEKCPTCPDACTFKKECVECKKFDRGALHDENTCNRY
CRDEIESVKELKDTGKDAVNCTYKNEDDCVVRFQYYEDSSGKSILYVVEEPECPKGPDIL
VVLLSVMGAILLIGLAALLIWKLLITIHDRKEFAKFEEERARAKWDTANNPLYKEATSTF
TNITYRGT
"""

sequence = sequence.replace("\n","")

Remarques :

- On utilise ici des triples guillemets (`"""`) pour cr√©er la cha√Æne de caract√®res. C'est une astuce quand on veut d√©finir de grandes cha√Ænes de caract√®res r√©parties sur plusieurs lignes.
- L'instruction `sequence.replace("\n","")` va retirer les retours √† la ligne (`\n`) de la cha√Æne de caract√®res contenant la s√©quence. La notion de retour √† la ligne sera vue en d√©tails dans le chapitre sur les fichiers.

Par contre, le code pour compter le nombre d'alanines et afficher leur nombre reste identique :

In [None]:
nombre_ala = 0

for acide_amine in sequence:
		if acide_amine == "A":
				nombre_ala = nombre_ala + 1

print(nombre_ala)

Et si vous vous demandiez combien d'acides amin√©s composent cette prot√©ine, voici la r√©ponse :

In [None]:
print(f"Taille de la prot√©ine : {len(sequence)} acides amin√©s")

Vous pouvez v√©rifier la taille obtenue sur la [fiche UniProt](https://www.uniprot.org/uniprotkb/P05106/entry#sequences) de cette prot√©ine.

### Compter les bases

Si on peut compter un acide amin√© particulier dans une s√©quence de prot√©ine, on peut aussi compter les diff√©rentes bases d'une s√©quence d'ADN :

In [None]:
ADN = "ATAAAGCCGTTATGCAYCCA"

nb_A = 0
nb_T = 0
nb_C = 0
nb_G = 0

for base in ADN:
    if base == "A":
        nb_A = nb_A + 1
    elif base == "T":
        nb_T = nb_T + 1
    elif base == "C":
        nb_C = nb_C + 1
    elif base == "G":
        nb_G = nb_G + 1

print(nb_A, nb_T, nb_C, nb_G)

:::{note}

L'algorithme pour compter un acide amin√© ou des bases dans une s√©quence est identique. Dans les deux cas, on parcourt les acides amin√©s ou les bases de la s√©quence (de prot√©ine ou d'ADN) et on compte un acide amin√© ou une base de plus √† chaque fois que l'acide amin√© ou la base recherch√©¬∑e est identifi√©¬∑e.

:::

## Exercices

## Notes d'un¬∑e √©tudiant¬∑e

Voici les notes d'un¬∑e √©tudiant¬∑e :


In [None]:
notes_du_semestre = [14, 9, 6, 8, 12, 16]

Affichez, une par une, ses notes.

Pour cela, compl√©tez le code suivant en rempla√ßant les üê≠ et üê± par les noms de variable ad√©quats :

In [None]:
for üê≠ in üê±:
    print(üê≠)

:::{admonition} √âl√©ments de r√©ponse
:class: tip
:class: dropdown

Voici un exemple de code possible avec :

- la variable `note` √† la place de üê≠ ;
- et la variable `notes_du_semestre` √† la place de üê±.

```python
for note in notes_du_semestre:
    print(note)
```

- Le nom de la variable `notes_du_semestre` est impos√© par la cellule qui contient la d√©finition de la liste. Si on souhaite parcourir les √©l√©ments de cette liste, il faut imp√©rativement utiliser son nom comme elle a √©t√© cr√©√©e.
- La variable `note` est cr√©√©e automatiquement lors du lancement de la boucle. Elle prend une valeur diff√©rente √† chaque it√©ration de la boucle.
- Vous pouvez utiliser n'importe quel nom de variable √† la place de `note` : `note_etudiant`, `n`, `toto`, `x`, `acide_amine`... Mais utilisez dans la mesure du possible un nom de variable qui a du sens par rapport au probl√®me trait√©.

:::

Testez votre code, en ayant pris soin d'avoir ex√©cut√© au pr√©alable la cellule qui d√©finit la liste des notes.

Calculez maintenant la moyenne des notes. Pour cela :
- Cr√©ez une variable `somme` qui prendra comme valeur initiale 0.
- Puis avec une boucle, ajoutez √† `somme` les notes successives (d'abord la premi√®re, puis la deuxi√®me...).
- Enfin, en dehors de la boucle, calculez la moyenne.

Un mod√®le de code vous est fourni ci-dessous. Compl√©tez-le en rempla√ßant les ‚ùå, üê≠ et üê± par les valeurs et noms de variable ad√©quates :

In [None]:
somme = ‚ùå

for üê≠ in üê±:
    somme = somme + üê≠ 

moyenne = somme / len(üê±)

:::{admonition} √âl√©ments de r√©ponse
:class: tip
:class: dropdown

Voici un exemple de code possible avec :

- la valeur `0` √† la place de ‚ùå ;
- la variable `note` √† la place de üê≠ ;
- et la variable `notes_du_semestre` √† la place de üê±.
    

```python
somme = 0

for note in notes_du_semestre:
    somme = somme + note

moyenne = somme / len(notes_du_semestre)
```

:::

Utilisez l'√©criture format√©e pour afficher la valeur de la moyenne calcul√©e avec deux d√©cimales :

:::{admonition} √âl√©ments de r√©ponse
:class: tip
:class: dropdown

Voici un exemple de code possible :

```python
print(f"La moyenne de l'√©tudiant¬∑e est : {moyenne:.2f}")
```

:::