# Fichiers, conditions et boucles

## Objectifs :
## - Savoir utiliser une boucle `for` 
## - Savoir utiliser la déclaration conditionnelle `if`
## - Explorer les différentes façons de lire des fichiers

On commence réellement à apprécier les gains en rapidité de la programmation avec Python quand on arrive à sauver du temps grâce aux boucles. Celles-ci nous permettent d'effectuer une même séquence d'opérations sur différents fichiers avec quelques lignes de code seulement.

### Structure d'une boucle

<p align="center">
  <img src="fig/boucle.png" alt="Photo centrée" width="600">
</p>

Chaque boucle débute par `for i in iterable :`
- `i` : Le nom de la variable `i` n'a aucune importance, on aurait pu l'appeler n'importe comment (exemple : `for animal in zoo :`) !
- Exemples d'objets itérables :
  - Les listes : `['a', 'b', 'c']`
  - Les chaînes de caractères : `"bonjour"`
  - Les dictionnaires : `{"clé": "valeur"}`
  - Les ensembles (sets) : `{1, 2, 3}`
  - Les objets retournés par une fonction comme `range()`
  - Les fichiers
- On termine la ligne avec un `:`. En Python, on met un `:` pour signaler le début d'un bloc (comme les boucles, les conditions, ou les contextes avec `with`), puis on **indente** le code qui en fait partie. Dans un notebook, l'indentation se fait automatiquement si le `:` a bien été ajouté.  

Corps de la boucle :
- Toute action qui doit être réalisée sur chaque élément de l'itérable, un à la fois (opération mathématique, transformation, figure, etc.)
- Python comprend par lui même quand il est arrivé à la fin de l'itérable et quitte automatiquement la boucle.

In [84]:
for lettre in 'anticonstitutionnellement' :
    print(lettre.upper())

A
N
T
I
C
O
N
S
T
I
T
U
T
I
O
N
N
E
L
L
E
M
E
N
T


Exercice

Écrivez une boucle qui permet d'obtenir la puissance au carré de tous les nombres de la liste `nombres`.

In [117]:
nombres = [4, 8, 14, 20, 33, 100]

#

Exercice

Imprimez la première lettre de chaque valeur du dictionnaire `capitales`.

In [118]:
capitales = {'France': 'Paris',
             'Canada': 'Ottawa',
             'Italie': 'Rome',
             'Espagne': 'Madrid',
             'Thaïlande': 'Bangkok'}

#

### Déclaration conditionnelle `if`

La déclaration conditionnelle `if` en Python permet d'exécuter un bloc de code **seulement si** une condition est vraie. C’est un élément fondamental pour introduire la logique de décisionnelle dans un programme.

- Syntaxe de base

`if condition :`
<p style="margin-left: 40px;">
<code># bloc de code exécuté si la condition est vraie
</p>

- Comme pour les boucles et la déclaration `with()`, le code suivant la déclaration `if` doit être indenté.

- Conditions possibles : On peut utiliser des opérateurs de comparaison

  - == : égal
  - != : différent
  - <, >, <=, >= : inférieurs / supérieurs
  - and, or, not : opérateurs logiques
  - in : vérifier si un élément existe dans une séquence (liste, chaîne, dictionnaire)

Si l'énoncé est égal à `True`, il s'exécute :

In [87]:
age = 18

if age >= 18:
    print("Vous êtes majeur.")

Vous êtes majeur.


Si l'énoncé est égal à `False`, il ne s'exécute pas :

In [88]:
nombre = 11
if nombre <= 10:
    print('Le nombre était plus petit que 10')

In [89]:
fin_de_semaine = ['samedi','dimanche']

if 'lundi' in fin_de_semaine :
    print('Cette journée fait partie de la fin de semaine')

On peut ajouter du code à exécuter si la condition `if` retourne `False` avec l'énoncé `else`.

In [90]:
fin_de_semaine = ['samedi','dimanche']

if 'lundi' in fin_de_semaine :
    print('Cette journée fait partie de la fin de semaine')
else :
    print('Cette journée fait partie de la semaine')

Cette journée fait partie de la semaine


Exercice

Utilisez la déclaration `if` pour déterminer si `'bra'` est dans `'abracadabra'`.

In [91]:
#

Utilisez la déclaration `if` pour déterminer si 24 est un nombre pair.

In [92]:
#

### On peut ensuite combiner les boucles et la déclaration `if`

In [93]:
semaine_complete = ['lundi', 'mardi','mercredi','jeudi','vendredi','samedi','dimanche']

for jour in semaine_complete :
    if jour in fin_de_semaine :
        print(jour)

samedi
dimanche


Exercice

Afficher les nombres de 1 à 10 et indiquer s'ils sont pairs ou impairs

In [94]:
#

Filtrer les mots de la liste `mots` qui commencent par une voyelle

In [119]:
mots = ['chat', 'avion', 'tapis', 'soleil', 'orange',
        'livre', 'robot', 'usine', 'banane', 'papillon',
        'pomme', 'stylo', 'igloo', 'montagne', 'escalier']

#

### Lecture de fichiers

- Fichiers **tabulaires** (CSV, Excel, JSON, XML). Ces fichiers sont facilement lus et manipulables avec le paquet `pandas`. Vous apprendrez à utiliser ce paquet davantage dans la prochaine formation, mais voici un aperçu.

In [96]:
import pandas as pd

In [97]:
# source des données : 
# https://www.donneesquebec.ca/recherche/dataset/reseau-wifi/resource/2a451b5f-cbe9-4dcb-b9e5-03e63ababcad
# Localisation des points d'accès à un réseau wifi gratuit
wifi = pd.read_csv("data/zap.csv")

In [98]:
wifi

Unnamed: 0,OBJECTID,MUNICIPALITE,NOM_LIEU,XNAD83MTM6,YNAD83MTM6,NOM_RESEAU,MOT_PASSE,DETAILS,FOURNISSEUR,GEOM,GlobalID
0,1,10043,Aérogare Paul-Émile-Lapointe,230505.082,5371305.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{19D286B3-EB0C-4F0A-9B3F-FC422C7A9609}
1,3,10043,Bibliothèque Le Bic,215492.14715,5359866.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{DD1B718B-BCA1-45A6-B057-6C338088B446}
2,4,10043,Bibliothèque Pascal-Parent,233578.2185,5358377.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{96705019-6A7C-4D48-A09C-0F4CCC7E9D51}
3,5,10043,Bibliothèque de Pointe-au-Père,233952.5383,5375159.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{D69F8D5B-A943-4A15-ACCF-14CB9B1C1BB0}
4,6,10043,Centre communautaire Pointe-au-Père,234177.3657,5374441.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{FFC4734D-8CFA-4C5A-A8A7-E679831D9D85}
5,7,10043,Centre communautaire Rimouski-Est,230853.5583,5371618.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{AB47233B-34C5-4A43-86BE-98C2ACBC1D3D}
6,8,10043,Centre communautaire Saint-Robert,228852.9676,5367115.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{D38B053D-F45A-4173-BC71-24C3B9484BDC}
7,9,10043,Centre communautaire Sainte-Odile,227452.6634,5366443.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{3C6784EF-8973-48BE-8C89-E08D534C50A6}
8,10,10043,Centre communautaire Sainte-Agnès Nord,229744.9116,5369569.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{2502107C-1F6A-430B-9960-E39B83636824}
9,11,10043,Centre communautaire Sacré-Coeur,224050.2393,5366101.0,ZAPBSL,Mot de passe attribué par la Z.A.P.,http://zapbsl.org/pour-vous-brancher/,Z.A.P. du Bas-Saint-Laurent,Point,{38C62553-D50E-4914-BE40-D005E9DE0400}


In [99]:
type(wifi)

pandas.core.frame.DataFrame

- Fichiers **textes** au format **atypique** : Ces types de fichiers demandent plus de travail manuel pour structurer les données, car ils ne sont pas tabulaires ou les lignes ne sont pas uniformes. Des exemples de formats de fichiers incluent les données biologiques (ex : FASTA, FASTQ, GBK) et les fichiers textes (.txt). Ils doivent être lus avec la fonction `open()`.

In [100]:
animaux = []
with open('data/liste_animaux.txt', 'r') as f :
    for line in f :
        line = line.strip()
        animaux.append(line)

Décortiquons chaque ligne de cette cellule de code :

1. `animaux = []`
- On crée d'abord une liste vide, appelée `animaux`. Cette liste va contenir les noms d’animaux lus dans le fichier.

2. `with open('liste_animaux.txt', 'r') as f :`
- La déclaration `with` avant la fonction `open()` garantit que le fichier est correctement fermé, même en cas d'erreurs.
- Les paramètres de fonction `open()` spécifient :
  - le fichier à lire (et le chemin vers son répertoire, le cas échéant) : `'liste_animaux.txt'`
  - le mode d'ouverture : `'r'` pour lire le fichier, `'w'` pour écrire un nouveau fichier, `'a'` pour ajouter à un fichier déjà existant
- L'expression `as f` sert à donner un nom à l’objet fichier que Python retourne lorsqu’il ouvre le fichier. Cet objet permet ensuite d’interagir avec le fichier. Le nom `f` n'a aucune importance, on aurait pu l'appeler `banane` !
- On termine la ligne 2 avec un `:`, ce qui indique le début d’un bloc qu'on indente (comme pour la boucle).

3. `for line in f :`

Parcourt chaque ligne du fichier f, une à une. À chaque tour de boucle, la variable `line` contient une ligne du fichier. De la même manière que `f` aurait pu être appelé `banane`, `line` peut prendre n'importe quel nom.

4. `line = line.strip()`

La commande `strip()` supprime les espaces, tabulations, et surtout les sauts de ligne (\n) en début et fin de ligne. Cela permet d’avoir une chaîne propre (juste le nom de l’animal).

5. `animaux.append(line)`

La commande `append()` ajoute la ligne nettoyée (le nom d’un animal) à la liste `animaux`.

In [102]:
animaux

['ours',
 'chien',
 'zèbre',
 'tigre',
 'ours',
 'zèbre',
 'zèbre',
 'tigre',
 'éléphant',
 'chat',
 'tigre',
 'loup',
 'tigre',
 'loup',
 'chat',
 'loup',
 'ours',
 'éléphant',
 'tigre',
 'tigre',
 'ours',
 'cheval',
 'chat',
 'loup',
 'tigre',
 'cheval',
 'loup',
 'zèbre',
 'chat',
 'zèbre',
 'lion',
 'tigre',
 'chat',
 'girafe',
 'chat',
 'cheval',
 'girafe',
 'tigre',
 'zèbre',
 'ours',
 'ours',
 'zèbre',
 'girafe',
 'tigre',
 'zèbre',
 'cheval',
 'chat',
 'tigre',
 'éléphant',
 'chien',
 'chien',
 'loup',
 'tigre',
 'lion',
 'chat',
 'tigre',
 'tigre',
 'éléphant',
 'tigre',
 'loup',
 'lion',
 'chien',
 'tigre',
 'tigre',
 'loup',
 'chat',
 'zèbre',
 'zèbre',
 'chat',
 'chat',
 'tigre',
 'chien',
 'zèbre',
 'zèbre',
 'zèbre',
 'éléphant',
 'lion',
 'tigre',
 'cheval',
 'girafe',
 'loup',
 'éléphant',
 'girafe',
 'éléphant',
 'tigre',
 'cheval',
 'loup',
 'éléphant',
 'loup',
 'lion',
 'zèbre',
 'zèbre',
 'tigre',
 'chat',
 'chat',
 'chien',
 'tigre',
 'zèbre',
 'loup',
 'ours',
 '

Exercice

Lire chaque ligne du fichier `prenom_age.txt`, extraire l'âge et afficher les personnes de plus de 30 ans.

In [None]:
#

Exercice

Lire le fichier `temperature_avril.txt` et calculer la moyenne de température.

In [116]:
#

### Finalement, on peut aussi appliquer la boucle `for` pour lire plusieurs fichiers en lot.

Défi !

Complétez le code suivant qui permet de lire tous les fichiers avec l'extension `.fasta` et de stocker toutes les séquences dans un seul dictionnaire.

In [106]:
import glob

filename = (glob.glob('data/*.fasta'))

#