## Gérer des fichiers avec Python

### Généralités

Les ordinateurs sont assez merveilleux, mais ils le seraient moins s'ils n'étaient pas capables d'enregistrer des données et de ne pas les perdre une fois que le programme (ou l'ordinateur) est éteint. Dans ce (court) tutoriel, je vais vous apprendre à 

* Ouvrir un fichier, le lire, et écrire dedans grâce à la fonction `open()` et le mot-clé `with`
* Trouver des fichiers dans une arborescence avec le mini-module `glob`, et changer de dossier avec le mini-module `os`
* Faire un peu d'_analyse syntaxique_ (parsing) avec l'infernal mini-module `re` 

### Manipulation des fichiers 

En Python, manipuler des fichiers est vraiment aisé. En même temps, cela n'est pas non plus si difficile que ça dans les autres langages de progammation... 

#### Ouverture et fermeture

Supposons que je veux lire un fichier (bien nommé `toto` dans la tradition française) dans le sous-dossier `files` de mon dossier actuel. Rien de plus simple, j'utilise simplement la fonction Python native `open()`. Une fois que le fichier est ouvert, je peux utiliser la _méthode_ `.close()` associée au fichier pour le fermer.

_Note_ Pour accéder à votre sous-dossier `files` et les fichiers qui s'y trouvent, vous devrez utiliser une barre oblique `/` (sous Mac, Unix et en fait même sous Windows), mais si vous êtes un fana de Windows, sachez que les barres obliques inverses de Windows `\` doivent être doublées `\\` pour être correctement interprétées. 

In [6]:
my_file = open('files/toto')
my_file.close()                 # A very discreet peek !

Une possibilité alternative consiste à ouvrir mon fichier dans bloc `with ... as ...` de la manière suivante :

In [11]:
with open('files/toto') as my_file:
    print('File is open !')


File is open !


La principale différence, ici, est que pour un nom de fichier _incorrect_, la première version du code va renvoyer une erreur, tandis que la version construite avec `with .. as ..`, elle, ne va pas renvoyer une erreur. Essayez, par exemple, d'ouvrir un fichier `titi` qui, lui, n'existe pas ... encore :-)

#### Accès en lecture et écriture

Par défaut, Python vous laisse lire un fichier, c'est l'accès `'r'` des amateurs d'Unix. Vous pouvez décider à la place que vous souhaitez créer un nouveau fichier et écrire dedans. Dans ce cas, on va préciser un argument à `open()` nommé `mode`. Il existe [bien des modes](https://docs.python.org/3/library/functions.html#open), les principaux étant : 

* `'r'` : accès en _lecture seule_. Va planter si le fichier n'existe pas
* `'w'` : accès en _écriture_ pour un fichier. __Va écraser le fichier existant__. Ne plante pas si le fichier n'existe pas.
* `'a'` : accès en _écriture_ pour un fichier. __Ajoute le contenu à la suite du fichier__. Ne plante pas si le fichier n'existe pas.
* `'x'` : création d'un nouveau fichier, et accès _en écriture_ de celui-ci. Plante si le fichier existe déjà.

Tous ces modes d'ouverture correspondent à des fichiers qui contiennent du _texte_.

##### Lecture avec `read()`, `readlines()` et `readlines()` et `for`

Pour lire l'intégralité d'un fichier, on va simplement utiliser la méthode `.read()` du fichier, sans argument. Dans un tel cas, Python va lire tout le fichier et nous le renvoyer dans une variable. Cela donne : 

In [19]:
with open('files/toto') as my_file:
    txt = my_file.read()
print(txt)

This file is named 'toto'
It is a very nice file
How are you doing today ? 
Is the weather nice ?
Here is my shopping list for this week 
-----------------------
Beetroots   1 kg
Potatoes    2 kg
Leeks   1 kg
Pasta   2 kg
Hummus  3 kg
Milk    2 litres
Tea 2 litres
Butter  500 g
-----------------------
We are dangerously approaching the end of the file
Hope you are still having a nice day !


Vous l'aurez peut-être remarqué, ma variable `txt` est une simple chaîne de caractères. On a parfois besoin de lire le code ligne par ligne, ou de séparer les lignes en question durant la lecture. La méthode `.readlines()` va lire tout le fichier et renvoyer une liste dont chaque élément corresond à une ligne du fichier. On peut alors demander à Python de n'imprimer qu'une ligne (au choix) du fichier.

_Note_ : cette fonction est __bien entendu déconseillée__ pour les très gros fichiers qui dépassent les centaines de milliers de lignes. 

In [21]:
with open('files/toto') as my_file:
    lst = my_file.readlines()

print(lst[0])
print(lst[-1])

This file is named 'toto'

Hope you are still having a nice day !


Vous pouvez enfin demander à Python de ne lire qu'une seule ligne et d' 'aller à la ligne suivante' ensuite avec la méthode `.readline()`. Celle-ci se combine bien avec une boucle `while` : 

In [27]:
with open('files/toto') as my_file:
    txt = my_file.readline()
    is_file_finished = False
    while not is_file_finished:
        print(txt)
        txt = my_file.readline()
        is_file_finished = (txt == '')

This file is named 'toto'

It is a very nice file

How are you doing today ? 

Is the weather nice ?

Here is my shopping list for this week 

-----------------------

Beetroots   1 kg

Potatoes    2 kg

Hummus  3 kg

Milk    2 litres

Tea 2 litres

Butter  500 g

-----------------------

We are dangerously approaching the end of the file

Hope you are still having a nice day !


Pour savoir si le fichier est terminé ou non, on examine le résultat de `my_file.readline()`. Si celui-ci est une chaîne de caractères vide: `''`, alors le fichier est terminé. 

Si vous êtes _encore plus paresseux_ (et c'est une bonne chose), vous pouvez même directement utiliser une boucle `for` du type `for x in my_file` pour que votre variable `x` 'devienne' chacune des lignes du fichier, à la manière d'un `.readline()`. Le code devient alors limpide, même si on peut se demander pourquoi on a le droit d'effectuer une telle diablerie :

In [28]:
with open('files/toto') as my_file:
    for line in my_file:
        print(line)

This file is named 'toto'

It is a very nice file

How are you doing today ? 

Is the weather nice ?

Here is my shopping list for this week 

-----------------------

Beetroots   1 kg

Potatoes    2 kg

Hummus  3 kg

Milk    2 litres

Tea 2 litres

Butter  500 g

-----------------------

We are dangerously approaching the end of the file

Hope you are still having a nice day !
