# Manipuler des fichiers

## Ouvrir un fichier

Comme pour un livre, un fichier doit s'ouvrir et se fermer. Les deux opérations se réalisent en une seule instruction, grâce à l'instruction `with`, accompagnée de la fonction `open()`, qui indique au langage qu'il doit travailler avec un objet, lui laissant le soin de fermer le flux vers le fichier à la fin du bloc d'instructions.

La fonction `open()` accepte deux arguments. Le premier est le chemin vers le fichier à ouvrir. S'il se trouve dans le répertoire courant, son nom seul est requis. Le second argument est le mode d'ouverture.

Il existe trois modes d'ouverture de fichier :
- **Mode lecture seule :** aucune écriture autorisée dans le fichier ;
- **Mode écriture :** écriture à partir du début du fichier, ce qui signifie qu'un fichier du même nom pré-existant sera systématiquement remplacé ;
- **Mode ajout :** écriture à la fin du fichier.

In [None]:
with open("../documents/heat.txt", "r") as src:
    print src

Ici, le mode d'ouverture est *read* (*r*). On aurait pu en faire l'économie, car le mode en lecture seule est le mode par défaut. Les autres modes possibles sont *w* pour *write* et *a* pour *append*.

## Lire un fichier

Il existe plusieurs méthodes pour afficher les informations contenues dans un fichier. Avant d'opter pour l'une ou l'autre, vous devez vous poser la question de la finalité de votre programme :
- La méthode `read()` pour afficher les données au format brut, sous forme de chaîne de caractères.
- La méthode `readline()` pour afficher la ligne courante au format brut, augmentée d'un retour à la ligne, sous forme de chaîne de caractères.
- La méthode `readlines()` pour afficher les données au format brut, sous forme de liste.

### Méthode `read()`

Elle prend un argument numérique facultatif, qui représente le nombre de caractères que vous souhaitez afficher à partir de la position courante du curseur. Par défaut, elle renvoie la totalité des caractères du fichier.

In [None]:
# Initialisation d'un descripteur de fichier
with open("../documents/heat.txt", "r") as src:
    # Lecture des 340 premiers caractères.
    print src.read(340)
    # Lecture des 164 qui suivent.
    print src.read(164)

### Méthode `readline()`

Elle affiche la ligne courante du fichier, dans la limite du nombre de caractères défini en paramètre par un argument numérique. Chaque appel à la méthode génère une nouvelle ligne (*\n*).

In [None]:
with open("../documents/heat.txt") as src:
    # Affiche les 141 premiers caractères de la ligne courante.
    print src.readline(141)
    # reprise de l'affichage de la ligne courante jusqu'au dernier caractère.
    print src.readline()
    # Affichage de la ligne suivante (dans le fichier : ligne vide).
    print src.readline()

Grâce à cette méthode, on peut concevoir un algorithme très simple pour parcourir un fichier ligne par ligne :
```
Utilisation du fichier comme objet "src" :
    Tant qu'il reste des lignes à afficher :
        Afficher la ligne courante
```

In [None]:
# Utilisation du fichier
with open("../documents/heat.txt") as src:
    # Boucle infinie, la condition est toujours vraie
    while True:
        # Lecture ligne par ligne
        txt = src.readline()
        # Si la ligne courante est vide :
        if not txt:
            # On stoppe l'instruction, ce qui a pour effet de sortir de la boucle infinie
            break
        else:
            print txt,

L'accès séquentiel présente un avantage certain en terme de consommation de ressources.

### Méthode `readlines()`

Plutôt que de retourner une chaîne de caractères, cette méthode retourne une liste des lignes du fichier. Elle opère la séparation aussitôt qu'elle rencontre un caractère de nouvelle ligne (*\n*).

In [None]:
# Utilisation du fichier
with open("../documents/heat.txt") as src:
    # Affichage du contenu sous forme de liste
    print src.readlines()

Comme nous savons parcourir simplement une liste, il serait tentant d'utiliser cette méthode pour afficher l'ensemble du texte, au prix d'une consommation élevée de ressources :

In [None]:
# Utilisation du fichier
with open("../documents/heat.txt") as src:
    # Récupération du contenu sous forme de liste
    lignes = src.readlines()
    # Affichage de chaque ligne
    for ligne in lignes:
        # Strip() permet de supprimer le retour à la ligne ajouté par readlines()
        print ligne.strip()

Une meilleure méthode consiste à tirer parti de l'objet `fichier` qui dispose de son propre itérateur :

In [None]:
# Utilisation du fichier
with open("../documents/heat.txt") as src:
    # Pour chaque ligne dans mon fichier
    for ligne in src:
        # Affichage de la ligne
        print ligne,