<div>
    <h1>Gestion des fichiers</h1>
    <p>Python permet très facilement de manipuler des fichiers tout en garantissant
        une très bonne portabilité du code quel que soit le système d’exploitation
        sur lequel s’exécute le programme (pour peu que le développeur soit attentif
        à ce type de problématique).
    </p>
    <p>Les opérations de manipulation de fichier : écriture, lecture, création, suppression
        sont toutes susceptibles d’échouer. Dans ce cas, les fonctions ou les méthodes
produiront une erreur de type <strong>OSError</strong> ou d’un type héritant de cette exception.
    </p>
</div>
    

<div>
        <h2>Ouvrir et fermer un fichier</h2>
        <p>La fonction <strong>open()</strong> permet de récupérer un descripteur de fichier en
            passant en paramètre le chemin de ce fichier. Le descripteur de fichier va
            nous permettre de réaliser les opérations de lecture et/ou d’écriture dans le
            fichier.
        </p>
        <p>Un descripteur de fichier est une ressource système. Cela signifie qu’il est
            géré par le système d’exploitation. Lorsque les opérations sur le fichier sont
            terminées, il faut fermer le descripteur de fichier à l’aide de la méthode
            <strong>close()</strong>. Ne pas fermer un descripteur de fichier conduit à une fuite
            de ressources (<em>resource leak</em>). Si un programme ouvre trop de fichiers sans
            jamais fermer les descripteurs de fichiers, le système d’exploitation peut
            finir par refuser d’ouvrir des fichiers supplémentaires.
        </p>
</div>

In [5]:
f = open("monfichier.txt")
# faire des opérations sur le contenu du fichier
f.close()


<p>Comme des erreurs peuvent survenir lors de la lecture ou de l’écriture dans
    un fichier ou comme il est très facile d’oublier d’appeler la méthode<strong>
    close()</strong>, Python fournit une syntaxe spéciale :
  le <strong>with</strong>.</p>

In [6]:
with open("monfichier.txt") as f:
    # faire des opérations sur le contenu du fichier
    pass

<p>La syntaxe with <strong>appelle automatiquement</strong> la méthode close() 
    du descripteur de fichier à la sortie du bloc (même si
    la sortie du bloc est due à une erreur).
 </p>

<div>
    <p><strong>Note</strong></p>
    <p>La syntaxe <strong>with</strong> fonctionne en Python pour divers types
        de ressources du système : les fichiers, les accès réseau, les processus,
        les objets de synchronisation entre processus et threads.
    </p>
    <p>Vous pouvez gérer plusieurs ressources avec un <strong>with</strong> :</p>
</div>


In [8]:
with open("monfichier.txt") as f, open("autrefichier.txt") as f2:
    # faire des opérations sur le contenu des fichiers
    pass

<p>Si vous souhaitez développer une classe qui fonctionne comme un gestionnaire
    de ressources et dont les instances peuvent être initialisées dans une structure
    <strong>with</strong> comme les descripteurs de fichiers, alors votre classe
    doit fournir une implémentation pour les méthodes spéciales
    <strong>__enter__()</strong> et<strong> __exit__()</strong>
 </p>


<div>
    <h2>Lire le contenu d’un fichier</h2>
    <p>Par défaut, la fonction <strong>open()</strong> permet de lire le contenu d’un
        fichier texte.
    </p>
    <p>Supposons que nous ayons un fichier nommé <code color= "red">dialogues.txt</code> dans le répertoire
        courant.
    </p>

<p>Pour obtenir le contenu du fichier dans une chaîne de caractères :</p>

In [10]:
with open("dialogues.txt") as f:
    contenu = f.read()
print(contenu)


- Halte ! Qui va là?

- C'est moi, Arthur, fils d'Uther Pendragon, du château
  de Camelot. Roi des Bretons, vainqueur des Saxons,
  souverain de toute l'Angleterre !



<p>Pour obtenir le contenu du fichier sous la forme d’un tableau de chaînes de
caractères (un élément par ligne) :</p>

In [11]:
with open("dialogues.txt") as f:
    lignes = f.readlines()
print(len(lignes))

5


<p>Un descripteur de fichier agit également comme une séquence sur les lignes
d’un fichier.</p>

In [12]:
with open("dialogues.txt") as f:
    for ligne in f:
        print(ligne)

- Halte ! Qui va là?



- C'est moi, Arthur, fils d'Uther Pendragon, du château

  de Camelot. Roi des Bretons, vainqueur des Saxons,

  souverain de toute l'Angleterre !



<p> <strong> Note </strong> </p>
<p>Lorsqu’on lit un fichier texte, chaque ligne inclue le caractère de retour
    à la ligne présent dans le fichier. Pour le supprimer, on peut utiliser
    la méthode <strong>str.rstrip()</strong></p>

In [13]:
with open("dialogues.txt") as f:
    for ligne in f:
        print(ligne.rstrip('\n'))

- Halte ! Qui va là?

- C'est moi, Arthur, fils d'Uther Pendragon, du château
  de Camelot. Roi des Bretons, vainqueur des Saxons,
  souverain de toute l'Angleterre !


<div>
    <h2>Les modes de fichier</h2>
    <p>Lorsqu’on ouvre un fichier, il faut préciser le mode d’ouverture qui dépend
        du type du fichier et des opérations que l’on souhaite réaliser. Le mode est
        représenté par une chaîne de caractères qui est passée à la fonction <strong>open()</strong>
        avec le paramètre <strong>mode</strong>.
    </p>
 </div>
 
 | Mode | Description |
| :--- | :---------- |
| r | ouverture en lecture (mode par défaut) |
| w | ouverture en écriture (efface le contenu précédent) |
| x | ouverture uniquement pour création (l’ouverture échoue si le fichier existe déjà) |
| + | ouverture en lecture et écriture |
| a | ouverture en écriture pour ajout en fin de fichier |
| b | fichier binaire |
| t | fichier texte (mode par défaut) |

--------


In [15]:
# ouverture en écriture
with open("dialogues.txt", mode="w") as f:
    pass

In [16]:
# ouverture d'un fichier binaire en création
with open("fichier.bin", mode="xb") as f:
    pass

<div>
    <h3>Spécificité du mode texte</h3>
    <p>Ouvrir un fichier en mode texte (mode par défaut ou <strong>t</strong>) entraîne
        un travail de conversion par Python. Convertir les données d’un fichier
        en chaîne de caractères exige d’utiliser une <strong>famille d’encodage</strong>. Il est
        possible de préciser la famille d’encodage d’un fichier grâce au paramètre <code> encoding </code>
    </p>

In [18]:
# ouverture en écriture
with open("dialogues.txt", encoding="utf-8") as f:
    pass

<p>Si le paramètre <code><span>encoding</span></code> n’est pas spécifié alors Python utilise
    un encodage qui est <strong>dépendant du système</strong> qui exécute le code (ce qui
    peut nuire à la portabilité des fichiers produits). Pour connaître l’encodage
    utilisé par défaut par l’interpréteur, il faut utiliser les méthodes du
    module <code ><span>locale</span></code>:</p>


In [19]:
import locale

locale.getpreferredencoding()
'UTF-8'

'UTF-8'

<p>Le mode texte entraîne également une conversion des caractères de
    fin de ligne puisque tous les systèmes d’exploitation n’utilisent pas la même convention.
    Python garantit une représentation universelle du caractère de fin de ligne
en utilisant <code ><span>\n</span></code>.
</p>
<p>Le mode binaire (<code ><span>b</span></code>) est un mode qui permet d’accéder directement au
    contenu du fichier sans conversion de la part de Python. Dans ce cas,
    la lecture du fichier retourne des <code ><span>bytes</span></code> et non pas des chaînes
    de caractères.
</p>

<div >
<h2>Écrire dans un fichier</h2>
<p>Pour écrire d’un bloc dans un fichier, on peut utiliser la méthode
    <code><span>write()</span></code> et pour écrire une liste de lignes, il faut utiliser
    la méthode <code ><span>writelines()</span></code>. Attention pour les fichiers textes,
    ces méthodes n’ajoutent pas de caractères de fin de ligne, il faut donc les
    écrire explicitement.
</p>

In [20]:
lignes = ["- Pull the other one!\n",
          "- I am. And this my trusty servant Patsy.\n"]

# ouverture d'un fichier texte en ajout
with open("dialogues.txt", mode="a") as f:
    f.writelines(lignes)


<p><strong>Prudence</strong></p>
<p>Il faut se rappeler que le mode d’ouverture en écriture (<code><span>w</span></code>) <strong>remplace
    intégralement</strong> le contenu du fichier. Pour ajouter à la fin du fichier, il
    faut ouvrir le fichier en mode ajout (<code><span>a</span></code>) sous peine de perdre tout
    le contenu précédemment sauvé.
</p>

<h2>Chemin de fichier</h2>
<p>Les fichiers sont organisés selon une structure arborescente dans laquelle
    un nœud peut être soit un fichier soit un répertoire. Même si tous les systèmes
    d’exploitation suivent le même principe, il existe des différences majeures
    d’organisation. Le système MS-Windows utilise un système de fichiers multi-têtes
    (c:, d:, e:…) tandis que les systèmes *nix et MacOS utilisent un système
     mono-tête dont la racine est <code ><span>/</span></code>. Dans la représentation des chemins
    de fichiers, MS-Windows utilise le caractère <code><span>\</span></code> pour séparer les composants
    d’un chemin :
</p>

<p>tandis que les systèmes *nix et MacOs utilisent le caractère <code><span>/</span></code></p>

<p>Enfin, il faut se souvenir que le système de fichiers de MS-Windows n’est pas sensible
    à la casse (<em>case insensitive</em>), c’est-à-dire que les mots peuvent être écrits
    en lettres majuscules ou en lettres minuscules. Au contraire, les systèmes
    *nix et MacOS sont sensibles à la casse (<em>case sensitive</em>), c’est-à-dire qu’un
    mot écrit en lettres majuscules est différent d’un mot écrit en lettres minuscules.
</p>
<p>Toutes ces nuances peuvent rendre difficiles l’écriture d’un programme portable
    d’un système à l’autre. Heureusement, la bibliothèque standard Python fournit
    plusieurs solutions pour aider les développeurs.
</p>

<div >
    <h3>Le module <em>os.path</em></h3>
<p>Le module <code><span>os.path</span></code> fournit des fonctions élémentaires pour nous aider à
    gérer les chemins de fichiers.
</p>
<dl>
    <dt>
        <code><span>join()</span></code>
    </dt>
    <dd>
        <p>Cette fonction permet de créer un chemin en utilisant le séparateur approprié
            pour le système.
        </p> 

In [None]:
import os.path as path

chemin = path.join("fichiers", "monfichier.txt")
print(chemin)
# Sous Windows affiche fichiers\monfichier.txt
# Sous *nix ou MacOS, affiche fichiers/monfichier.txt

<dt><code><span>abspath()</span></code></dt><dd>
    <p>Cette fonction retourne le chemin absolu.</p>

In [None]:
import os.path as path

chemin = path.abspath("monfichier.txt")
print(chemin)
# Si le répertoire de travail est /home/david/Documents
# affiche /home/david/Documents/monfichier.txt

<h3>Le module <em>pathlib</em></h3>
<p>Le module <code><span>pathlib</span></code> est un module de haut-niveau qui permet à la fois
    de manipuler un chemin mais également d’interagir avec le fichier ou le répertoire
    désigné par ce chemin. C’est un module tout-en-un qui facilite grandement le
    travail sur les fichiers. L’élément central du module est la classe
<code><span>Path</span></code>.
</p>


<p>La classe<code><span>Path</span></code> possède la méthode <code><span>open()</span></code>
    qui accepte les mêmes paramètres que la fonction <code><span>open()</span></code> sauf le chemin
    qui est déjà représenté par l’objet lui-même :
</p>

In [23]:
from pathlib import Path


chemin = Path("dialogues.txt")

with chemin.open() as f:
    for ligne in f:
        print(ligne)


- Pull the other one!

- I am. And this my trusty servant Patsy.



<p>On peut même faire l’économie de ce code en appelant la méthode <code ><span >read_text()</span></code>
    qui ouvre le fichier en mode texte, lit l’intégralité du fichier et referme le fichier :
</p>

In [24]:
from pathlib import Path


chemin = Path("dialogues.txt")
contenu = chemin.read_text()

<p>Pour construire un chemin à partir d’un autre chemin, il suffit
    d’utiliser l’opérateur <code ><span>/</span></code> qui est utilisé, non pas comme opérateur de la
    division, mais comme le séparateur universel de chemin de fichiers :
</p>

<h2>Actions sur les fichiers</h2>
<p>Il est possible de réaliser des opérations élémentaires sur les fichiers soit avec les modules <code ><span>os</span></code> et <code><span >shutil</span></code> soit avec le module <code><span>pathlib</span></code>.
    Les modules <code ><span>os</span></code> et <code >shutil</code> sont historiquement les premiers modules qui ont été introduits
    en Python. Ils proposent surtout des fonctions alors que le module <code ><span >pathlib</span></code>
    est orienté objet avec notamment la classe <code><span >Path</span></code>.
</p>

<h3>Copier un fichier</h3>
<div>Avec le module <code ><span>shutil</span></code></div>


<h3>Supprimer un fichier</h3>
<div>Avec le module <code ><span>os</span></code></div>


<div>Avec le module <code ><span>os</span></code></div>


<h3>Vérifier qu'un fichier existe</h3>
<div>Avec le module <code ><span>os.path</span></code></div>


<div>Avec le module <code ><span>pathlib</span></code></div>


<h3>Rechercher des fichiers</h3>
<p>Le module <code ><span >glob</span></code> permet d’effectuer une recherche dans l’arborescence
    de fichiers. On peut utiliser le caractère <code><span >?</span></code> pour représenter n’importe
    quel caractère et  <code ><span >*</span></code> pour représenter n’importe quelle suite de caractères.
</p>

<div>Avec le module <code><span>glob</span></code></div>

<p>Il est possible d’effectuer une recherche récursive (c’est-à-dire en incluant les sous répertoires)
    en positionnant la paramètre <code><span>recursive</span></code> à <code><span>True</span></code> et en utilisant
    la séquence <code ><span >**</span></code> pour indiquer un ou plusieurs sous répertoires.</p>
<div>Avec le module <code ><span>glob</span></code></div>


<p>La classe <code><span>Path</span></code> possède également la méthode
    <code><span>glob()</span></code>.
</p>
<div>Avec le module <code><span>pathlib</span></code></div>


<p>La méthode <code><span>glob()</span></code> retourne un itérateur sur des objets de
    type <code><span>Path</span></code> plutôt qu’un tableau de chaînes de caractères comme
    <code><span>glob.glob()</span></code>.
</p>


<h2>Lecture de fichiers CSV</h2>
<p>Le fichier CSV (<em>comma separated values</em>) est un format texte très simple pour
    stocker des tables de données. Le module <code><span>csv</span></code> offre des méthodes pour lire
    et écrire.
</p>
<p>Si on dispose du fichier suivant :</p>

<div><span>Le fichier <em>filmographie.csv</em></span></div>

In [25]:
import csv

with open("filmographie.txt") as f:
    lecteur = csv.reader(f)
    for ligne in lecteur:
        print(ligne)


['1971', 'And Now for Something Completely Different']
['1975', 'Holy Grail']
['1979', 'Life of Brian']
['1983', 'The Meaning of Life']
['1996', 'The Wind in the Willows']
