# MANIPULATION DES FICHIERS AVEC PYTHON

# Qu'est-ce qu'un Fichier ?

Avant d'explorer comment travailler avec les fichiers en Python, il est important de comprendre ce qu'est exactement un fichier et comment les systèmes d'exploitation modernes gèrent certains de leurs aspects.

À son cœur, un fichier est un ensemble continu d'octets utilisé pour stocker des données. Ces données sont organisées dans un format spécifique et peuvent être aussi simples qu'un fichier texte ou aussi complexes qu'un programme exécutable. En fin de compte, ces fichiers d'octets sont ensuite traduits en binaire 1 et 0 pour faciliter le traitement par l'ordinateur.

Les fichiers sur la plupart des systèmes de fichiers modernes se composent de trois parties principales :

1. **En-tête :** métadonnées sur le contenu du fichier (nom du fichier, taille, type, etc.)
2. **Données :** contenu du fichier tel qu'écrit par le créateur ou l'éditeur
3. **Fin de fichier (EOF) :** caractère spécial indiquant la fin du fichier

![image.png](attachment:image.png)
Ce que représentent ces données dépend de la spécification de format utilisée, généralement représentée par une extension. Par exemple, un fichier avec une extension .gif correspond probablement à la spécification du format Graphics Interchange Format. Il existe des centaines, voire des milliers, d'extensions de fichier. Pour ce cours, vous ne traiterez que les extensions de fichier .txt ou .csv.

# Chemins de Fichiers

Lorsque vous accédez à un fichier sur un système d'exploitation, un chemin de fichier est requis. Le chemin de fichier est une chaîne de caractères qui représente l'emplacement d'un fichier. Il est divisé en trois parties principales :

1. **Chemin du Dossier :** l'emplacement du dossier sur le système de fichiers où les dossiers suivants sont séparés par une barre oblique / (Unix) ou un backslash \ (Windows).
2. **Nom du Fichier :** le nom réel du fichier.
3. **Extension :** la fin du chemin du fichier précédée d'un point (.) indiquant le type de fichier.

Voici un exemple rapide. Supposons que vous ayez un fichier situé dans une structure de dossier comme celle-ci :

```plaintext
/
│
├── path/  
|   │
|   ├── vehicules/ 
|   │   └── cars.txt
|   |   └── motos.txt
|   |   └── trucks.txt
|   │
|   └── planes.txt  
|
└── review.csv
```

Disons que vous vouliez accéder au fichier cars.txt, et que votre emplacement actuel était dans le même dossier que "path". Pour accéder au fichier, vous devez passer par le dossier "path" puis le dossier "vehicules", pour enfin arriver au fichier cars.txt. Le Chemin du Dossier est path/vehicules/. Le Nom du Fichier est cars. 

Mais que dire de planes.txt ? Comment y accéder sans utiliser le chemin complet ? Vous pouvez utiliser le caractère spécial double-point (..) pour remonter d'un répertoire. Cela signifie que ../planes.txt fera référence au fichier planes.txt dans le répertoire path.

```plaintext
/
│
├── path/  ← Faisant référence à ce dossier parent
|   │
|   ├── vehicules/  ← Répertoire de travail actuel (cwd)
|   │   └── cars.txt
|   |   └── motos.txt
|   |   └── trucks.txt
|   │
|   └── planes.txt  ← Accès à ce fichier
|
└── review.csv
```

# Ouverture et Fermeture d'un Fichier en Python

Lorsque vous souhaitez travailler avec un fichier, la première étape consiste à l'ouvrir. Cela se fait en invoquant la fonction intégrée `open()`. 
`open()` a un seul argument requis, le chemin vers le fichier. `open()` retourne un seul objet fichier :

In [3]:
file = open('cars.txt')
type(file)

_io.TextIOWrapper

Après avoir ouvert un fichier, la prochaine chose à apprendre est comment le fermer.

**Avertissement :** Vous devriez toujours vous assurer qu'un fichier ouvert est correctement fermé. Fermer les fichiers en Python libère les ressources système, assure l'enregistrement des modifications, et prévient les erreurs.
!!!!!!!!!!!!! Premier Façon : 

In [4]:
####################
file = open('cars.txt')
file.close()

La deuxieme façon de fermer un fichier est d'utiliser l'instruction `with` :
L'instruction `with` prend automatiquement en charge la fermeture du fichier une fois qu'elle quitte le bloc `with`, même en cas d'erreur.

In [5]:
with open('cars.txt') as reader:
    # Traitement supplémentaire du fichier va ici

SyntaxError: incomplete input (2184065233.py, line 2)

Il est probable que vous voudrez également utiliser le deuxième argument positionnel, `mode`. Cet argument est une chaîne de caractères qui contient plusieurs caractères pour représenter comment vous souhaitez ouvrir le fichier. La valeur par défaut et la plus courante est 'r', qui représente l'ouverture du fichier en mode lecture seule en tant que fichier texte :

In [6]:
with open('cars.txt', 'r') as reader:
    # Traitement supplémentaire du fichier va ici

SyntaxError: incomplete input (2139562724.py, line 2)

**Voici un tableau résumant les modes d'ouverture de fichiers les plus courants en Python :**

| Mode | Description |
|---|---|
| **'r' (lecture)** | Ouvre un fichier en lecture seule. Génère une erreur si le fichier n'existe pas. |
| **'w' (écriture)** | Ouvre un fichier en écriture seule. Crée un nouveau fichier s'il n'existe pas, sinon écrase le contenu existant. |
| **'a' (ajout)** | Ouvre un fichier pour l'ajout (ajouter du contenu à la fin). Crée un nouveau fichier s'il n'existe pas. |
| **'r+' (lecture et écriture)** | Ouvre un fichier à la fois en lecture et en écriture. Génère une erreur si le fichier n'existe pas. |
| **'w+' (écriture et lecture)** | Ouvre un fichier à la fois en écriture et en lecture, mais écrase le contenu existant. Crée un nouveau fichier s'il n'existe pas. |



# Lecture et Écriture dans les Fichiers Ouverts

# Lecture des Fichiers

Une fois que vous avez ouvert un fichier, vous voudrez le lire ou écrire dedans. Tout d'abord, parlons de la lecture d'un fichier. Il existe plusieurs méthodes qui peuvent être appelées sur un objet fichier pour vous aider :

| Méthode | Description |
| --- | --- |
| `.read(size=-1)` | Lit le nombre d'octets spécifié par la taille depuis le fichier. Si aucun argument n'est passé, None ou -1 est passé, alors le fichier entier est lu. |
| `.readline(size=-1)` | Lit au plus la quantité spécifiée par la taille de caractères de la ligne. Cela continue jusqu'à la fin de la ligne, puis reboucle. Si aucun argument n'est passé, None ou -1 est passé, alors la ligne entière (ou le reste de la ligne) est lue. |
| `.readlines()` | Lit les lignes restantes de l'objet fichier et les renvoie sous forme de liste. |

En utilisant le même fichier `cars.txt` que précédemment, examinons quelques exemples d'utilisation de ces méthodes. Voici un exemple de comment ouvrir et lire le fichier entier avec `.read()` :

In [7]:
with open('cars.txt', 'r') as reader:
    # Lit et imprime le fichier entier
    print(reader.read())

Land Rover Defender: The king of all-terrain vehicles
Tesla Model S: The epitome of electric luxury
Porsche 911: Few cars inspire as much passion as the Porsche 911
Volkswagen Golf GTI: The hot hatch that started it all
Toyota Prius: The pioneer of hybrid cars


Voici un exemple de lecture de 5 octets de chaque ligne à l'aide de la méthode `.readline()` de Python :

In [8]:
with open('cars.txt', 'r') as reader:
    # Lit et imprime les 5 premiers caractères de la ligne 5 fois
    print(reader.readline(5))
    # Remarquez que la ligne est plus longue que les 5 caractères et continue
    # sur la ligne, lisant 5 caractères à chaque fois jusqu'à la fin de la
    # ligne, puis "reboucle"
    print(reader.readline(5))
    print(reader.readline(5))
    print(reader.readline(5))
    print(reader.readline(5))

Land 
Rover
 Defe
nder:
 The 


Voici un exemple de lecture du fichier entier sous forme de liste à l'aide de la méthode `.readlines()` de Python :

In [9]:
fichier = open('cars.txt')
listeDesLignes = fichier.readlines()  # Renvoie un objet liste
listeDesLignes

['Land Rover Defender: The king of all-terrain vehicles\n',
 'Tesla Model S: The epitome of electric luxury\n',
 'Porsche 911: Few cars inspire as much passion as the Porsche 911\n',
 'Volkswagen Golf GTI: The hot hatch that started it all\n',
 'Toyota Prius: The pioneer of hybrid cars']

L'exemple ci-dessus peut également être réalisé en utilisant `list()` pour créer une liste à partir de l'objet fichier :

In [10]:
f = open('cars.txt')
list(f)

['Land Rover Defender: The king of all-terrain vehicles\n',
 'Tesla Model S: The epitome of electric luxury\n',
 'Porsche 911: Few cars inspire as much passion as the Porsche 911\n',
 'Volkswagen Golf GTI: The hot hatch that started it all\n',
 'Toyota Prius: The pioneer of hybrid cars']

## Itération sur Chaque Ligne du Fichier

Une chose courante à faire lors de la lecture d'un fichier est d'itérer sur chaque ligne. Voici un exemple de comment utiliser la méthode `.readline()` de Python pour effectuer cette itération :


In [11]:
with open('cars.txt', 'r') as reader:
    # Lit et imprime le fichier entier ligne par ligne
    line = reader.readline()
    while line != '':  # Le caractère de fin de fichier est une chaîne vide
        print(line, end='')
        line = reader.readline()

Land Rover Defender: The king of all-terrain vehicles
Tesla Model S: The epitome of electric luxury
Porsche 911: Few cars inspire as much passion as the Porsche 911
Volkswagen Golf GTI: The hot hatch that started it all
Toyota Prius: The pioneer of hybrid cars

Une autre façon d'itérer sur chaque ligne du fichier est d'utiliser la méthode `.readlines()` de l'objet fichier. N'oubliez pas que `.readlines()` renvoie une liste où chaque élément dans la liste représente une ligne dans le fichier :

In [12]:
with open('cars.txt', 'r') as reader:
    for line in reader.readlines():
        print(line, end='')

Land Rover Defender: The king of all-terrain vehicles
Tesla Model S: The epitome of electric luxury
Porsche 911: Few cars inspire as much passion as the Porsche 911
Volkswagen Golf GTI: The hot hatch that started it all
Toyota Prius: The pioneer of hybrid cars

Cependant, les exemples ci-dessus peuvent être simplifiés en itérant directement sur l'objet fichier lui-même :

In [13]:
with open('cars.txt', 'r') as reader:
    # Lit et imprime le fichier entier ligne par ligne
    for line in reader:
        print(line, end='')

Land Rover Defender: The king of all-terrain vehicles
Tesla Model S: The epitome of electric luxury
Porsche 911: Few cars inspire as much passion as the Porsche 911
Volkswagen Golf GTI: The hot hatch that started it all
Toyota Prius: The pioneer of hybrid cars

Cette approche finale est plus pythonique et peut être plus rapide et plus efficace en mémoire. Par conséquent, il est recommandé de l'utiliser à la place.

**Note :** Certains des exemples ci-dessus contiennent `print('some text', end='')`. L'argument `end=''` sert à empêcher Python d'ajouter une nouvelle ligne supplémentaire au texte qui est imprimé et n'imprime que ce qui est lu depuis le fichier.

## Écriture des fichiers

Maintenant, plongeons dans l'écriture de fichiers. Tout comme pour la lecture de fichiers, les objets fichier ont plusieurs méthodes utiles pour écrire dans un fichier :

| Méthode | Description |
| --- | --- |
| `.write(string)` | Écrit la chaîne dans le fichier. |
| `.writelines(seq)` | Écrit la séquence dans le fichier. Aucune fin de ligne n'est ajoutée à chaque élément de la séquence. C'est à vous d'ajouter les fins de ligne appropriées. |

Voici un exemple rapide d'utilisation de `.write()` et `.writelines()` :

In [15]:
print("Cars file : \n")
with open('cars.txt', 'r') as reader:
    cars = list(reader)
    for line in reader:
        print(line, end='')
    

with open('cars_reversed.txt', 'w') as writer:
    # Alternativement, vous pourriez utiliser
    # writer.writelines(reversed(cars))

    # Écrit les voitures dans l'ordre inverse
    for car in reversed(cars):
        writer.write(car)
print(" \n")
print("Reversed file : \n")
with open('cars_reversed.txt', 'r') as reader:
    for line in reader:
        print(line, end='')
        
        
print(" \n")
print("en utilisent writelines")
#en utilisent writelines  
with open('cars_reversed_readlines.txt', 'w') as writer:
    writer.writelines(reversed(cars))

with open('cars_reversed_readlines.txt', 'r') as reader:
    for line in reader:
        print(line, end='')
    

Cars file : 

 

Reversed file : 

Toyota Prius: The pioneer of hybrid carsVolkswagen Golf GTI: The hot hatch that started it all
Porsche 911: Few cars inspire as much passion as the Porsche 911
Tesla Model S: The epitome of electric luxury
Land Rover Defender: The king of all-terrain vehicles
 

en utilisent writelines
Toyota Prius: The pioneer of hybrid carsVolkswagen Golf GTI: The hot hatch that started it all
Porsche 911: Few cars inspire as much passion as the Porsche 911
Tesla Model S: The epitome of electric luxury
Land Rover Defender: The king of all-terrain vehicles


## EXTRAS
## Écriture d'une chaîne dans un fichier binaire 
   
   Ajoutez une section sur l'écriture et la lecture de fichiers binaires. Montrez comment ouvrir un fichier en mode binaire ('wb' pour écriture binaire, 'rb' pour lecture binaire) et écrire une chaîne binaire dans le fichier. Vous pouvez également ajouter un exemple de lecture de ce fichier binaire.

In [7]:
with open('other_files/binary_file.bin', 'wb') as binary_writer:
    binary_writer.write(b'Master MASD')

In [6]:
with open('other_files/binary_file.bin', 'rb') as binary_reader:
    binary_data = binary_reader.read()
    print(binary_data)

b'Master MASD'


2. **Lecture de fichiers JSON, XML et CSV :**

   Ajoutez une section sur la lecture de fichiers JSON, XML et CSV, car ce sont des formats de fichier couramment utilisés dans le traitement des données.

   - **Lecture de JSON :**

In [9]:
import json

    with open('other_files/data.json', 'r') as json_file:
        data = json.load(json_file)
        print(data)

IndentationError: unexpected indent (3511426577.py, line 3)

  - **Lecture de XML :**

In [8]:
import xml.etree.ElementTree as ET

    tree = ET.parse('data.xml')
    root = tree.getroot()

    for element in root:
        print(element.tag, element.text)

IndentationError: unexpected indent (2268931031.py, line 3)

   - **Lecture de CSV :**

In [None]:
 import csv

    with open('data.csv', 'r') as csv_file:
        csv_reader = csv.reader(csv_file)
        for row in csv_reader:
            print(row)

3. **Élargissement de la section sur l'écriture de fichiers :**

   Ajoutez des exemples plus détaillés sur l'écriture de fichiers, y compris l'utilisation de la méthode `.write()` pour écrire des chaînes, et la méthode `.writelines()` pour écrire une liste de lignes.

In [None]:
# Écriture de chaînes dans un fichier
with open('output.txt', 'w') as text_writer:
    text_writer.write("Hello, this is a text file.")

# Écriture de lignes à partir d'une liste
lines_to_write = ['Line 1\n', 'Line 2\n', 'Line 3\n']

with open('output_lines.txt', 'w') as lines_writer:
    lines_writer.writelines(lines_to_write)

4. **Ajout de remarques sur les gestionnaires de contexte (with) :**

   Renforcez l'importance des gestionnaires de contexte (with) pour garantir que les fichiers sont correctement fermés, en particulier lors de l'écriture de données dans un fichier.


In [None]:
with open('output.txt', 'w') as text_writer:
    text_writer.write("Hello, this is a text file.")
# Le fichier est automatiquement fermé à la sortie du bloc with