# Python : Manipulation des Fichiers

**Objectif du Notebook :**  vous découvrirez les opérations sur les fichiers Python. Plus précisément, l'ouverture, la lecture, l'écriture et la fermeture d'un fichier, ainsi que les différentes méthodes de gestion de fichiers à connaître.

* **Pourquoi manipuler des fichiers ?**
    * **Persistance des données :** Sauvegarder des informations au-delà de l'exécution du script.
    * **Échange de données :** Lire ou écrire des configurations, des images, des données utilisateur, ou écrire des rapports.
    * **Traitement de données volumineuses :** Analyser des fichiers qui ne tiendraient pas entièrement en mémoire.
* **Types de fichiers courants :**
    * **Fichiers Texte :** Contiennent des caractères lisibles (ex: `.txt`, `.py`, `.csv`, `.json`, `.html`). Nécessitent une gestion de l'encodage.
    * **Fichiers Binaires :** Contiennent des données brutes (octets), non directement lisibles comme du texte (ex: images `.jpg`, `.png`, exécutables `.exe`, documents `.pdf`).
* **Processus de base :** Ouvrir -> Lire/Écrire -> Fermer.

#### Ouverture de fichier en python

* La fonction `open()` est le fonction clé pour interagir avec les fichiers.
* **Syntaxe :** `open(chemin_fichier, mode='r', encoding=None)`
    * `chemin_fichier` (str) : Le chemin vers le fichier (peut être relatif ou absolu).
    * `mode` (str) : Spécifie comment ouvrir le fichier (voir ci-dessous). La valeur par défaut est `'r'` (lecture texte).
    * `encoding` (str) : L'encodage à utiliser pour les fichiers texte (ex: `'utf-8'`, `'ascii'`, `'latin-1'`). **Très important !** `None` utilise l'encodage par défaut du système, ce qui peut varier.
* **Principaux Modes d'Ouverture :**
    * `'r'` : Lecture (Read) - Mode par défaut. Erreur si le fichier n'existe pas.
    * `'w'` : Écriture (Write) - Crée le fichier s'il n'existe pas. **Écrase le contenu** s'il existe.
    * `'a'` : Ajout (Append) - Crée le fichier s'il n'existe pas. Ajoute les données à la fin du fichier s'il existe.
    * `'x'` : Création exclusive (eXclusive creation) - Crée le fichier, mais échoue avec une erreur (`FileExistsError`) s'il existe déjà.
    * `'+'` : Mise à jour - Peut être combiné avec les autres modes (`'r+'`, `'w+'`, `'a+'`) pour permettre à la fois la lecture et l'écriture.
    * `'b'` : Binaire (Binary) - À ajouter au mode pour traiter le fichier en mode binaire (`'rb'`, `'wb'`, `'ab'`, etc.). Les données sont lues/écrites en octets (`bytes`).

- Ouvrer le fichier "text.txt" puis l'affecter à la variable `f`. Afficher la variable `f`.

In [None]:
# code ici
f = open("/content/drive/MyDrive/FORMATION COHORTE GENAI ODC/Ressouces/test.txt", 'r', encoding='utf-8')
print(f.read())

Output hidden; open in https://colab.research.google.com to view.

#### La fermeture explicite de fichier

- La methode `f.close()` permet de fermer un fichier une fois les opérations effectuées sur ce fichier terminées.

* **Pourquoi ?**
    * Libère les ressources système associées au fichier.
    * Assure que toutes les données écrites sont effectivement "flushées" (écrites physiquement) sur le disque. Oublier `close()` peut entraîner une perte de données en écriture.
* **Inconvénient :** Si une erreur survient *avant* l'appel à `close()`, le fichier risque de ne pas être fermé correctement.

- Fermer le fichier "text.txt". Afficher la variable `f`.

In [None]:
# code ici
f.close()
print(f)

<_io.TextIOWrapper name='/content/drive/MyDrive/FORMATION COHORTE GENAI ODC/Ressouces/test.txt' mode='r' encoding='utf-8'>


#### Le Gestionnaire de Contexte (`with open ... as ...`)

* La méthode recommandée et la plus sûre pour l'ouverture et la fermeture de fichier est l'utilisation de la clause `with`.
* Garantit que le fichier sera **automatiquement fermé** à la sortie du bloc `with`, même si des erreurs se produisent à l'intérieur du bloc.
* **Syntaxe :**
```python
with open('text.txt', mode='r') as f:
    # opérations sur le fichier ici...
# Pas besoin d'appeler f.close() explicitement !
```

- - Ouvrer le fichier "text.txt" avec la clause `with`. Afficher la variable `f`.

In [None]:
# code ici
with open('/content/drive/MyDrive/FORMATION COHORTE GENAI ODC/Ressouces/test.txt', 'r', encoding='utf-8') as file_:
  print(file_.read())

#### Lecture du contenu d'un fichier

- La methode `f.read(n)` permet de lire les:
 - n premiers caractères si le fichier est ouvert en mode texte
 - n premier octets si le fichier est ouvert en mode binaire
 - Si aucun parametre n'est donné, `f.read()` lit *tout* le fichier jusqu'à la fin.

- - Lire et affecter dans `nth_chars` les 100 premiers caractère de "text.txt" puis les affichers.

In [None]:
# code ici
with open("/content/drive/MyDrive/FORMATION COHORTE GENAI ODC/Ressouces/test.txt", 'r', encoding='utf-8') as files_:
  nth_chars = files_.read(100)
  print(nth_chars)

From stephen.marquard@uct.ac.za Sat Jan  5 09:14:16 2008
Return-Path: <postmaster@collab.sakaiprojec


- - Lire et affecter dans `content` le contenu de "text.txt" puis l'affichers.

In [None]:
# code ici
with open("/content/drive/MyDrive/FORMATION COHORTE GENAI ODC/Ressouces/test.txt", 'r', encoding='utf-8') as files_:
  content = files_.read()
  print(content)

Output hidden; open in https://colab.research.google.com to view.

- La methode `readline()` permet de lire une seul ligne du contenu d'un fichier.
 - Lit depuis la position actuelle jusqu'au prochain caractère `\n` (inclus).
 - Retourne une chaîne vide `''` à la fin du fichier.

- - Lire et affecter dans `first_line` la première ligne de "text.txt" puis l'afficher.

In [None]:
# code ici
with open("/content/drive/MyDrive/FORMATION COHORTE GENAI ODC/Ressouces/test.txt", 'r', encoding='utf-8') as files_:
  first_line = files_.readline()
  print(first_line)

From stephen.marquard@uct.ac.za Sat Jan  5 09:14:16 2008



- - Lire ligne par ligne le contenu du fichier "text.txt" puis l'affecter dans la liste `rows` où chaque élément est une ligne de "text.txt". SUpprimer le caractère "\n" en fin de ligne.

In [10]:
# code ici
rows = []
with open("/content/drive/MyDrive/FORMATION COHORTE GENAI ODC/Ressouces/test.txt", 'r', encoding='utf-8') as files_:
    rows = [file_line.strip() for file_line in files_.readlines()]

- La methode `f.readlines()` permet de lire toutes les lignes d'un fichier et les retourne sous forme d'une **liste** de chaînes. Chaque chaîne inclut le `\n` final.

- - Lire ligne par ligne le contenu du fichier "text.txt" puis l'affecter dans la liste `rows` où chaque élément est une ligne de "text.txt". Supprimer le caractère "\n" en fin de ligne.

In [None]:
# code ici

- Itérer directement sur l'objet fichier

> C'est la manière la plus *Pythonique* et la plus efficace en mémoire pour lire un fichier texte ligne par ligne.

```python
for ligne in f: # Lit une ligne à la fois
    ....
```


- - Lire ligne par ligne le contenu du fichier "text.txt" puis l'affecter dans la liste `rows` où chaque élément est une ligne de "text.txt". Supprimer le caractère "\n" en fin de ligne.

In [None]:
# code ici

#### Écrire dans un Fichier

Pour écrire dans un fichier en Python, nous devons l'ouvrir en mode écriture `w`, ajout `a` ou création exclusive `x`.

* ** Modes d'Ouverture d'un fichier en lécriture:**
    * `'w'` : Écriture (Write) - Crée le fichier s'il n'existe pas. **Écrase le contenu** s'il existe.
    * `'a'` : Ajout (Append) - Crée le fichier s'il n'existe pas. Ajoute les données à la fin du fichier s'il existe.
    * `'x'` : Création exclusive (eXclusive creation) - Crée le fichier, mais échoue avec une erreur (`FileExistsError`) s'il existe déjà.

- La méthode `f.write(chaine)` permet d'ecrire la chaine de caractère `chaine` dans le fichier `f`. Cette méthode N'ajoute pas de caractère de nouvelle ligne (`\n`) automatiquement. Vous devez l'ajouter vous-même si nécessaire. Elle retourne le nombre de caractères écrits.

- - Demander les informations d'un livre  (titre, auteur, annee, langue) puis les enregistrer dans un fichier `bd.txt.

In [None]:
# code ici

- - Demander puis ajouter les informations de deux autres livres dans `bd.txt`.

In [None]:
# code ici

#### Exercice

Liser le fichier de données `countries_data.json` dans le répertoire du projet,

1. Ecrire un code qui:
- recherche les dix langues les plus parlées,
- crée un fichier `most_spoken_language.txt` puis ecrit pour chaque langue le nombre de pays qui la parle.
```json
[
    {"language": "English", "num_countries": 91},
    ...
]
```
2. Recherche les dix pays les plus peuplés puis les écrire dans un fichier json `most_populated_countries.json`.
```json
[
    {"country": "China", "population": 1377422166},
    ...
]
```

In [16]:
# code ici
#Recherche les dix pays les plus peuplés puis les écrire dans un fichier json most_populated_countries.json.

import this

help(this)

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
Help on module this:

NAME
    this

MODULE REFERENCE
    https://docs.python.org/3.11/library/this.html
    
    The following documentation i