# Navigation dans le système de fichiers

Pour interagir avec les fichiers, un programme doit d'abord savoir comment se repérer et naviguer dans l'arborescence du système de fichiers. Comprendre la structure des chemins est une étape fondamentale avant de pouvoir lire ou écrire des données.

---
## Pourquoi utiliser des fichiers ?

**Problème :** La saisie manuelle de grandes quantités de données est lente, répétitive et sujette aux erreurs.

**Solution :** Stocker les données d'entrée (et de sortie) dans des fichiers permet un accès automatisé, rapide et fiable.

**Avantages :**
- **Automatisation :** Les programmes peuvent lire et traiter des milliers de lignes de données sans intervention humaine.
- **Stockage permanent :** Contrairement aux variables qui n'existent que pendant l'exécution d'un programme, les données écrites dans un fichier persistent.
- **Réduction des erreurs :** L'automatisation élimine les fautes de frappe et les erreurs de saisie.
- **Réutilisation :** Les mêmes données peuvent être lues et utilisées par plusieurs programmes ou à différents moments.

---

## Chemins Absolus et Relatifs

Les fichiers et répertoires sont identifiés par leur chemin. Il en existe deux types :

-   **Chemin Absolu** : C'est le chemin complet qui part de la racine du système de fichiers. Il est unique et ne dépend pas de l'endroit où le script est exécuté.
    -   *Exemple (Linux/macOS) :* `/home/utilisateur/documents/fichier.txt`
    -   *Exemple (Windows) :* `C:\Users\Utilisateur\Documents\fichier.txt`

-   **Chemin Relatif** : C'est un chemin qui est défini par rapport au **répertoire de travail actuel**. Le répertoire de travail est l'endroit où votre programme ou votre terminal est en train de s'exécuter.
    -   *Exemple :* `data/fichier.txt` (signifie : dans le dossier `data` qui se trouve à mon emplacement actuel).
    -   *Exemple :* `../images/photo.png` (signifie : remonte d'un niveau par rapport à mon emplacement actuel, puis entre dans le dossier `images`).

---

## Gestion des Chemins avec `pathlib`

Le module `pathlib` est l'approche moderne et recommandée en Python pour manipuler les chemins de manière orientée objet. C'est une méthode plus lisible et robuste que l'ancienne approche basée sur des chaînes de caractères (`os.path`).

On peut créer un objet `Path` qui représente un chemin, puis utiliser ses méthodes pour en extraire des informations ou le manipuler.

In [None]:
from pathlib import Path

# Créer un objet Path pour un chemin relatif
chemin_relatif = Path("data") / "mini_texte.txt"

print(f"Chemin relatif : {chemin_relatif}")
print(f"Le chemin existe : {chemin_relatif.exists()}")
print(f"Est-ce un fichier : {chemin_relatif.is_file()}")
print(f"Nom du fichier : {chemin_relatif.name}")
print(f"Extension du fichier : {chemin_relatif.suffix}")
print(f"Répertoire parent : {chemin_relatif.parent}")

# Obtenir le chemin absolu à partir d'un chemin relatif
chemin_absolu = chemin_relatif.resolve()
print(f"Chemin absolu correspondant : {chemin_absolu}")

---

## Le Répertoire de Travail Actuel

Le répertoire de travail est le contexte à partir duquel les chemins relatifs sont interprétés. On peut le connaître et même le modifier si nécessaire.

In [None]:
import os
from pathlib import Path

# Obtenir le répertoire de travail actuel (méthode pathlib)
repertoire_actuel = Path.cwd() # cwd = current working directory
print(f"Répertoire de travail actuel (avec pathlib) : {repertoire_actuel}")

# Méthode équivalente avec le module 'os'
repertoire_actuel_os = os.getcwd()
print(f"Répertoire de travail actuel (avec os) : {repertoire_actuel_os}")

# On peut changer le répertoire de travail avec os.chdir()
# Attention : cela affecte l'exécution de tout le reste du script !
# os.chdir(repertoire_actuel.parent) # Remonte d'un niveau
# print(f"Nouveau répertoire de travail : {Path.cwd()}")
# os.chdir(repertoire_actuel) # Retour à l'original

---

## Lister le Contenu d'un Répertoire

Une tâche courante est de lister les fichiers et dossiers contenus dans un répertoire donné. `pathlib` rend cette opération très simple.

In [None]:
from pathlib import Path

repertoire_data = Path("data")

print(f"Contenu du répertoire '{repertoire_data}':")

# .iterdir() renvoie un itérateur sur tous les éléments du répertoire
for element in repertoire_data.iterdir():
    if element.is_file():
        print(f"  - Fichier : {element.name}")
    elif element.is_dir():
        print(f"  - Dossier : {element.name}")

---

## Rechercher des Fichiers avec des Motifs (Globbing)

Si on veut trouver des fichiers qui correspondent à un certain motif (par exemple, tous les fichiers se terminant par `.png`), on peut utiliser la méthode `.glob()`.

In [None]:
from pathlib import Path

repertoire_data = Path("data")

# Le caractère '*' sert de joker
print("Recherche de toutes les images PNG (.png) dans 'data':")
fichiers_png = repertoire_data.glob("*.png")

for fichier in fichiers_png:
    print(f"  - Trouvé : {fichier}")


---

# Exercices pratiques

Il est toujours important d'avoir une bonne mémoire, car comme lorsqu'on apprend une langue il faut pouvoir rapidement se souvenir de plusieurs concepts, et il faut aussi bien lire les instructions car dans les fait nous convertissons des instructions sous forme de texte en Python. Il y a plusieurs façon d'atteindre une bonne réponse, l'important c'est que le code soit clair et qu'il fasse la bonne chose.


**Exercice 1 : Naviguer et lister les fichiers**

Créer un script qui:
1. Affiche le répertoire de travail actuel
2. Crée un chemin vers le dossier "data"
3. Affiche le contenu du dossier "data" (fichiers et dossiers)
4. Affiche le nombre total d'éléments trouvés

In [None]:

from pathlib import Path

# Votre code ici
# Utilisez Path pour accomplir chaque étape
# Afficher les résultats clairement


<details>
 <summary>Voir réponse</summary>
<br />

```python
from pathlib import Path

# 1. Afficher le répertoire de travail
repertoire_actuel = Path.cwd()
print(f"Répertoire actuel: {repertoire_actuel}\n")

# 2. Créer un chemin vers "data"
dossier_data = Path("data")

# 3. Lister le contenu
print(f"Contenu de '{dossier_data}':")
elements = list(dossier_data.iterdir())
for element in elements:
    if element.is_file():
        print(f"  - Fichier: {element.name}")
    else:
        print(f"  - Dossier: {element.name}")

# 4. Afficher le total
print(f"\nNombre total d'éléments: {len(elements)}")
```

</details>


**Exercice 2 : Composition d'éléments**
Même si du code a parfois l'air complexe, il faut être capable de comprendre l'essence des opérations. Même si vous ne seriez pas capable de l'écrire, vous devriez être capable de fouiller dans vos notes, les jupyter-notebook passés ou sur le web et finalement executer les code pour le comprendre.

Voici un exemple de code potentiellement mélangeant !

In [None]:

from pathlib import Path

repertoire = Path("data")
fichiers = [p.name for p in repertoire.iterdir() if p.is_file() and p.suffix == ".txt"]

# Que sera la valeur de fichiers et que fait cette ligne dans vos mots?


<details>
 <summary>Voir réponse</summary>
<br />

```python
# repertoire.iterdir() itère sur tous les éléments du dossier "data"
# p.is_file() filtre seulement les fichiers (pas les dossiers)
# p.suffix == ".txt" filtre seulement les fichiers avec l'extension .txt
# p.name extrait le nom du fichier
# La list comprehension crée une liste avec ces noms

# fichiers contiendra tous les noms de fichiers .txt du dossier "data"
# Par exemple: ["mid_texte.txt", "mini_texte.txt", "sherlock_holmes.txt"]

# Cette ligne utilise:
# - Path pour naviguer
# - iterdir() pour lister
# - des méthodes de filtrage (is_file(), suffix)
# - une list comprehension pour créer la liste finale
```

</details>

---

# Résumé

Une bonne maîtrise de la navigation dans les fichiers est essentielle pour écrire des programmes robustes.

**Points Clés :**
-   La distinction entre **chemin absolu** (depuis la racine) et **chemin relatif** (depuis le répertoire actuel) est fondamentale.
-   Le module `pathlib` est l'outil moderne et recommandé pour toute manipulation de chemins.
-   `Path.cwd()` (ou `os.getcwd()`) permet de connaître le répertoire de travail actuel.
-   `mon_chemin.iterdir()` permet de lister le contenu d'un répertoire.
-   `mon_chemin.glob('*.txt')` est très puissant pour rechercher des fichiers correspondant à un motif.

Prochain chapitre : `6_2_fichiers_texte.ipynb`