# 1. Parcourir le système de fichiers

## Objectifs pédagogiques
- Comprendre comment naviguer dans une arborescence de répertoires
- Utiliser le module `os` pour interagir avec le système de fichiers
- Maîtriser la fonction `os.walk()` pour parcourir récursivement les dossiers

## Concepts clés
- **os.walk()**: Génère un tuple (répertoire_courant, sous-dossiers, fichiers) pour chaque dossier
- **Parcours récursif**: La fonction traverse automatiquement tous les niveaux de dossiers
- **Chemins absolus et relatifs**: Utilisation de "./" pour chemins relatifs

In [2]:
import os

# Description: Ce bloc parcourt récursivement le dossier "./example" et affiche tous les chemins de fichiers
#
# Processus:
# 1. os.walk() itère sur chaque dossier de la hiérarchie
# 2. Pour chaque itération, on récupère: root (chemin du dossier actuel),
#    dirs (liste des sous-dossiers), files (liste des fichiers)
# 3. On construit le chemin complet avec os.path.join() (compatible tous OS)
# 4. Enfin, on affiche chaque chemin de fichier trouvé

print("Liste des fichiers dans le répertoire courant:")
for root, dirs, files in os.walk("./example"):
    # root: chemin du répertoire courant dans la traversée
    # dirs: liste des sous-répertoires présents dans 'root'
    # files: liste des fichiers présents dans 'root'
    for file in files:
        # Construire le chemin complet du fichier en utilisant os.path.join()
        # Avantage: fonctionne sur Windows, Linux, macOS (gère les séparateurs automatiquement)
        chemin_complet = os.path.join(root, file)
        print(chemin_complet)

Liste des fichiers dans le répertoire courant:
./example/myFile.txt
./example/directory/otherFile.txt
./example/directory/incredibleFile.txt


# 2. Gérer proprement l'encoding (Encodage)

## Objectifs pédagogiques
- Comprendre ce qu'est l'encodage et pourquoi c'est important
- Maîtriser la lecture/écriture de fichiers avec un encodage spécifique
- Éviter les erreurs d'encodage courants (caractères spéciaux, accents, symboles)

## Concepts clés
- **Encodage**: Système de conversion des caractères en séquence de bytes (ex: UTF-8, ASCII, ISO-8859-1)
- **UTF-8**: Encodage universel qui supporte tous les caractères mondiaux (recommandé)
- **Context Manager (with)**: Gère automatiquement l'ouverture/fermeture des fichiers

## Exemple pratique
Écriture et lecture d'un fichier avec des caractères accentués

In [4]:
filename = 'exemple.txt'

# ===== ÉCRITURE =====
# Utiliser 'encoding="utf-8"' pour supporter les caractères spéciaux
# Le mot-clé 'with' (context manager) garantit la fermeture du fichier même en cas d'erreur
with open(filename, 'w', encoding='utf-8') as f:
    # 'w' = mode écriture (overwrite)
    # encoding='utf-8' = utiliser l'encodage UTF-8 (universel, supporte accents, caractères spéciaux)
    f.write('Ceci est un exemple avec des caractères spéciaux: é, à, ü')

print("✓ Fichier créé avec succès")

# ===== LECTURE =====
# Lire le fichier avec le même encodage
with open(filename, 'r', encoding='utf-8') as f:
    # 'r' = mode lecture
    # encoding='utf-8' = lire avec l'encodage UTF-8 (doit correspondre à l'écriture)
    content = f.read()  # read() charge tout le contenu en mémoire

print('\nContenu du fichier:')
print(content)

# ===== NOTES IMPORTANTES =====
# 1. TOUJOURS spécifier encoding='utf-8' pour éviter les problèmes de compatibilité
# 2. Le 'with' referme automatiquement le fichier (bonne pratique)
# 3. Alternatives à read():
#    - readlines() : retourne une liste de lignes
#    - readline() : lit une seule ligne
#    - Boucler avec 'for line in f:' pour traiter ligne par ligne



Contenu du fichier:
Ceci est un exemple avec des caractères spéciaux: é, à, ü


# 3. Lire et écrire des fichiers CSV

## Objectifs pédagogiques
- Comprendre le format CSV (Comma-Separated Values)
- Maîtriser l'utilisation du module `csv` pour traiter des données tabulaires
- Gérer correctement les délimiteurs et l'encodage

## Concepts clés
- **CSV**: Format texte simple pour stocker des données en lignes et colonnes (séparées par des virgules)
- **csv.writer()**: Écrit des données structurées au format CSV
- **csv.reader()**: Lit et parse un fichier CSV en listes Python
- **newline=''**: Paramètre important pour éviter les sauts de ligne supplémentaires (Windows/Unix)

## Use cases
- Importer/exporter des données depuis Excel ou des bases de données
- Traiter des listes de données sans avoir besoin d'une vraie base de données

In [None]:
import csv

csv_filename = 'exemple.csv'

# Structure de données: liste de listes
# Première ligne = en-têtes (headers), puis les données
data = [
    ['Nom', 'Âge', 'Ville'],      # En-tête (header)
    ['Alice', 30, 'Paris'],         # Données ligne 1
    ['Bob', 25, 'Lyon']             # Données ligne 2
]

# ===== ÉCRITURE CSV =====
# newline='' est OBLIGATOIRE pour éviter les sauts de ligne vides entre les lignes
# (différences entre Windows et Unix)
with open(csv_filename, 'w', newline='', encoding='utf-8') as f:
    # csv.writer(f) crée un objet writer qui formate les données en CSV
    writer = csv.writer(f)
    # writerows() écrit plusieurs lignes à la fois
    writer.writerows(data)

print("✓ Fichier CSV créé avec succès")

# ===== LECTURE CSV =====
# Lire le fichier CSV et le convertir en structure Python
with open(csv_filename, 'r', encoding='utf-8') as f:
    # csv.reader(f) parse le fichier et retourne chaque ligne sous forme de liste
    reader = csv.reader(f)
    print('\nContenu CSV:')
    # Chaque 'row' est une liste Python: ['Alice', '30', 'Paris']
    for row in reader:
        print(row)  # Affiche: ['Nom', 'Âge', 'Ville'], puis ['Alice', '30', 'Paris'], etc.

# ===== NOTES IMPORTANTES =====
# 1. newline='' est CRUCIAL lors de l'écriture CSV (évite les lignes vides)
# 2. Les valeurs lues sont toujours en STRING (même les nombres)
# 3. Alternatives:
#    - csv.DictReader / csv.DictWriter pour manipuler les colonnes par nom
#    - pandas.read_csv() pour des données plus complexes

# 4. Analyser le JSON (JavaScript Object Notation)

## Objectifs pédagogiques
- Comprendre le format JSON et sa structure
- Maîtriser la sérialisation/désérialisation JSON en Python
- Gérer l'encodage UTF-8 et l'indentation

## Concepts clés
- **JSON**: Format léger et lisible pour l'échange de données (utilisé par les APIs)
- **Sérialisation**: Conversion d'objets Python en chaîne JSON (dump/dumps)
- **Désérialisation**: Conversion d'une chaîne JSON en objets Python (load/loads)
- **Types supportés**: objects {}, arrays [], strings "", numbers, booleans, null

## Types Python ↔ JSON
```
Python         →  JSON
dict           →  object {}
list           →  array []
str            →  string ""
int/float      →  number
True/False     →  true/false
None           →  null
```

## Use cases
- Communiquer avec des APIs REST
- Stocker des configurations d'application
- Échanges de données entre services

In [None]:
import json

json_filename = 'exemple.json'

# Structure de données Python (dict = dictionnaire)
json_data = {
    'nom': 'Charlie',           # Clé string: valeur string
    'age': 28,                  # Clé string: valeur numérique
    'ville': 'Marseille'        # Clé string: valeur string
}

# ===== ÉCRITURE JSON =====
with open(json_filename, 'w', encoding='utf-8') as f:
    # json.dump() écrit directement dans un fichier
    # ensure_ascii=False: permet les caractères accentués (é, à, ü, etc.)
    # indent=4: formate le JSON avec indentation (2, 4 ou 0 pour compact)
    json.dump(json_data, f, ensure_ascii=False, indent=4)

print("✓ Fichier JSON créé avec succès")

# ===== LECTURE JSON =====
# Lire et convertir le fichier JSON en objet Python
with open(json_filename, 'r', encoding='utf-8') as f:
    # json.load() lit et parse le contenu du fichier
    # Retourne automatiquement: dict → dict, array → list, string → str, etc.
    loaded_json = json.load(f)
    print('\nContenu JSON:')
    print(loaded_json)  # Affiche: {'nom': 'Charlie', 'age': 28, 'ville': 'Marseille'}

# ===== ACCÉDER AUX DONNÉES =====
# Les données JSON sont converties en types Python natifs
print(f"\nNom: {loaded_json['nom']}")
print(f"Âge: {loaded_json['age']}")
print(f"Ville: {loaded_json['ville']}")

# ===== NOTES IMPORTANTES =====
# 1. json.dump() écrit dans un fichier, json.dumps() retourne une string
# 2. json.load() lit un fichier, json.loads() parse une string
# 3. ensure_ascii=False: ESSENTIEL pour les accents français
# 4. indent: 4 pour lisibilité, 0 ou None pour compact
# 5. Les clés JSON doivent TOUJOURS être des strings

# 5. Analyser l'XML (eXtensible Markup Language)

## Objectifs pédagogiques
- Comprendre la structure hiérarchique du format XML
- Maîtriser le parsing XML avec ElementTree
- Naviguer dans un arbre XML et extraire des données

## Concepts clés
- **XML**: Format hiérarchique et extensible pour stocker des données structurées
- **Arborescence**: Structure en arbre avec un élément racine et des éléments enfants
- **Balises**: Paires ouverture/fermeture `<tag>contenu</tag>`
- **Attributs**: Propriétés des balises `<tag attr="valeur">contenu</tag>`
- **ElementTree**: Module Python pour naviguer et modifier un arbre XML

## Structure XML typique
```xml
<racine>                  <!-- Élément racine (obligatoire) -->
  <enfant1>               <!-- Élément parent -->
    <petit-enfant>text</petit-enfant>
  </enfant1>
  <enfant2 id="123">      <!-- Élément avec attribut -->
    data
  </enfant2>
</racine>
```

## Use cases
- Stockage de données hiérarchiques
- Configuration d'applications (pom.xml, web.xml en Java)
- Flux RSS/Atom (contenu web)

In [None]:
import xml.etree.ElementTree as ET

xml_filename = 'exemple.xml'

# Contenu XML brut (chaîne de caractères)
# Structure: <racine> → <personne> → <nom>, <age>, <ville>
xml_content = '''<personnes>
<personne>
<nom>Diane</nom>
<age>35</age>
<ville>Bordeaux</ville>
</personne>
<personne>
<nom>Eric</nom>
<age>40</age>
<ville>Lille</ville>
</personne>
</personnes>'''

# ===== ÉCRITURE XML =====
# Écrire le contenu XML dans un fichier
with open(xml_filename, 'w', encoding='utf-8') as f:
    f.write(xml_content)

print("✓ Fichier XML créé avec succès")

# ===== LECTURE ET PARSING XML =====
# Créer un arbre XML à partir du fichier
tree = ET.parse(xml_filename)
# Obtenir l'élément racine (<personnes>)
root = tree.getroot()

print(f"\nÉlément racine: <{root.tag}>")
print("Contenu XML:\n")

# ===== NAVIGATION DANS L'ARBRE =====
# findall('tag') retourne tous les enfants avec ce tag
for personne in root.findall('personne'):
    # Trouver le premier enfant avec le tag 'nom'
    nom = personne.find('nom').text      # .text récupère le contenu texte
    age = personne.find('age').text
    ville = personne.find('ville').text

    # Affichage formaté
    print(f'Nom: {nom}, Âge: {age}, Ville: {ville}')

# ===== NOTES IMPORTANTES =====
# 1. ET.parse() crée un arbre depuis un fichier
# 2. tree.getroot() retourne l'élément racine
# 3. find() retourne le PREMIER enfant avec ce tag (ou None)
# 4. findall() retourne une LISTE de tous les enfants
# 5. .text récupère le contenu texte d'une balise
# 6. .tag récupère le nom de la balise
# 7. .attrib récupère les attributs sous forme de dictionnaire
# 8. Alternatives: lxml (plus puissant), beautifulsoup4 (pour le HTML)

# 6. Les générateurs

## Objectifs pédagogiques
- Comprendre le concept de générateurs en Python
- Maîtriser l'utilisation de `yield` pour créer des séquences lazy
- Optimiser l'utilisation de mémoire avec des générateurs

## Concepts clés
- **Générateur**: Fonction qui retourne des valeurs une par une (lazy evaluation)
- **yield**: Mot-clé qui transforme une fonction en générateur (pause/reprend l'exécution)
- **Lazy evaluation**: Les valeurs sont calculées seulement quand elles sont demandées
- **Efficacité mémoire**: Les générateurs ne chargent pas tout en mémoire à la fois

## Générateurs vs Listes
```python
# Liste: charge TOUT en mémoire
liste = [i for i in range(1000000)]  # 1 million d'éléments en mémoire

# Générateur: charge UNE valeur à la fois
def gen():
    for i in range(1000000):
        yield i  # Une seule valeur générée à chaque itération
```

## Avantages des générateurs
1. **Économie de mémoire**: Ne stocke qu'une valeur à la fois
2. **Performance**: Pas de temps d'attente pour construire la séquence complète
3. **Infini**: Peut générer des séquences infinies sans problème
4. **Lazy**: Les calculs se font à la demande

## Use cases
- Lire de très grands fichiers ligne par ligne
- Traiter des flux de données en temps réel
- Générer des séquences infinies (nombres premiers, Fibonacci, etc.)

In [None]:

# ===== EXEMPLE: GÉNÉRATEUR POUR LIRE LES FICHIERS =====
def lire_fichier_lignes(fichier):
    """
    Générateur qui lit un fichier ligne par ligne.

    Avantages par rapport à lire tout le fichier en mémoire:
    - Économise de la mémoire (une ligne à la fois)
    - Peut traiter des fichiers énormes (millions de lignes)
    - Peut traiter les données dès qu'elles arrivent

    Paramètres:
        fichier: chemin du fichier à lire

    Yields:
        str: chaque ligne du fichier (sans sauts de ligne)
    """
    with open(fichier, 'r', encoding='utf-8') as f:
        for ligne in f:
            # yield pause la fonction et retourne une valeur
            # La prochaine itération reprend à partir d'ici
            yield ligne.strip()  # .strip() enlève les espaces et sauts de ligne


# Utilisation du générateur
print('\nLecture ligne par ligne avec un générateur:')
for ligne in lire_fichier_lignes('exemple.txt'):
    # Cette boucle appelle automatiquement le générateur à chaque itération
    print(ligne)

# ===== EXEMPLE: GÉNÉRATEUR DE NOMBRES =====
def nombres_pairs(n):
    """
    Générateur qui produit les nombres pairs de 0 à n.

    Paramètres:
        n: limite supérieure (exclusive)

    Yields:
        int: nombres pairs successifs
    """
    for i in range(n):
        if i % 2 == 0:
            yield i

print('\nNombres pairs générés (0 à 10):')
for num in nombres_pairs(10):
    print(num, end=' ')  # end=' ' pour afficher sur une seule ligne
print()

# ===== CONVERTIR UN GÉNÉRATEUR EN LISTE =====
# Si vraiment nécessaire, on peut convertir un générateur en liste
# (ATTENTION: cela charge tout en mémoire!)
liste_paires = list(nombres_pairs(10))
print(f'\nListe de nombres pairs: {liste_paires}')

# ===== NOTES IMPORTANTES =====
# 1. yield crée automatiquement une fonction générateur
# 2. return dans un générateur arrête la génération
# 3. Les générateurs sont itérables (peuvent être utilisés avec for)
# 4. next(générateur) récupère la prochaine valeur
# 5. StopIteration est levée automatiquement à la fin
# 6. Les générateurs ne peuvent être parcourus qu'UNE FOIS
# 7. Parfait pour les fichiers volumineux et les flux de données
