# üíæ Atelier 5 : Manipulation des Fichiers et Formats de Donn√©es
#### Auteur: Pr BENLAHMAR EL HABIB


## üéØ Objectifs de l'Atelier

Cet atelier vous donnera les comp√©tences n√©cessaires pour interagir avec le syst√®me de fichiers, ce qui est fondamental pour charger des donn√©es de formation et sauvegarder les sorties de vos mod√®les.

* Ma√Ætriser l'ouverture et la fermeture des fichiers (`open()` et `with`).
* Lire et √©crire du texte simple.
* G√©rer les formats structur√©s courants en IA : **CSV** et **JSON**.
* Savoir g√©rer les chemins de fichiers avec le module `os` ou `pathlib`.

--- 

## 1. Bases : Lecture et √âcriture de Fichiers Texte

L'approche recommand√©e est d'utiliser le mot-cl√© **`with`** pour s'assurer que le fichier est automatiquement ferm√©, m√™me en cas d'erreur. 

### Modes d'Ouverture :
* `'r'` : Lecture seule (Read).
* `'w'` : √âcriture (Write). √âcrase le fichier s'il existe.
* `'a'` : Ajout (Append). Ajoute du contenu √† la fin du fichier.

### ‚úèÔ∏è Exercice 1.1 (√âcriture de Texte)

1.  Cr√©ez un fichier nomm√© **`journal_entrainement.txt`**.
2.  √âcrivez-y la ligne : `D√©but de l'entrainement du Mod√®le A (Mode w).`
3.  √âcrivez ensuite une deuxi√®me ligne en mode **ajout** (`'a'`) : `Fin de l'entrainement (Accuracy: 0.85).`

In [None]:
# √âtape 1 & 2 : √âcriture initiale (mode 'w')
with open('journal_entrainement.txt', 'w') as f:
    f.write("D√©but de l'entrainement du Mod√®le A (Mode w).\n")

# √âtape 3 : Ajout d'une ligne (mode 'a')
with open('journal_entrainement.txt', 'a') as f:
    f.write("Fin de l'entrainement (Accuracy: 0.85).\n")

### ‚úèÔ∏è Exercice 1.2 (Lecture de Texte)

1.  Lisez le contenu complet du fichier **`journal_entrainement.txt`** en une seule fois (`.read()`).
2.  Affichez le contenu.

In [None]:
# Lecture du contenu
with open('journal_entrainement.txt', 'r') as f:
    contenu = f.read()
    
print("Contenu du journal :\n", contenu)

--- 

## 2. Format Structur√© 1 : CSV (Comma Separated Values)

Les fichiers **CSV** sont le format de base pour les jeux de donn√©es tabulaires. Bien que Pandas soit l'outil principal (Atelier 2), nous allons utiliser le module **`csv`** de Python pour comprendre la structure.

### Pr√©paration des donn√©es (Simulation d'un petit Dataset)

In [None]:
import csv

donnees = [
    ['ID', 'Feature_A', 'Target'],
    [1, 10.5, 0],
    [2, 12.0, 1],
    [3, 9.8, 0]
]

# √âcriture du fichier 'data_test.csv'
with open('data_test.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerows(donnees)

print("Fichier data_test.csv cr√©√©.")

### ‚úèÔ∏è Exercice 2.1 (Lecture CSV)

1.  Lisez le fichier **`data_test.csv`**.
2.  Utilisez un it√©rateur (`for row in reader:`) pour parcourir le fichier ligne par ligne.
3.  Affichez la premi√®re ligne (les en-t√™tes) et la troisi√®me ligne de donn√©es.

In [None]:
lignes = []
with open('data_test.csv', 'r', newline='') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        lignes.append(row)
        
print(f"En-t√™tes (1√®re ligne) : {lignes[0]}")
print(f"Troisi√®me ligne de donn√©es : {lignes[2]}")

--- 

## 3. Format Structur√© 2 : JSON (JavaScript Object Notation)

Le format **JSON** est id√©al pour sauvegarder des objets complexes (dictionnaires, listes imbriqu√©es), tels que des configurations de mod√®les ou des m√©tadonn√©es de jeux de donn√©es.

### ‚úèÔ∏è Exercice 3.1 (√âcriture et Lecture JSON)

1.  Importez le module **`json`**.
2.  **√âcriture :** √âcrivez le dictionnaire `config_modele` dans un fichier **`config.json`** en utilisant `json.dump()`.
3.  **Lecture :** Lisez le contenu du fichier **`config.json`** et stockez-le dans une nouvelle variable (`config_lue`).
4.  Affichez la valeur du taux d'apprentissage (`learning_rate`) de la configuration lue.

In [None]:
import json

config_modele = {
    "architecture": "CNN",
    "couches": 5,
    "learning_rate": 0.001,
    "metrics": ["accuracy", "loss"]
}

# √âtape 2 : √âcriture JSON
with open('config.json', 'w') as f:
    json.dump(config_modele, f, indent=4) # indent=4 pour la lisibilit√©

# √âtape 3 & 4 : Lecture JSON et affichage
with open('config.json', 'r') as f:
    config_lue = json.load(f)
    
print(f"Architecture : {config_lue['architecture']}")
print(f"Learning Rate (lu) : {config_lue['learning_rate']}")

--- 

## 4. Gestion des Chemins de Fichiers (Module `os`)

Quand on travaille sur diff√©rents syst√®mes d'exploitation (Windows, Mac, Linux), la mani√®re d'√©crire les chemins (`/` ou `\`) varie. Le module **`os`** permet de g√©rer cela de mani√®re universelle.

### ‚úèÔ∏è Exercice 4.1 (Chemins Universels)

1.  Importez le module `os`.
2.  Utilisez `os.path.join()` pour construire le chemin vers un fichier **`images/train/cat.jpg`**.
3.  Affichez le chemin r√©sultant.

In [None]:
import os

# Construction du chemin (os.path.join s'adapte √† l'OS)
chemin_universel = os.path.join('images', 'train', 'cat.jpg')

print(f"Chemin construit : {chemin_universel}")

--- 

##  Conclusion de l'Atelier

Vous √™tes d√©sormais capable d'effectuer les op√©rations fondamentales pour la gestion des donn√©es de vos projets d'IA :

* Lecture/√©criture de **fichiers texte**.
* Gestion des donn√©es structur√©es **CSV** et **JSON**.
* Utilisation du module **`os`** pour garantir la portabilit√© des chemins de fichiers.

Cette comp√©tence est le dernier maillon n√©cessaire avant de plonger dans les librairies de Machine Learning (Scikit-learn, TensorFlow, etc.) qui utilisent ces m√©thodes en arri√®re-plan.