# Manipulation de fichiers avec Python

## Ouverture et gestion des fichiers

Ce document explique comment manipuler des fichiers en Python, y compris l'ouverture, la lecture, l'écriture et la fermeture de fichiers.

### Ouverture d'un fichier
Pour ouvrir un fichier en Python, vous pouvez utiliser la fonction intégrée `open()`. Cette fonction prend deux arguments principaux : le nom du fichier et le mode d'ouverture (lecture, écriture, etc.).

```python
# Ouvrir un fichier en mode lecture
fichier = open('exemple.txt', 'r')
```
### Lecture d'un fichier

Une fois le fichier ouvert, vous pouvez lire son contenu à l'aide de différentes méthodes, telles que `read()`, `readline()`, ou `readlines()`.

#### Avec `read()`

```python
# Lire tout le contenu du fichier
contenu = fichier.read()
print(contenu)
```

#### Avec `readline()`

```python
# Lire une ligne à la fois
ligne = fichier.readline()
while ligne:
    print(ligne)
    ligne = fichier.readline()
```

#### Avec `readlines()`

```python
# Lire toutes les lignes dans une liste
lignes = fichier.readlines()
for ligne in lignes:
    print(ligne)
```

### Écriture dans un fichier

Pour écrire dans un fichier, vous devez l'ouvrir en mode écriture (`'w'`) ou en mode ajout (`'a'`). 

```python
# Ouvrir un fichier en mode écriture
fichier = open('exemple.txt', 'w')
fichier.write('Ceci est une nouvelle ligne.\n')
fichier.write('Voici une autre ligne.\n')
fichier.close()
```
### Fermeture d'un fichier

Pour fermer un fichier, vous pouvez utiliser la méthode `close()`. Il est important de fermer un fichier après l'avoir utilisé pour libérer les ressources système.

```python
fichier = open('exemple.txt', 'r')
# ... opérations de lecture ou d'écriture ...
fichier.close()
```
### Utilisation de with pour gérer les fichiers

Une manière plus sûre et plus propre de gérer les fichiers en Python est d'utiliser l'instruction `with`, qui garantit que le fichier est correctement fermé après son utilisation.

```python
with open('exemple.txt', 'r') as fichier:
    contenu = fichier.read()
    print(contenu)
```
Cela évite d'avoir à appeler explicitement `close()`, même en cas d'erreur lors de la lecture ou de l'écriture du fichier.

### Cas des données tabulaires : Pandas

Dans le cas où vous travaillez avec des données tabulaires, la bibliothèque Pandas offre des fonctionnalités puissantes pour lire et écrire des fichiers CSV, Excel, etc.

```python
import pandas as pd

# Lire un fichier CSV
df = pd.read_csv('exemple.csv')
print(df)
# Écrire un DataFrame dans un fichier CSV
df.to_csv('sortie.csv', index=False)
```

## La librairie OS

La librairie `os` en Python fournit une manière d'interagir avec le système d'exploitation, y compris la manipulation des fichiers et des répertoires.

### Lister les fichiers dans un répertoire

Vous pouvez utiliser le module `os` pour lister les fichiers dans un répertoire.

```python
import os

# Lister les fichiers dans le répertoire courant
fichiers = os.listdir('.')
print(fichiers)
```

Mais aussi pour vérifier l'existence d'un fichier ou d'un répertoire.

```python
import os

# Vérifier si un fichier existe
existe = os.path.exists('exemple.txt')
print(existe)
```

#### Trier les fichiers

### Par nom

```python
import os

# Lister et trier les fichiers dans le répertoire courant par nom
fichiers = os.listdir('.')
fichiers_tries = sorted(fichiers)
print(fichiers_tries)
```

### Par date de modification

```python
import os
from datetime import datetime
# Lister et trier les fichiers par date de modification
fichiers = os.listdir('.')
fichiers_tries = sorted(fichiers, key=lambda x: os.path.getmtime(x))
for fichier in fichiers_tries:
    date_modif = datetime.fromtimestamp(os.path.getmtime(fichier))
    print(f"{fichier} - Dernière modification : {date_modif}")
```

### Par taille

```python
import os
from datetime import datetime
# Lister et trier les fichiers par taille
fichiers = os.listdir('.')
fichiers_tries = sorted(fichiers, key=lambda x: os.path.getsize(x))
for fichier in fichiers_tries:
    taille = os.path.getsize(fichier)
    print(f"{fichier} - Taille : {taille} octets")
```

## Déplacer ou renommer des fichiers avec shutil

Pour déplacer ou renommer des fichiers, on peut utiliser la même fonction : `shutil.move()` du module `shutil`. Par exemple :

```python
import os
import shutil
# Déplace un fichier vers un nouveau répertoire
shutil.move('fichier.txt', 'nouveau_repertoire/fichier.txt')
# Renommer des fichiers en utilisant shutil
shutil.move('ancien_nom.txt', 'nouveau_nom.txt')
```

## Exercice

Dans le dossier **"data/exo_files"**. Écrivez un script qui :

- Déplace les fichiers contenant le mot "big" dans leur nom vers un sous-dossier appelé "big_files". Classez-les par taille et renommez-les en ajoutant comme préfixe leur classement (le numéro 1 étant le fichier le plus gros).

- Déplace les fichiers contenant le mot "small" dans leur nom vers un sous-dossier appelé "small_files". Classez-les par date de modification et renommez-les en ajoutant comme suffixe leur date de modification au format AAAAMMJJ.

Astuces:
- Utilisez les fonctions `os.makedirs()` pour créer des répertoires si nécessaire.
- Utilisez `os.path.getsize()` pour obtenir la taille des fichiers.
- Utilisez `os.path.getmtime()` pour obtenir la date de modification des fichiers.
- Utilisez le module `datetime` pour formater la date de modification.

In [None]:
# Code here!

In [1]:
# Solution
import os
import shutil
from datetime import datetime

# Configuration
SOURCE_DIR = "data/exo_files"
BIG_DIR = os.path.join(SOURCE_DIR, "big_files")
SMALL_DIR = os.path.join(SOURCE_DIR, "small_files")

# Créer les sous-dossiers s'ils n'existent pas
os.makedirs(BIG_DIR, exist_ok=True)
os.makedirs(SMALL_DIR, exist_ok=True)

# Lister tous les fichiers dans le dossier source
all_files = [f for f in os.listdir(SOURCE_DIR) if os.path.isfile(os.path.join(SOURCE_DIR, f))]

# === TRAITEMENT DES FICHIERS "BIG" ===
print("=" * 60)
print("Traitement des fichiers 'big'...")
print("=" * 60)

# Filtrer les fichiers contenant "big"
big_files = [f for f in all_files if "big" in f.lower()]

# Trier par taille (du plus gros au plus petit)
big_files_sorted = sorted(big_files, key=lambda x: os.path.getsize(os.path.join(SOURCE_DIR, x)), reverse=True)

# Déplacer et renommer avec le classement comme préfixe
for rank, filename in enumerate(big_files_sorted, start=1):
    source_path = os.path.join(SOURCE_DIR, filename)
    new_filename = f"{rank:02d}_{filename}"
    dest_path = os.path.join(BIG_DIR, new_filename)
    
    shutil.move(source_path, dest_path)
    size_kb = os.path.getsize(dest_path) / 1024
    print(f"  {rank}. {filename} → {new_filename} ({size_kb:.2f} KB)")

print(f"\n✓ {len(big_files_sorted)} fichiers 'big' déplacés et renommés dans '{BIG_DIR}'")

# === TRAITEMENT DES FICHIERS "SMALL" ===
print("\n" + "=" * 60)
print("Traitement des fichiers 'small'...")
print("=" * 60)

# Filtrer les fichiers contenant "small"
small_files = [f for f in all_files if "small" in f.lower()]

# Trier par date de modification (du plus ancien au plus récent)
small_files_sorted = sorted(small_files, key=lambda x: os.path.getmtime(os.path.join(SOURCE_DIR, x)))

# Déplacer et renommer avec la date de modification comme suffixe
for filename in small_files_sorted:
    source_path = os.path.join(SOURCE_DIR, filename)
    
    # Obtenir la date de modification
    modification_timestamp = os.path.getmtime(source_path)
    modification_date = datetime.fromtimestamp(modification_timestamp)
    date_str = modification_date.strftime("%Y%m%d")
    
    # Créer le nouveau nom avec suffixe de date
    name_without_ext, ext = os.path.splitext(filename)
    new_filename = f"{name_without_ext}_{date_str}{ext}"
    dest_path = os.path.join(SMALL_DIR, new_filename)
    
    shutil.move(source_path, dest_path)
    print(f"  {filename} → {new_filename} (modifié le {modification_date.strftime('%d/%m/%Y')})")

print(f"\n✓ {len(small_files_sorted)} fichiers 'small' déplacés et renommés dans '{SMALL_DIR}'")

# === RÉCAPITULATIF FINAL ===
print("\n" + "=" * 60)
print("RÉCAPITULATIF")
print("=" * 60)
print(f"Fichiers 'big' traités  : {len(big_files_sorted)}")
print(f"Fichiers 'small' traités: {len(small_files_sorted)}")
print(f"Fichiers restants       : {len(all_files) - len(big_files_sorted) - len(small_files_sorted)}")
print("=" * 60)

Traitement des fichiers 'big'...
  1. big_file_004.txt → 01_big_file_004.txt (15.00 KB)
  2. big_file_025.txt → 02_big_file_025.txt (15.00 KB)
  3. big_file_009.txt → 03_big_file_009.txt (15.00 KB)
  4. big_file_022.txt → 04_big_file_022.txt (14.00 KB)
  5. big_file_020.txt → 05_big_file_020.txt (13.00 KB)
  6. big_file_005.txt → 06_big_file_005.txt (13.00 KB)
  7. big_file_027.txt → 07_big_file_027.txt (12.00 KB)
  8. big_file_010.txt → 08_big_file_010.txt (12.00 KB)
  9. big_file_030.txt → 09_big_file_030.txt (12.00 KB)
  10. big_file_006.txt → 10_big_file_006.txt (11.00 KB)
  11. big_file_015.txt → 11_big_file_015.txt (11.00 KB)
  12. big_file_019.txt → 12_big_file_019.txt (11.00 KB)
  13. big_file_007.txt → 13_big_file_007.txt (10.00 KB)
  14. big_file_003.txt → 14_big_file_003.txt (10.00 KB)
  15. big_file_001.txt → 15_big_file_001.txt (10.00 KB)
  16. big_file_018.txt → 16_big_file_018.txt (9.00 KB)
  17. big_file_012.txt → 17_big_file_012.txt (8.00 KB)
  18. big_file_021.txt → 1