# Organisation projet — rappel court 🗂️

Voici une fiche courte et actionnable que tu peux distribuer en TP pour rappeler **comment structurer un projet Python orienté Data**.

## Arborescence minimale (recommandée)

```
my_data_project/
├─ data/               # données (raw/processed) -> ne pas committer les raw
├─ notebooks/          # notebooks pédagogiques / exploration
├─ src/
│  └─ my_data_project/ # package: code réutilisable
├─ scripts/            # scripts exécutables (run_pipeline.py)
├─ tests/              # tests pytest
├─ outputs/            # résultats exportés
├─ configs/            # .yaml/.toml pour paramètres
├─ docs/               # cheatsheets, guides, slides
├─ .gitignore
├─ pyproject.toml
├─ uv.lock             # lockfile (si tu versionnes)
├─ README.md
└─ LICENSE
```

## Règles simples et utiles

* **Séparer code & données** : `data/` n’est pas dans Git (ajouter à `.gitignore`).
* **Tout code réutilisable dans `src/<pkg>/`** pour faciliter l’import et le packaging.
* **Scripts vs package** : `scripts/` pour lancer le pipeline / démo ; `src/` pour la logique testable.
* **Configurations** dans `configs/` (yaml/toml) — ne pas hardcoder.
* **Outputs** isolés dans `outputs/` (recréables, idempotence).
* **Notebooks = exploration** ; garder versions nettoyées pour partage (`notebooks/clean/` si besoin).
* **Tests** : `tests/` avec `pytest` → au moins un test par fonction critique.
* **Docs / cheatsheets** : `docs/` pour bonnes pratiques et commandes d’installation.
* **Lockfile** (`uv.lock`) : versionner pour reproducibility (optionnel selon politique).
* **.gitignore** : ignorer `data/raw/*`, `.venv/`, `outputs/*`, fichiers temporaires.

## Bonnes pratiques (rapide)

* Fonctions courtes, docstrings, typing.
* Logging (`logging`) plutôt que `print` pour scripts.
* Atomic write pour sorties (tmp → replace).
* Idempotence : rerun sans duplication.
* CI simple : lint + mypy + pytest (ex. GitHub Actions).
* Versionne le `pyproject.toml` et le lockfile pour reproduire l’environnement (tu utilises `uv`).

## README minimal (à inclure)

* But du projet (1 phrase)
* Prérequis (python, uv)
* Installation rapide (uv venv / uv pip sync / uvx commands)
* Exemple d’utilisation (commande)
* Structure du repo (quelques lignes)
* Contact / licence

