# Structuration d'un repository (depot)

## Les bonnes pratiques

Un bon programme se doit d'avoir :

- Une arborescence de fichiers logique et, si possible, standardisée.
- Être versionné sur un outil de versionnage tel que GIT.
- Pouvoir être exécuter aisément via l'intermédiaire d'un environnement virtuel.
- Disposer de tests unitaires afin de vérifier que des modifications du progamme n'entraînent pas de régressions.

Nous nous intéresseronts ici uniquement à la structure du repo.

Une bonne structuration de dépôt (repo) facilite la maintenance, la collaboration et le déploiement. Il existe un grand nombre de manières de procéder, voici les plus communes.

## Exemple de structure classique d'un dépôt Python

```
mon_projet/
├── .gitignore
├── README.md
├── LICENSE
├── pyproject.toml (ou un setup.py)
├── requirements.txt
├── docs/
│   └── ...
├── tests/
│   └── ...
├── src/
│   └── mon_projet/
│       ├── __init__.py
│       ├── module1.py
│       └── module2.py
└── scripts/
    └── ...
```

- Les indispensables:
  - **`.gitignore`** : Fichier listant les fichiers et dossiers à ignorer par Git.
  - **`README.md`** : Fichier Markdown décrivant le projet, son installation et son utilisation.
  - **`LICENSE`** : Fichier contenant la licence du projet.
  - **`requirements.txt`** : Fichier listant les dépendances Python du projet.
- les communs:
  - **`setup.py`** : Script d'installation du package Python.
  - **`pyproject.toml`** : Une version plus moderne de "setup.py", qui est utilisé pour spécifier les outils de construction et les dépendances.
  - **`download_data.py`** : Script permettant de télécharger les données.
  - **`environment.yml`** : En général un environnement conda, fonctionne un peu comme un "requirements.txt" mais peut contenir davantage d'informations.
  - **`__init__.py`** : Fichier qui transforme un dossier en un package Python (optionnel depuis Python 3.3)
- Les dossiers fréquents
  - **`docs/`** : Contient la documentation du projet.
  - **`tests/`** : Contient les tests unitaires et d'intégration.
  - **`src/`** : Contient le code source du projet.
  - **`notebooks/`** : Contient les différents notebooks (souvent de l'exploration).
  - **`models/`** : Contient les différents modèles générés par le script.
  - **`data/`** : Contient toutes les données utilisées par le programme. Le contenu de ce dossier est souvent dans le .gitignore.

## Zoom sur quelques fichiers

### `.gitignore`

Fichier listant les fichiers et dossiers à ignorer par Git. Il peut ignorer des fichiers en fonction de leur nom, de leur extension ou du dossier dans lequel ils se trouvent. Le caractère "*" représente une nombre indéfini de caractères.

**Exemple** :
```
# Ignorer les environnements virtuels
venv/
.env/

# Ignorer les fichiers Python compilés
__pycache__/
*.py[cod]

# Ignorer les fichiers de configuration locaux
*.env
*.ini
```

### `README.md`

Fichier Markdown décrivant le projet, son installation et son utilisation.

### `requirements.txt`

Fichier listant les dépendances Python du projet.

**Exemple** :
```
numpy==1.21.0
pandas==1.3.0
requests==2.26.0
flask==2.0.1
```

### `setup.py`

**Description** : Script d'installation définissant les métadonnées du package et les dépendances nécessaires pour l'installation.

**Exemple** :
```python
from setuptools import setup

setup(
    name='mypackage',
    version='0.0.1',
    install_requires=[
        'requests',
        'importlib-metadata; python_version<"3.10"',
    ],
)
```

### `pyproject.toml`

Une version plus moderne de "setup.py", qui est utilisé pour spécifier les outils de construction et les dépendances.

**Exemple** :
```toml
[projet]
name = "hello-world"
version = "1.0.0"
description = "Mon premier paquetage Python"
requires-python = ">=3.8"
keywords = ["python", "premier-projet"]
auteurs = [
    {nom = "John Doe", email = "john@example.com"},
]
dépendances = [
    "requests",
    "gidgethub[httpx]>4.0.0",
]
```

### `download_data.py`

Script permettant de télécharger les données.

### `environment.yml`

**Description** : En général un environnement conda stocké en format YAML. Fonctionne un peu comme un "requirements.txt" mais peut contenir davantage d'informations.

**Exemple** :
```yaml
name: mon_projet
channels:
  - defaults
  - conda-forge
dependencies:
  - python=3.8
  - numpy=1.21.0
  - pandas=1.3.0
  - requests=2.26.0
  - pip
  - pip:
      - flask==2.0.1
      - gunicorn==20.1.0
```

### `__init__.py`

Fichier qui transforme un dossier en un package Python (optionnel depuis Python 3.3).

**Exemple** :
```python
# __init__.py

from .module1 import ma_fonction
from .module2 import ma_classe

__all__ = ["ma_fonction", "ma_classe"]

__version__ = "0.1.0"
```

## Cookiecutter

[Cookiecutter](https://github.com/cookiecutter/cookiecutter) est un outil qui permet de générer des structures de projets à partir de templates. Il est particulièrement utile pour standardiser la structure de vos dépôts Python.