Cours, code et projets pour le module Generative Computer Vision.
Le cours combine :
- les architectures CNN fondamentales utilisées comme backbones dans tous les modèles modernes (VGG, ResNet, YOLO),
- des projets pratiques autour de l'augmentation de données par modèles génératifs (image-to-image, image-to-text, text-to-image).
.
├── chapitres/ Notes de cours en Markdown
│ ├── 01-vgg.md
│ ├── 02-resnet.md
│ └── 03-yolo.md
├── code/ Implémentations PyTorch (un sous-dossier par chapitre)
│ ├── 01-vgg/
│ ├── 02-resnet/
│ └── 03-yolo/
└── projets/ 3 projets de fin de module
├── projet-1-image-to-image-augmentation/
├── projet-2-image-to-text-augmentation/
└── projet-3-text-to-image-augmentation/
| # | Chapitre | Notes | Code |
|---|---|---|---|
| 1 | VGG | architecture, transfer learning, perceptual loss | code/01-vgg/ |
| 2 | ResNet | bloc résiduel, fine-tuning, backbones | code/02-resnet/ |
| 3 | YOLO | détection en une passe, Ultralytics, entraînement custom | code/03-yolo/ |
Voir projets/README.md. Chaque projet suit le même protocole : baseline → augmentation classique → augmentation générative → filtrage qualité → évaluation comparative.
| # | Sujet | Modèles |
|---|---|---|
| 1 | Image-to-image translation augmentation | Pix2Pix / CycleGAN / Stable Diffusion + ControlNet |
| 2 | Image-to-text augmentation | BLIP / BLIP-2 + filtrage CLIP |
| 3 | Text-to-image augmentation | Stable Diffusion / SDXL + DreamBooth / LoRA |
conda create -n gcv python=3.10 -y
conda activate gcv
# PyTorch (adapter au CUDA installé)
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121
# Stack vision + génération
pip install diffusers transformers accelerate safetensors xformers
pip install ultralytics albumentations kornia lpips
pip install scikit-image pillow tqdmGPU recommandé : 8 Go de VRAM minimum. Sans GPU, utiliser Google Colab ou Kaggle Notebooks.
- Python intermédiaire
- PyTorch (créer un
Dataset, écrire une boucle d'entraînement) - Bases de Deep Learning (CNN, backpropagation)
- Hugging Face — diffusers — tous les modèles de diffusion
- Ultralytics YOLOv8 — détection en quelques lignes
- Papers with Code — Image Generation
- Awesome Stable Diffusion