Generative Computer Vision

Cours, code et projets pour le module Generative Computer Vision.

Le cours combine :

les architectures CNN fondamentales utilisées comme backbones dans tous les modèles modernes (VGG, ResNet, YOLO),
des projets pratiques autour de l'augmentation de données par modèles génératifs (image-to-image, image-to-text, text-to-image).

Structure du dépôt

.
├── chapitres/         Notes de cours en Markdown
│   ├── 01-vgg.md
│   ├── 02-resnet.md
│   └── 03-yolo.md
├── code/              Implémentations PyTorch (un sous-dossier par chapitre)
│   ├── 01-vgg/
│   ├── 02-resnet/
│   └── 03-yolo/
└── projets/           3 projets de fin de module
    ├── projet-1-image-to-image-augmentation/
    ├── projet-2-image-to-text-augmentation/
    └── projet-3-text-to-image-augmentation/

Plan du cours

#	Chapitre	Notes	Code
1	VGG	architecture, transfer learning, perceptual loss	code/01-vgg/
2	ResNet	bloc résiduel, fine-tuning, backbones	code/02-resnet/
3	YOLO	détection en une passe, Ultralytics, entraînement custom	code/03-yolo/

Projets

Voir projets/README.md. Chaque projet suit le même protocole : baseline → augmentation classique → augmentation générative → filtrage qualité → évaluation comparative.

#	Sujet	Modèles
1	Image-to-image translation augmentation	Pix2Pix / CycleGAN / Stable Diffusion + ControlNet
2	Image-to-text augmentation	BLIP / BLIP-2 + filtrage CLIP
3	Text-to-image augmentation	Stable Diffusion / SDXL + DreamBooth / LoRA

Setup environnement

conda create -n gcv python=3.10 -y
conda activate gcv

# PyTorch (adapter au CUDA installé)
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121

# Stack vision + génération
pip install diffusers transformers accelerate safetensors xformers
pip install ultralytics albumentations kornia lpips
pip install scikit-image pillow tqdm

GPU recommandé : 8 Go de VRAM minimum. Sans GPU, utiliser Google Colab ou Kaggle Notebooks.

Pré-requis

Python intermédiaire
PyTorch (créer un Dataset, écrire une boucle d'entraînement)
Bases de Deep Learning (CNN, backpropagation)

Ressources externes

Hugging Face — diffusers — tous les modèles de diffusion
Ultralytics YOLOv8 — détection en quelques lignes
Papers with Code — Image Generation
Awesome Stable Diffusion

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
chapitres		chapitres
code		code
projets		projets
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Generative Computer Vision

Structure du dépôt

Plan du cours

Projets

Setup environnement

Pré-requis

Ressources externes

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Generative Computer Vision

Structure du dépôt

Plan du cours

Projets

Setup environnement

Pré-requis

Ressources externes

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages