Skip to content

Aymenbenbrik/GenerativeComputerVision

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Generative Computer Vision

Cours, code et projets pour le module Generative Computer Vision.

Le cours combine :

  • les architectures CNN fondamentales utilisées comme backbones dans tous les modèles modernes (VGG, ResNet, YOLO),
  • des projets pratiques autour de l'augmentation de données par modèles génératifs (image-to-image, image-to-text, text-to-image).

Structure du dépôt

.
├── chapitres/         Notes de cours en Markdown
│   ├── 01-vgg.md
│   ├── 02-resnet.md
│   └── 03-yolo.md
├── code/              Implémentations PyTorch (un sous-dossier par chapitre)
│   ├── 01-vgg/
│   ├── 02-resnet/
│   └── 03-yolo/
└── projets/           3 projets de fin de module
    ├── projet-1-image-to-image-augmentation/
    ├── projet-2-image-to-text-augmentation/
    └── projet-3-text-to-image-augmentation/

Plan du cours

# Chapitre Notes Code
1 VGG architecture, transfer learning, perceptual loss code/01-vgg/
2 ResNet bloc résiduel, fine-tuning, backbones code/02-resnet/
3 YOLO détection en une passe, Ultralytics, entraînement custom code/03-yolo/

Projets

Voir projets/README.md. Chaque projet suit le même protocole : baseline → augmentation classique → augmentation générative → filtrage qualité → évaluation comparative.

# Sujet Modèles
1 Image-to-image translation augmentation Pix2Pix / CycleGAN / Stable Diffusion + ControlNet
2 Image-to-text augmentation BLIP / BLIP-2 + filtrage CLIP
3 Text-to-image augmentation Stable Diffusion / SDXL + DreamBooth / LoRA

Setup environnement

conda create -n gcv python=3.10 -y
conda activate gcv

# PyTorch (adapter au CUDA installé)
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121

# Stack vision + génération
pip install diffusers transformers accelerate safetensors xformers
pip install ultralytics albumentations kornia lpips
pip install scikit-image pillow tqdm

GPU recommandé : 8 Go de VRAM minimum. Sans GPU, utiliser Google Colab ou Kaggle Notebooks.

Pré-requis

  • Python intermédiaire
  • PyTorch (créer un Dataset, écrire une boucle d'entraînement)
  • Bases de Deep Learning (CNN, backpropagation)

Ressources externes

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages