API de détection et reconnaissance automatique de produits en rayon, combinant détection d'objets et similarité visuelle pour identifier des SKUs à partir d'images de linéaires.
Image envoyée à l'API :
Résultat retourné — détection des produits avec bounding boxes :
L'API reçoit une image de rayon et retourne la position et l'identité de chaque produit détecté. Elle combine deux modèles complémentaires : DETR pour la localisation des produits, et CLIP pour la reconnaissance par similarité visuelle avec un catalogue de référence.
- Pipeline de détection en deux étapes : segmentation des produits via DETR puis identification par similarité visuelle via CLIP
- API REST Flask multi-client avec paramétrage dynamique par client et par port
- Système d'embeddings : génération et stockage des vecteurs de référence par catalogue produit
- Support de deux variantes de modèle CLIP (base et large) selon les besoins de précision et de performance
- Réponse structurée en JSON avec bounding boxes, labels, scores de confiance et images segmentées
- Interface web légère pour tester la détection en conditions réelles
- Détection objets : DETR (Facebook/Hugging Face)
- Similarité visuelle : CLIP OpenAI — base et large
- Framework API : Flask, Python
- Computer Vision : PyTorch, OpenCV, Hugging Face Transformers
- Embeddings : NumPy
- Déploiement : configurable par port et par client
app.py Point d entrée, chargement des modèles, routing
routes/ Endpoints API (détection, génération embeddings)
services/ Logique métier (segmentation, matching CLIP)
models/ Chargement et initialisation CLIP et DETR
config.py Configuration des chemins et paramètres
git clone https://github.com/Sidivete/SKU_Detection_API.git
cd SKU_Detection_API
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txtTélécharger les modèles CLIP et DETR depuis Hugging Face et les placer dans le dossier Modele/.
python3 app.py --port 5000 --customer nom_clientSidi Teyib BEDDY — ML Engineer

