# Projet 2 - Fashion Trend Intelligence | Segmentation vestimentaire avec IA

Ce notebook permet d‚Äô√©valuer la faisabilit√© technique du mod√®le SegFormer-clothes, afin de d√©terminer s‚Äôil est capable d‚Äôidentifier et d‚Äôisoler avec pr√©cision chaque pi√®ce vestimentaire pr√©sente dans une image.


## 1. Installation du projet et de son environnement

Afin d‚Äôutiliser correctement ce notebook, v√©rifiez que vous disposez du bon environnement pour l‚Äôex√©cuter.


### 1.1 Installation de Python

Pour ce projet, il est n√©cessaire d‚Äôavoir **au minimum Python 3.8**.  
Si ce n‚Äôest pas d√©j√† le cas, vous pouvez vous r√©f√©rer √† [la documentation officielle](https://www.python.org/downloads/).

V√©rifiez votre version de Python :

```bash
python --version
```

### 1.2 Installation de `uv`

`uv` est un gestionnaire de projets Python permettant d‚Äôinstaller et d‚Äôorganiser les d√©pendances plus rapidement et plus simplement que les outils traditionnels (`pip`, `virtualenv`, etc.).

Pour installer `uv`, veuillez suivre [la documentation officielle](https://docs.astral.sh/uv/getting-started/installation/#standalone-installer)

V√©rifiez l‚Äôinstallation :

```bash
uv --version
```

### 1.3 Cr√©ation du projet

Cr√©ez un nouveau projet Python avec `uv` :

```bash
uv init nom_du_projet
cd nom_du_projet
```

La structure de base du projet est alors g√©n√©r√©e automatiquement.


### 1.4 Cr√©ation et activation de l‚Äôenvironnement virtuel

Cr√©ez l‚Äôenvironnement virtuel :

```bash
uv venv
```

Activez-le selon votre syst√®me :

* **Linux / macOS**

```bash
source .venv/bin/activate
```

* **Windows (PowerShell)**

```powershell
.venv\Scripts\Activate.ps1
```

Voir la documentation officielle :
[https://docs.astral.sh/uv/pip/environments/#creating-a-virtual-environment](https://docs.astral.sh/uv/pip/environments/#creating-a-virtual-environment)



### 1.5 Installation des d√©pendances

> ‚ùó Assurez-vous que l‚Äôenvironnement virtuel est **activ√©** avant d‚Äôinstaller les d√©pendances.

Installez les biblioth√®ques n√©cessaires au projet :

```bash
uv add ipykernel jupyterlab requests pillow matplotlib numpy tqdm python-dotenv aiohttp
```

Ces d√©pendances sont automatiquement enregistr√©es dans le fichier `pyproject.toml`.

Vous pouvez visualiser l‚Äôensemble des d√©pendances install√©es avec la commande suivante :

```bash
uv tree
```

### 1.6 Cr√©ation du fichier `.env`

Cr√©ez un fichier nomm√© `.env` √† la racine du projet.

Copiez-y le contenu suivant et remplacez les valeurs si n√©cessaire :

```env
# Token d'authentification √† l'API Hugging Face
HF_API_TOKEN=VOTRE_TOKEN_HUGGING_FACE_ICI

# Chemins du dataset
DATASET_IMAGES_DIR=content/images_a_segmenter
DATASET_ANNOTATIONS_DIR=content/annotations
```

‚ö†Ô∏è **Important** :

* Ne partagez jamais votre fichier `.env`
* Ajoutez-le √† votre `.gitignore`

```gitignore
.env
```

### 1.7 Cr√©ation d‚Äôun token Hugging Face

1. Cr√©ez un compte sur [https://huggingface.co/](https://huggingface.co/)
2. Allez dans **Profile ‚Üí Settings ‚Üí Access Tokens**
3. Cr√©ez un nouveau token (r√¥le **read** suffisant)
4. Copiez le token dans la variable `HF_API_TOKEN` du fichier `.env`


### 1.8 Pr√©paration des jeux de donn√©es

R√©cup√©rez les jeux de donn√©es (images et annotations) et placez-les dans les dossiers suivants :

```
content/
‚îú‚îÄ‚îÄ images_a_segmenter/
‚îÇ   ‚îú‚îÄ‚îÄ image_0.jpg
‚îÇ   ‚îú‚îÄ‚îÄ image_1.jpg
‚îÇ   ‚îî‚îÄ‚îÄ ...
‚îî‚îÄ‚îÄ annotations/
    ‚îú‚îÄ‚îÄ mask_0.json
    ‚îú‚îÄ‚îÄ mask_1.json
    ‚îî‚îÄ‚îÄ ...
```

## 2. Importation des Biblioth√®ques

Commen√ßons par importer les biblioth√®ques Python n√©cessaires. Nous aurons besoin de :
- **`os`** : Interaction avec le syst√®me de fichiers (navigation dans les r√©pertoires, listage des fichiers images).
- **`requests`** : Envoi de requ√™tes HTTP vers l'API pour la segmentation d'images.
- **`PIL (Pillow)`** : Manipulation et traitement des images (ouverture, redimensionnement, conversion).
- **`matplotlib.pyplot`** : Visualisation des images originales et des masques de segmentation.
- **`matplotlib.patches`** : Cr√©ation d'√©l√©ments graphiques personnalis√©s pour les l√©gendes des visualisations.
- **`numpy`** : Manipulation efficace des tableaux num√©riques repr√©sentant les pixels des images.
- **`tqdm.notebook`** : Affichage d'une barre de progression interactive dans les notebooks Jupyter (utile lors du traitement par lot).
- **`base64`** : Encodage/d√©codage en Base64 des images et masques √©chang√©s avec l'API.
- **`io`** : Gestion des flux de donn√©es en m√©moire pour la manipulation des images sans fichiers temporaires.
- **`python-dotenv`** : Chargement s√©curis√© des variables d'environnement (comme les cl√©s API) depuis un fichier `.env`.
- **`time`** : Gestion des d√©lais entre les appels API pour respecter les limites de taux (rate limiting).
- **`re`** : Traitement d'expressions r√©guli√®res (parsing de r√©ponses, validation de formats).
- **`aiohttp`** : Requ√™tes HTTP asynchrones pour am√©liorer les performances lors du traitement par lot d'images.


In [None]:
import os
import requests
from PIL import Image
import matplotlib.pyplot as plt
from matplotlib.patches import Patch
from matplotlib.colors import Colormap
import numpy as np
import numpy.typing as npt
from tqdm.notebook import tqdm
from tqdm.asyncio import tqdm as async_tqdm
import base64
import io
from dotenv import load_dotenv
import time
import re
import asyncio
import aiohttp
from typing import Dict, List, TypedDict, Union, Tuple
from datetime import datetime
from pathlib import Path


## 3. Chargement de la Configuration

In [None]:
# Charger les variables d'environnement depuis le fichier .env
load_dotenv(override=True)

# R√©cup√©ration des variables d'environnement
IMAGES_DIR = os.getenv('DATASET_IMAGES_DIR')
ANNOTATIONS_DIR = os.getenv('DATASET_ANNOTATIONS_DIR')
API_TOKEN = os.getenv('HF_API_TOKEN')
MAX_IMAGES = 2  # Nombre maximum d'images √† traiter

# V√©rification de la pr√©sence des variables
if not IMAGES_DIR or not API_TOKEN or not ANNOTATIONS_DIR:
    raise ValueError("Variables d'environnement manquantes dans le fichier .env")

# V√©rification du token
if API_TOKEN == "VOTRE_TOKEN_HUGGING_FACE_ICI":
    raise ValueError("Vous devez remplacer 'VOTRE_TOKEN_HUGGING_FACE_ICI' par votre token API personnel dans le fichier .env")


In [None]:
# Pr√©fixes pour les fichiers
MASK_PREFIX = "mask_"
IMAGE_FILENAME_SEPARATOR = '_'
IMAGE_NUMBER_INDEX = 1

# Type alias pour am√©liorer la lisibilit√©
PathLike = Union[Path, str]

def validate_file_exists(path: PathLike, file_type: str) -> bool:
    """V√©rifie l'existence d'un fichier et log si absent."""
    if not Path(path).exists():
        print(f"{file_type} introuvable: {path}")
        return False
    return True

def natural_sort_key(path):
        filename = os.path.basename(path)
        # Extraire les nombres du nom de fichier
        return [int(text) if text.isdigit() else text.lower() 
                for text in re.split('([0-9]+)', filename)]

def get_image_paths(
    images_dir: str = None,
    max_images: int = None,
    extensions: Tuple[str, ...] = ('.png', '.jpg', '.jpeg'),
) -> List[Path]:
    """
    R√©cup√®re et trie les chemins des images √† traiter.
    
    Args:
        images_dir: R√©pertoire contenant les images (par d√©faut: IMAGES_DIR)
        max_images: Nombre maximum d'images (par d√©faut: MAX_IMAGES)
        extensions: Extensions de fichiers accept√©es
    
    Returns:
        Liste des chemins d'images tri√©s naturellement et valid√©s
        
    Raises:
        FileNotFoundError: Si le r√©pertoire n'existe pas
        NotADirectoryError: Si le chemin n'est pas un r√©pertoire
    """
    # Utiliser les valeurs par d√©faut si non fournies
    images_dir = Path(images_dir)
    
    # V√©rifier l'existence du r√©pertoire avec validate_file_exists
    if not Path(images_dir).exists():
        raise FileNotFoundError(f"Le r√©pertoire '{images_dir}' n'existe pas")
    
    if not images_dir.is_dir():
        raise NotADirectoryError(f"'{images_dir}' n'est pas un r√©pertoire")
    
    # R√©cup√©rer tous les fichiers avec les bonnes extensions
    image_paths = [
        images_dir / f 
        for f in os.listdir(images_dir) 
        if f.lower().endswith(extensions)
    ]
    
    # Messages informatifs
    if not image_paths:
        print(f"‚ö†Ô∏è  Aucune image valide trouv√©e dans '{images_dir}'")
        return []
    
    print(f"‚úÖ {len(image_paths)} image(s) valide(s) trouv√©e(s)")
    
    # Tri naturel
    image_paths.sort(key=natural_sort_key)
    
    # Limitation
    original_count = len(image_paths)
    image_paths = image_paths[:max_images]
    
    if len(image_paths) < original_count:
        print(f"‚öôÔ∏è  Limitation appliqu√©e: {len(image_paths)}/{original_count} images")
    
    return image_paths

def get_mask_paths(
    image_paths: List[PathLike],
    masks_dir: str,
    mask_prefix: str = "mask_"
) -> List[Path]:
    """
    R√©cup√®re les chemins des masques (ground truth ou pr√©dits).
    
    Args:
        image_paths: Liste des chemins des images
        masks_dir: R√©pertoire contenant les masques
        mask_prefix: Pr√©fixe des fichiers de masques
    
    Returns:
        Liste des chemins des masques (None si masque absent)
    """
    mask_paths = []
    
    for image_path in image_paths:
        # Extraire le num√©ro de l'image
        filename = Path(image_path).name
        parts = filename.split(IMAGE_FILENAME_SEPARATOR)
        image_number = parts[IMAGE_NUMBER_INDEX].split('.')[0]

        # Chemin vers le masque
        mask_path = Path(masks_dir) / f"{mask_prefix}{image_number}.png"
        
        # Validation de l'existence du masque
        if validate_file_exists(mask_path, f"Masque ({mask_prefix})"):
            mask_paths.append(mask_path)
        else:
            mask_paths.append(None)
    
    return mask_paths

def get_gt_mask_paths(image_paths: List[PathLike]) -> List[Path]:
    """R√©cup√®re les chemins des masques ground truth."""
    return get_mask_paths(
        image_paths=image_paths,
        masks_dir=ANNOTATIONS_DIR,
        mask_prefix=MASK_PREFIX
    )

# Cr√©ation des dossiers s'ils n'existent pas
for directory, name in [(IMAGES_DIR, "images"), (ANNOTATIONS_DIR, "annotations")]:
    if not os.path.exists(directory):
        os.makedirs(directory)
        print(f"‚úì Dossier '{directory}' cr√©√© pour les {name}.")
    else:
        print(f"‚úì Dossier '{directory}' existant.")

image_paths = get_image_paths(IMAGES_DIR, MAX_IMAGES)
gt_mask_paths = get_gt_mask_paths(image_paths)

print(f"\n‚úÖ {len(gt_mask_paths)} annotations charg√©es")

## 4. Configuration de l'API Hugging Face

### 4.1 Pr√©sentation du mod√®le
Nous utilisons le mod√®le [**SegFormer-B3-Clothes**](https://huggingface.co/sayeed99/segformer_b3_clothes) qui est sp√©cialis√© dans la segmentation s√©mantique de v√™tements. Ce mod√®le peut d√©tecter 18 classes diff√©rentes :
- √âl√©ments vestimentaires : chapeau, haut, jupe, pantalon, robe, ceinture, chaussures, sac, √©charpe
- Parties du corps : cheveux, visage, bras, jambes
- Accessoires : lunettes de soleil
- Arri√®re-plan

### 4.2 Configuration de l'endpoint API
L'API Hugging Face Inference Router permet d'interroger le mod√®le sans avoir √† le d√©ployer localement. Voici les √©l√©ments de configuration :

**URL de l'API** : `https://router.huggingface.co/hf-inference/models/sayeed99/segformer_b3_clothes`

**Headers requis** :
- `Authorization: Bearer YOUR_TOKEN` : Authentification avec votre token personnel
- `Content-Type: image/jpeg` ou `image/png` : Type MIME de l'image envoy√©e

**Format de r√©ponse** : L'API retourne un JSON contenant une liste de masques encod√©s en base64, un par classe d√©tect√©e.

**S√©curit√©** : Ne jamais hardcoder votre token dans le notebook. Elle doit mis dans la variable d'environnement `HF_API_TOKEN'` le fichier `.env`

### 4.3 Bonnes pratiques d'utilisation
1. **Rate Limiting** : Espacer les requ√™tes de 1-2 secondes pour √©viter les erreurs 429 (Too Many Requests)
2. **Timeout** : D√©finir un timeout de 30 secondes minimum (le mod√®le peut √™tre lent)
3. **Gestion d'erreurs** : Pr√©voir les cas suivants :
   - 401 : Token invalide
   - 429 : Trop de requ√™tes
   - 500 : Erreur serveur (r√©essayer apr√®s quelques secondes)
   - 503 : Mod√®le en cours de chargement (attendre et r√©essayer)

In [None]:
API_URL = "https://router.huggingface.co/hf-inference/models/sayeed99/segformer_b3_clothes"
headers = {
    "Authorization": f"Bearer {API_TOKEN}"
    # Le "Content-Type" sera ajout√© dynamiquement lors de l'envoi de l'image
}


# Rate limiting pour compte gratuit (d'apr√®s la doc HF)
# Inference API : ~1000 requ√™tes/jour, avec burst de ~100 requ√™tes/min
REQUESTS_PER_MINUTE = 30  # On reste prudent (bien en dessous de 100)
DELAY_BETWEEN_REQUESTS = 60 / REQUESTS_PER_MINUTE  # ~2 secondes entre chaque requ√™te


# Configuration des requ√™tes asynchrones
MAX_CONCURRENT_REQUESTS = 5      # Nombre de requ√™tes simultan√©es maximum
MAX_RETRIES = 3                  # Nombre de tentatives en cas d'erreur
INITIAL_RETRY_DELAY = 2          # D√©lai initial entre les tentatives (secondes)
REQUEST_TIMEOUT = 30             # Timeout des requ√™tes (secondes)

CLASS_MAPPING = {
    "Background": 0,
    "Hat": 1,
    "Hair": 2,
    "Sunglasses": 3,
    "Upper-clothes": 4,
    "Skirt": 5,
    "Pants": 6,
    "Dress": 7,
    "Belt": 8,
    "Left-shoe": 9,
    "Right-shoe": 10,
    "Face": 11,
    "Left-leg": 12,
    "Right-leg": 13,
    "Left-arm": 14,
    "Right-arm": 15,
    "Bag": 16,
    "Scarf": 17
}

def get_image_dimensions(img_path):
    """
    Get the dimensions of an image.

    Args:
        img_path (str): Path to the image.

    Returns:
        tuple: (width, height) of the image.
    """
    original_image = Image.open(img_path)
    return original_image.size

def decode_base64_mask(base64_string, width, height):
    """
    Decode a base64-encoded mask into a NumPy array.

    Args:
        base64_string (str): Base64-encoded mask.
        width (int): Target width.
        height (int): Target height.

    Returns:
        np.ndarray: Single-channel mask array.
    """
    mask_data = base64.b64decode(base64_string)
    mask_image = Image.open(io.BytesIO(mask_data))
    mask_array = np.array(mask_image)
    if len(mask_array.shape) == 3:
        mask_array = mask_array[:, :, 0]  # Take first channel if RGB
    mask_image = Image.fromarray(mask_array).resize((width, height), Image.NEAREST)
    return np.array(mask_image)

def create_masks(results, width, height):
    """
    Combine multiple class masks into a single segmentation mask.

    Args:
        results (list): List of dictionaries with 'label' and 'mask' keys.
        width (int): Target width.
        height (int): Target height.

    Returns:
        np.ndarray: Combined segmentation mask with class indices.
    """
    combined_mask = np.zeros((height, width), dtype=np.uint8)  # Initialize with Background (0)

    # Process non-Background masks first
    for result in results:
        label = result['label']
        class_id = CLASS_MAPPING.get(label, 0)
        if class_id == 0:  # Skip Background
            continue
        mask_array = decode_base64_mask(result['mask'], width, height)
        combined_mask[mask_array > 0] = class_id

    # Process Background last to ensure it doesn't overwrite other classes unnecessarily
    # (Though the model usually provides non-overlapping masks for distinct classes other than background)
    for result in results:
        if result['label'] == 'Background':
            mask_array = decode_base64_mask(result['mask'], width, height)
            # Apply background only where no other class has been assigned yet
            # This logic might need adjustment based on how the model defines 'Background'
            # For this model, it seems safer to just let non-background overwrite it first.
            # A simple application like this should be fine: if Background mask says pixel is BG, set it to 0.
            # However, a more robust way might be to only set to background if combined_mask is still 0 (initial value)
            combined_mask[mask_array > 0] = 0 # Class ID for Background is 0

    return combined_mask

async def segment_clothes_async(
    session: aiohttp.ClientSession,
    single_image_path: str,
    semaphore: asyncio.Semaphore
) -> Dict:
    """
    Requ√™te asynchrone √† l'API Hugging Face avec rate limiting.

    Args:
        session: Session aiohttp partag√©e
        single_image_path: Chemin vers l'image √† segmenter
        semaphore: S√©maphore pour limiter les requ√™tes concurrentes

    Returns:
        dict: R√©sultats de la segmentation (JSON de l'API)
        
    Raises:
        FileNotFoundError: Si le fichier image n'existe pas
        ValueError: Si le format d'image n'est pas support√©
        aiohttp.ClientError: Si la requ√™te API √©choue
    """
    
    # V√©rification de l'existence du fichier
    if not os.path.exists(single_image_path):
        raise FileNotFoundError(f"L'image '{single_image_path}' n'existe pas")
    
    # V√©rification du format d'image
    try:
        with Image.open(single_image_path) as img:
            image_format = img.format
            
            if image_format not in ['JPEG', 'PNG']:
                raise ValueError(
                    f"Format '{image_format}' non support√©. "
                    f"Formats accept√©s: JPEG, PNG"
                )
    except Exception as e:
        raise ValueError(f"Impossible d'ouvrir l'image: {e}")
    
    # Lecture du contenu binaire
    try:
        with open(single_image_path, 'rb') as fichier:
            image_data = fichier.read()
    except IOError as e:
        raise IOError(f"Erreur lors de la lecture du fichier: {e}")
    
    # Configuration des headers
    request_headers = headers.copy()
    request_headers["Content-Type"] = f"image/{image_format.lower()}"
    
    # Utilisation du s√©maphore pour limiter les requ√™tes concurrentes
    async with semaphore:
        retry_delay = INITIAL_RETRY_DELAY
        
        for attempt in range(MAX_RETRIES):
            try:
                async with session.post(
                    API_URL,
                    headers=request_headers,
                    data=image_data,
                    timeout=aiohttp.ClientTimeout(total=REQUEST_TIMEOUT)
                ) as response:
                    
                    # Gestion des diff√©rents codes de statut
                    if response.status == 503:
                        # Mod√®le en cours de chargement
                        print(f"‚è≥ Mod√®le en chargement, attente {INITIAL_RETRY_DELAY}s...")
                        await asyncio.sleep(INITIAL_RETRY_DELAY)
                        retry_delay *= 2  # Backoff exponentiel
                        continue
                    
                    elif response.status == 429:
                        # Rate limit atteint
                        retry_after = response.headers.get('Retry-After', retry_delay)
                        wait_time = int(retry_after) if isinstance(retry_after, str) and retry_after.isdigit() else retry_delay
                        print(f"‚ö†Ô∏è Rate limit atteint, attente {wait_time}s...")
                        await asyncio.sleep(wait_time)
                        continue
                    
                    elif response.status == 401:
                        raise ValueError("Token API invalide ou expir√©")
                    
                    elif response.status >= 500:
                        # Erreur serveur, on r√©essaie
                        if attempt < MAX_RETRIES - 1:
                            print(f"‚ùå Erreur serveur (5xx), nouvelle tentative dans {retry_delay}s...")
                            await asyncio.sleep(retry_delay)
                            retry_delay *= 2
                            continue
                        else:
                            raise aiohttp.ClientError(
                                f"Erreur serveur persistante (status {response.status})"
                            )
                    
                    # V√©rification du statut
                    response.raise_for_status()
                    
                    # Parsing de la r√©ponse
                    results = await response.json()
                    print(f"‚úÖ R√©ponse re√ßue pour {os.path.basename(single_image_path)}")
                    
                    # D√©lai entre les requ√™tes pour respecter le rate limit
                    await asyncio.sleep(DELAY_BETWEEN_REQUESTS)
                    
                    return results
                    
            except asyncio.TimeoutError:
                if attempt < MAX_RETRIES - 1:
                    print(f"‚è±Ô∏è Timeout, nouvelle tentative...")
                    await asyncio.sleep(retry_delay)
                    continue
                else:
                    raise asyncio.TimeoutError(
                        f"Timeout apr√®s {MAX_RETRIES} tentatives pour '{single_image_path}'"
                    )
            
            except aiohttp.ClientError as e:
                if attempt < MAX_RETRIES - 1:
                    print(f"‚ùå Erreur r√©seau, nouvelle tentative dans {retry_delay}s...")
                    await asyncio.sleep(retry_delay)
                    continue
                else:
                    raise
        
        raise Exception(f"√âchec apr√®s {MAX_RETRIES} tentatives")


async def segment_clothes_batch(image_paths: List[str]) -> List[Dict]:
    """
    Segmente un lot d'images de mani√®re asynchrone avec rate limiting.
    
    Args:
        image_paths: Liste des chemins d'images √† traiter
        
    Returns:
        List[Dict]: Liste des r√©sultats de segmentation
    """
    # S√©maphore pour limiter les requ√™tes concurrentes
    semaphore = asyncio.Semaphore(MAX_CONCURRENT_REQUESTS)
    
    async with aiohttp.ClientSession() as session:
        tasks = [
            segment_clothes_async(session, img_path, semaphore)
            for img_path in image_paths
        ]
        
        # Ex√©cution de toutes les t√¢ches
        results = await async_tqdm.gather(*tasks, desc="Segmentation")        
        
        # Traitement des r√©sultats et des erreurs
        processed_results = []
        for i, result in enumerate(results):
            if isinstance(result, Exception):
                print(f"‚ùå Erreur pour {image_paths[i]}: {result}")
                processed_results.append(None)
            else:
                width, height = get_image_dimensions(image_paths[i])
                processed_results.append(create_masks(result, width, height))
        
        return processed_results

## 5. Visualisation des annotations (Ground Truth)

Ces annotations serviront de r√©f√©rence pour √©valuer la qualit√© des pr√©dictions du mod√®le dans les sections suivantes.

In [None]:
# Identifiant de la classe background
BACKGROUND_CLASS_ID = 0

# Configuration de la l√©gende
LEGEND_CONFIG = {
    'loc': 'upper left',
    'frameon': False,
    'handlelength': 1,
    'handleheight': 1,
    'handletextpad': 0.4,
    'labelcolor': 'white',
}

# Configuration de la figure
FIGURE_WIDTH = 18
FIGURE_HEIGHT = 6
OVERLAY_ALPHA = 0.5

# Nom de la colormap
COLORMAP_NAME = 'tab20'





class ImageInfo(TypedDict):
    """Informations d√©taill√©es sur l'image."""
    image_size: Tuple[int, int]
    image_mode: str
    mask_size: Tuple[int, int]
    unique_classes: List[int]
    num_classes: int
    class_distribution: Dict[int, int]

class VerificationResult(TypedDict):
    """R√©sultat de la v√©rification d'une paire image/masque."""
    warnings: List[str]
    info: ImageInfo

def get_legend_elements(
    mask_array: npt.NDArray[np.int32],
    id_to_class: Dict[int, str],
    color_map: Colormap,
    num_classes: int
) -> List[Patch]:
    """
    Cr√©e les √©l√©ments de l√©gende pour les classes pr√©sentes dans le masque.
    
    Args:
        mask_array: Tableau 2D repr√©sentant le masque de segmentation
        id_to_class: Mapping {id_classe: nom_classe}
        color_map: Colormap matplotlib
        num_classes: Nombre total de classes
    
    Returns:
        Liste d'objets Patch pour la l√©gende matplotlib
    """
    unique_classes = np.unique(mask_array)
    legend_elements = []
    
    for class_id in unique_classes:
        if class_id in id_to_class:
            # Normalisation pour la colormap [0, 1]
            normalized_id = class_id / (num_classes - 1)
            color = color_map(normalized_id)
            legend_elements.append(
                Patch(facecolor=color, label=id_to_class[class_id])
            )
    
    return legend_elements


def verify_image_mask_pair(
    original_image: Image.Image,
    mask_image: Image.Image,
    max_class_id: int
) -> VerificationResult:
    """
    V√©rifie la validit√© et la coh√©rence d'une paire image/masque.
    
    Args:
        original_image: Image originale
        mask_image: Masque d'annotation correspondant
        max_class_id: ID de classe maximum attendu

    Returns:
        R√©sultats de la v√©rification avec cl√©s 'warnings', 'info'
    """
    result = {
        'warnings': [],
        'info': {}
    }
    
    # V√©rifier les dimensions
    if original_image.size != mask_image.size:
        result['warnings'].append(
            f"Dimensions diff√©rentes - Image: {original_image.size}, "
            f"Masque: {mask_image.size}"
        )
    
    # V√©rifier le mode de l'image
    valid_image_modes = ['RGB', 'RGBA', 'L']
    if original_image.mode not in valid_image_modes:
        result['warnings'].append(f"Mode d'image inhabituel: {original_image.mode}")

    # Analyser le masque
    mask_array = np.array(mask_image)
    unique_classes = np.unique(mask_array)
    
    # V√©rifier les valeurs des classes
    invalid_classes = [c for c in unique_classes if c > max_class_id]
    if invalid_classes:
        result['warnings'].append(
            f"Classes invalides d√©tect√©es: {invalid_classes} "
            f"(max attendu: {max_class_id})"
        )
    
    # V√©rifier si le masque est vide (que du background)
    if len(unique_classes) == 1 and unique_classes[0] == BACKGROUND_CLASS_ID:
        result['warnings'].append("Masque vide (que du background)")
    
    # Informations suppl√©mentaires
    result['info'] = {
        'image_size': original_image.size,
        'image_mode': original_image.mode,
        'mask_size': mask_image.size,
        'unique_classes': unique_classes.tolist(),
        'num_classes': len(unique_classes),
        'class_distribution': {
            int(class_id): int(np.sum(mask_array == class_id)) 
            for class_id in unique_classes
        }
    }
    
    return result

def create_visualization_figure(
    original_image: Image.Image,
    mask_image: Image.Image,
    image_name: str,
    mask_array: npt.NDArray[np.int32],
    id_to_class: Dict[int, str],
    color_map: Colormap,
    num_classes: int
) -> None:
    """
    Cr√©e et affiche une figure de visualisation avec 3 subplots.
    
    Args:
        original_image: Image originale
        mask_image: Masque d'annotation
        image_number: Num√©ro de l'image pour le titre
        mask_array: Tableau numpy du masque pour la l√©gende
        id_to_class: Mapping {id_classe: nom_classe}
        color_map: Colormap matplotlib
        num_classes: Nombre total de classes
    """
    fig, axes = plt.subplots(1, 3, figsize=(FIGURE_WIDTH, FIGURE_HEIGHT))

    # Image originale
    axes[0].imshow(original_image)
    axes[0].set_title(f"Image : {image_name}", fontsize=12, fontweight='bold')
    axes[0].axis("off")
    
    # Masque d'annotation
    axes[1].imshow(
        mask_image,
        cmap=color_map,
        vmin=0,
        vmax=num_classes - 1
    )
    axes[1].set_title("Annotation", fontsize=12, fontweight='bold')
    axes[1].axis("off")
    
    # Overlay (image + masque transparent)
    axes[2].imshow(original_image)
    axes[2].imshow(
        mask_image,
        cmap=color_map,
        alpha=OVERLAY_ALPHA,
        vmin=0,
        vmax=num_classes - 1
    )
    axes[2].set_title("Overlay", fontsize=12, fontweight='bold')
    axes[2].axis("off")
    
    # Ajouter les l√©gendes
    legend_elements = get_legend_elements(mask_array, id_to_class, color_map, num_classes)
    axes[1].legend(handles=legend_elements, **LEGEND_CONFIG)
    axes[2].legend(handles=legend_elements, **LEGEND_CONFIG)
    
    plt.tight_layout()
    plt.show()



def display_images_with_masks(
    image_paths: List[PathLike],
    gt_mask_paths: List[PathLike],
    class_mapping: Dict[str, int]
) -> None:
    """
    Affiche un batch d'images avec leurs masques d'annotation.
    
    Args:
        image_paths: Liste des chemins des images √† afficher
        gt_mask_paths: Liste des chemins des masques d'annotation
        class_mapping: Dictionnaire {nom_classe: id_classe}
    """
    if not image_paths:
        print("Aucune image √† afficher.")
        return
    
    
    id_to_class = {v: k for k, v in class_mapping.items()}
    color_map = plt.colormaps.get_cmap(COLORMAP_NAME).resampled(len(class_mapping))
    max_class_id = max(class_mapping.values())
    num_classes = len(class_mapping)
    
    stats = {
        'total': len(image_paths),
        'displayed': 0,
        'warnings': 0,
        'images_not_found': 0,
        'masks_not_found': 0,
        'error': 0
    }

    for image_index, (image_path, gt_mask_path) in enumerate(zip(image_paths, gt_mask_paths), 1):
        print(f"\n[{image_index}/{stats['total']}] Traitement de: {image_path}")

        try:
            # V√©rifier l'existence des fichiers
            if not validate_file_exists(image_path, "Image"):
                stats['images_not_found'] += 1
                continue

            if not validate_file_exists(gt_mask_path, "Annotation"):
                stats['masks_not_found'] += 1
                continue

            original_image = Image.open(image_path)
            mask_image = Image.open(gt_mask_path)

            verification = verify_image_mask_pair(original_image, mask_image, max_class_id)
            
            if verification['warnings']:
                stats['warnings'] += 1
                print(f"‚ö†Ô∏è  AVERTISSEMENTS:")
                for warning in verification['warnings']:
                    print(f"   - {warning}")
            
            if verification['info']:
                info = verification['info']
                print(f"‚ÑπÔ∏è  INFORMATIONS:")
                print(f"   - Dimensions: {info['image_size']}")
                print(f"   - Nombre de classes pr√©sentes: {info['num_classes']}")
                print(f"   - Classes d√©tect√©es: {info['unique_classes']}")

            # Cr√©er la visualisation
            mask_array = np.array(mask_image, dtype=np.int32)
            create_visualization_figure(
                original_image,
                mask_image,
                image_path.name,
                mask_array,
                id_to_class,
                color_map,
                num_classes
            )
            stats['displayed'] += 1
        except ValueError as e:
            print(f"‚ùå Erreur: {e}")
            stats['error'] += 1
        except Exception as e:
            print(f"‚ùå Erreur inattendue: {type(e).__name__}: {e}")
            stats['error'] += 1

    # R√©sum√© final
    print(f"\n{'='*60}")
    print(f"üìä R√âSUM√â DE LA V√âRIFICATION:")
    print(f"  ‚Ä¢ Total d'images: {stats['total']}")
    print(f"  ‚Ä¢ Images affich√©es: {stats['displayed']}")
    print(f"  ‚Ä¢ Images avec warnings: {stats['warnings']}")
    print(f"  ‚Ä¢ Images manquantes: {stats['images_not_found']}")
    print(f"  ‚Ä¢ Masques manquants: {stats['masks_not_found']}")
    print(f"  ‚Ä¢ Erreurs de traitement: {stats['error']}")
    print(f"{'='*60}")

# Afficher les r√©sultats du batch
display_images_with_masks(
    image_paths=image_paths[:MAX_IMAGES],
    gt_mask_paths=gt_mask_paths,
    class_mapping=CLASS_MAPPING
)

## 6. Segmentation des Images


In [None]:
async def segment_images(image_paths: List[str]) -> List[Dict]:
    """
    Args:
        image_paths: Liste des chemins d'images (ou chemin unique)
        
    Returns:
        List[Dict] ou Dict: R√©sultats de la segmentation
    """
    # Accepter un seul chemin ou une liste
    if isinstance(image_paths, str):
        image_paths = [image_paths]
    
    print(f"üöÄ D√©but de la segmentation de {len(image_paths)} image(s)...")
    print(f"‚è±Ô∏è D√©lai entre requ√™tes: {DELAY_BETWEEN_REQUESTS:.2f}s")
    
    start_time = datetime.now()
    
    # Ex√©cution asynchrone
    results = await segment_clothes_batch(image_paths)
    
    end_time = datetime.now()
    duration = (end_time - start_time).total_seconds()
    
    print(f"\n‚úÖ Traitement termin√© en {duration:.2f}s")
    print(f"üìä Succ√®s: {sum(1 for r in results if r is not None)}/{len(image_paths)}")
    print(f"‚ö° Vitesse moyenne: {len(image_paths)/duration:.2f} images/seconde")

    # Si une seule image, retourner directement le r√©sultat
    if len(image_paths) == 1:
        return results[0]
    
    return results



def save_masks(
    predicted_masks: List[np.ndarray],
    image_paths: List[PathLike],
    output_dir: str = "content/results"
) -> None:
    """
    Enregistre les masques de segmentation pr√©dits au format PNG.
    
    Args:
        predicted_masks: Liste des masques pr√©dits (NumPy arrays)
        image_paths: Liste des chemins des images originales
        output_dir: R√©pertoire de sortie pour les masques
    """
    # Cr√©er le dossier s'il n'existe pas
    os.makedirs(output_dir, exist_ok=True)
    
    saved_count = 0
    
    for img_path, pred_mask in zip(image_paths, predicted_masks):
        if pred_mask is None:
            print(f"‚ö†Ô∏è Pas de masque √† sauvegarder pour {img_path}")
            continue
        
        # Extraire le nom de fichier original
        img_filename = Path(img_path).stem  # ex: "image_0"
        
        # Cr√©er le nom du fichier de sortie
        output_filename = f"pred_mask_{img_filename}.png"
        output_path = os.path.join(output_dir, output_filename)
        
        # Convertir le masque en image PIL et sauvegarder
        mask_image = Image.fromarray(pred_mask.astype(np.uint8))
        mask_image.save(output_path)
        
        saved_count += 1
        print(f"‚úÖ Masque sauvegard√© : {output_path}")
    
    print(f"\nüìä Total : {saved_count}/{len(image_paths)} masques sauvegard√©s dans '{output_dir}'")



batch_seg_results = []
# Appeler la fonction pour segmenter les images list√©es dans image_paths
if image_paths:
    print(f"\nTraitement de {len(image_paths)} image(s) en batch...")
    batch_seg_results = await segment_images(image_paths)

    # Sauvegarder les masques pr√©dits
    save_masks(batch_seg_results, image_paths, output_dir="content/results")
    print("Traitement en batch termin√©.")

else:
    print("Aucune image √† traiter en batch.")



## 7. Visualisation des Pr√©dictions du Mod√®le

Cette section affiche les pr√©dictions g√©n√©r√©es par le mod√®le SegFormer via l'API Hugging Face. Pour chaque image :
- **Image originale** : Photo source envoy√©e √† l'API
- **Masque segment√©** : Pr√©diction du mod√®le (masque de segmentation g√©n√©r√©)
- **Overlay** : Superposition de la pr√©diction sur l'image originale avec transparence

Ces visualisations permettent d'√©valuer qualitativement la capacit√© du mod√®le √† segmenter les diff√©rentes classes vestimentaires.

In [None]:
def get_predicted_mask_paths(image_paths: List[PathLike]) -> List[Path]:
    """R√©cup√®re les chemins des masques pr√©dits."""
    return get_mask_paths(
        image_paths=image_paths,
        masks_dir="content/results",
        mask_prefix="pred_mask_image_"
    )
pred_mask_paths = get_predicted_mask_paths(image_paths)
print(f"\n‚úÖ {len(pred_mask_paths)} masques pr√©dits charg√©s")

if pred_mask_paths :
    display_images_with_masks(image_paths, pred_mask_paths, CLASS_MAPPING)
else:
    print("Aucun r√©sultat de segmentation √† afficher.")

## 8. Comparaison visuelle avec les annotations Ground Truth

Cette fonction affiche une comparaison c√¥te √† c√¥te entre les masques de segmentation pr√©dits par le mod√®le et les annotations ground truth. Cela permet d'√©valuer visuellement la qualit√© des pr√©dictions.

In [None]:
def display_comparison_with_ground_truth(image_paths, gt_mask_paths, pred_mask_paths):
    """
    Affiche une comparaison visuelle entre les pr√©dictions et les annotations ground truth.
    
    Disposition: Image Originale | Overlay Ground Truth | Overlay Pr√©diction
    
    Args:
        image_paths (list): Liste des chemins des images originales
        gt_mask_paths (list): Liste des chemins des masques ground truth
        pred_mask_paths (list): Liste des chemins des masques pr√©dits
    """
    for image_path, gt_mask_path, pred_mask_path in zip(image_paths, gt_mask_paths, pred_mask_paths):
    
        id_to_class = {v: k for k, v in CLASS_MAPPING.items()}
        color_map = plt.colormaps.get_cmap(COLORMAP_NAME).resampled(len(CLASS_MAPPING))
        num_classes = len(CLASS_MAPPING)

        # Charger l'image originale et l'annotation
        original_image = Image.open(image_path)
        gt_image = Image.open(gt_mask_path)
        pred_image = Image.open(pred_mask_path)

        gt_mask = np.array(gt_image)
        pred_mask = np.array(pred_image)
        # Cr√©er la figure avec 3 colonnes
        fig, axes = plt.subplots(1, 3, figsize=(18, 6))
        
        # Image originale
        axes[0].imshow(original_image)
        axes[0].set_title(f"Image : {image_path.name}")
        axes[0].axis("off")
        
        # Overlay avec Ground Truth
        axes[1].imshow(original_image)
        axes[1].imshow(gt_mask, cmap=color_map, alpha=0.5, vmin=0, vmax=len(CLASS_MAPPING)-1)
        axes[1].set_title("Overlay Ground Truth", fontsize=12, fontweight='bold')
        axes[1].axis("off")
        
        # Overlay avec Pr√©diction
        axes[2].imshow(original_image)
        axes[2].imshow(pred_mask, cmap=color_map, alpha=0.5, vmin=0, vmax=len(CLASS_MAPPING)-1)
        axes[2].set_title("Overlay Pr√©diction", fontsize=12, fontweight='bold')
        axes[2].axis("off")

        # Ajouter les l√©gendes
        legend_elements = get_legend_elements(pred_mask, id_to_class, color_map, num_classes)
        axes[1].legend(handles=legend_elements, **LEGEND_CONFIG)
        axes[2].legend(handles=legend_elements, **LEGEND_CONFIG)
        
        plt.tight_layout()
        plt.show()


# Afficher la comparaison pour les premi√®res images
if image_paths and gt_mask_paths and pred_mask_paths:
    print("=" * 80)
    print("COMPARAISON VISUELLE : GROUND TRUTH vs PR√âDICTIONS")
    print("=" * 80)
    print()
    display_comparison_with_ground_truth(
        image_paths, gt_mask_paths, pred_mask_paths
    )
else:
    print("Aucun r√©sultat de segmentation √† comparer.")