# Techniques SSL avanc√©es - FixMatch, FlexMatch et MixMatch

Bienvenue dans le chapitre avanc√© de notre parcours en SSL ! Nous avons d√©j√† explor√© le pseudo‚Äëlabeling et la r√©gularisation par consistance. Passons maintenant √† des techniques de pointe : **FixMatch**, **FlexMatch** et **MixMatch**. Ces m√©thodes combinent le meilleur du pseudo‚Äëlabeling et de la consistance pour traiter des jeux de donn√©es avec peu d‚Äô√©tiquettes, comme `DermaMNIST`.

> Imaginez cela comme une mise √† niveau turbo de votre bo√Æte √† outils SSL !

**Principes cl√©s :**
- **FixMatch** : Utilise des augmentations faibles et fortes avec un seuil de confiance pour les pseudo‚Äëlabels.
- **FlexMatch** : Am√©liore FixMatch avec un seuillage dynamique par classe, id√©al pour les donn√©es d√©s√©quilibr√©es.
- **MixMatch** : Ajoute du m√©lange de donn√©es (ex. MixUp) pour am√©liorer la robustesse en combinant √©chantillons √©tiquet√©s et non √©tiquet√©s.

**Objectifs :**
1. Revenir √† la classification `DermaMNIST` avec 100 images √©tiquet√©es.
2. Impl√©menter FixMatch, FlexMatch et MixMatch.
3. Comparer les r√©sultats au baseline afin d‚Äôillustrer les avanc√©es SSL.

## 1. Pr√©paration (configuration habituelle)

Mettons en place l‚Äôenvironnement pour la classification `DermaMNIST`. Nous utiliserons 100 images √©tiquet√©es et Albumentations pour des augmentations contr√¥l√©es.

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader, Subset
from torchvision import transforms
import medmnist
from medmnist import INFO, Evaluator
from sklearn.model_selection import train_test_split
from tqdm import tqdm
import albumentations as A
from albumentations.pytorch import ToTensorV2
from sklearn.metrics import accuracy_score, f1_score, confusion_matrix, ConfusionMatrixDisplay, roc_auc_score

In [2]:
# Load DermaMNIST data
data_flag = 'dermamnist'
info = INFO[data_flag]
n_classes = len(info['label'])
DataClass = getattr(medmnist, info['python_class'])

train_dataset = DataClass(split='train', download=True)
test_dataset = DataClass(split='test', transform=transforms.Compose([transforms.ToTensor(), transforms.Normalize(mean=[.5], std=[.5])]), download=True)

# Split into labeled (100) and unlabeled sets
all_indices = list(range(len(train_dataset)))
labels_array = np.array(train_dataset.labels).flatten()
labeled_indices, unlabeled_indices = train_test_split(all_indices, train_size=500, random_state=42, stratify=labels_array)

print(f"Donn√©es √©tiquet√©es : {len(labeled_indices)}, Donn√©es non √©tiquet√©es : {len(unlabeled_indices)}")

Donn√©es √©tiquet√©es : 500, Donn√©es non √©tiquet√©es : 6507


### üß™ Augmentations faibles et fortes

Nous avons besoin de deux pipelines d‚Äôaugmentation : faible pour la g√©n√©ration de pseudo‚Äëlabels et forte pour accro√Ætre la robustesse √† l‚Äôentra√Ænement.

In [3]:

# Define weak and strong augmentations for single-channel images
weak_transform = A.Compose([
    A.HorizontalFlip(p=0.5),
    A.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5]),
    ToTensorV2(transpose_mask=True)  # Preserve 1 channel
])

strong_transform = A.Compose([
    A.HorizontalFlip(p=0.5),
    A.ShiftScaleRotate(scale_limit=0.1, rotate_limit=15, p=0.5),
    A.RandomBrightnessContrast(brightness_limit=0.2, contrast_limit=0.2, p=0.5),
    A.GaussianBlur(p=0.3),
    A.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5]),
    ToTensorV2(transpose_mask=True)  # Preserve 1 channel
])
print("Transformations initialis√©es")

# Custom datasets for FixMatch
class FixMatchDataset(torch.utils.data.Dataset):
    def __init__(self, dataset, indices, transform):
        self.dataset = Subset(dataset, indices)
        self.transform = transform

    def __len__(self):
        return len(self.dataset)

    def __getitem__(self, idx):
        img, label = self.dataset[idx]
        img = np.array(img)  # Ensure img is [H, W] (single-channel)
        transformed = self.transform(image=img)
        return transformed['image'], torch.tensor(label).long()

class FixMatchUnlabeledDataset(torch.utils.data.Dataset):
    def __init__(self, dataset, indices, weak_transform, strong_transform):
        self.dataset = Subset(dataset, indices)
        self.weak_transform = weak_transform
        self.strong_transform = strong_transform

    def __len__(self):
        return len(self.dataset)

    def __getitem__(self, idx):
        img, _ = self.dataset[idx]
        img = np.array(img)  # Ensure img is [H, W] (single-channel)
        weak = self.weak_transform(image=img)['image']
        strong = self.strong_transform(image=img)['image']
        return weak, strong

Transformations initialis√©es


  original_init(self, **validated_kwargs)


## 2. Mod√®les et boucles d‚Äôentra√Ænement

Nous utiliserons un CNN simple et impl√©menterons trois boucles d‚Äôentra√Ænement : FixMatch, FlexMatch et MixMatch.

In [4]:

# Define the SimpleCNN model for single-channel input
class SimpleCNN(nn.Module):
    def __init__(self, in_channels, num_classes):
        super(SimpleCNN, self).__init__()
        self.layer1 = nn.Sequential(
            nn.Conv2d(in_channels, 16, kernel_size=3, padding=1), nn.BatchNorm2d(16), nn.ReLU(), nn.MaxPool2d(2))
        self.layer2 = nn.Sequential(
            nn.Conv2d(16, 32, kernel_size=3, padding=1), nn.BatchNorm2d(32), nn.ReLU(), nn.MaxPool2d(2))
        self.fc = nn.Linear(7 * 7 * 32, num_classes)

    def forward(self, x):
        out = self.layer1(x)
        out = self.layer2(out)
        out = out.reshape(out.size(0), -1)
        return self.fc(out)

# Initialize model, optimizer, and loss functions
model = SimpleCNN(in_channels=3, num_classes=n_classes)
optimizer = torch.optim.Adam(model.parameters(), lr=0.002)

supervised_criterion = nn.CrossEntropyLoss()
unsupervised_criterion = nn.CrossEntropyLoss(reduction='none')

### ‚öôÔ∏è 2.1 Boucle d‚Äôentra√Ænement FixMatch

Impl√©mentons l‚Äôalgorithme FixMatch pas √† pas.

**Instructions :**
1. Calculer la perte supervis√©e sur les donn√©es √©tiquet√©es.
2. G√©n√©rer des pseudo‚Äëlabels : pr√©dire sur les augmentations faibles, calculer les probabilit√©s et cr√©er un masque pour les pr√©dictions confiantes (seuil = 0.95).
3. Calculer la perte non supervis√©e : pr√©dire sur les augmentations fortes et appliquer le masque aux pseudo‚Äëlabels confiants.
4. Combiner les pertes et faire la r√©tropropagation.

In [5]:
# Create DataLoaders
labeled_dataset = FixMatchDataset(train_dataset, labeled_indices, strong_transform)
unlabeled_dataset = FixMatchUnlabeledDataset(train_dataset, unlabeled_indices, weak_transform, strong_transform)
print(f"Jeux de donn√©es cr√©√©s : √©tiquet√©={len(labeled_dataset)}, non √©tiquet√©={len(unlabeled_dataset)}")

labeled_loader = DataLoader(labeled_dataset, batch_size=16, shuffle=True)
unlabeled_loader = DataLoader(unlabeled_dataset, batch_size=64, shuffle=True)
print(f"DataLoaders pr√™ts : lots √©tiquet√©s={len(labeled_loader)}, non √©tiquet√©s={len(unlabeled_loader)}")

print("D√©marrage de la boucle d‚Äôentra√Ænement")
# FixMatch training as a function (to unify with other methods)
def train_fixmatch(model, labeled_loader, unlabeled_loader, epochs=30, threshold=0.95, unsupervised_weight=1.0):
    optimizer = torch.optim.Adam(model.parameters(), lr=0.002)
    sup_crit = nn.CrossEntropyLoss()
    unsup_crit = nn.CrossEntropyLoss(reduction='none')
    for epoch in tqdm(range(epochs), desc='Entra√Ænement FixMatch'):
        model.train()
        batch_iterator = zip(labeled_loader, unlabeled_loader)
        for (labeled_imgs, labels), (weak_unlabeled, strong_unlabeled) in batch_iterator:
            optimizer.zero_grad()
            # Supervised loss
            logits_sup = model(labeled_imgs)
            loss_sup = sup_crit(logits_sup, labels.squeeze())
            # Pseudo-labels from weak
            with torch.no_grad():
                logits_weak = model(weak_unlabeled)
                probs = F.softmax(logits_weak, dim=1)
                max_probs, pseudo_labels = torch.max(probs, dim=1)
                mask = max_probs.ge(threshold).float()
            # Unsupervised on strong
            logits_strong = model(strong_unlabeled)
            loss_unsup_raw = unsup_crit(logits_strong, pseudo_labels)
            loss_unsup = (loss_unsup_raw * mask).mean()
            # Total
            total_loss = loss_sup + unsupervised_weight * loss_unsup
            total_loss.backward()
            optimizer.step()
    return model

Jeux de donn√©es cr√©√©s : √©tiquet√©=500, non √©tiquet√©=6507
DataLoaders pr√™ts : lots √©tiquet√©s=32, non √©tiquet√©s=102
D√©marrage de la boucle d‚Äôentra√Ænement


In [6]:
EPOCHS = 50
THRESHOLD = 0.95
UNSUPERVISED_WEIGHT = 1.0

print("D√©but de l‚Äôentra√Ænement FixMatch‚Ä¶")
fix_model = SimpleCNN(in_channels=3, num_classes=n_classes)
fix_model = train_fixmatch(fix_model, labeled_loader, unlabeled_loader, epochs=EPOCHS, threshold=THRESHOLD, unsupervised_weight=UNSUPERVISED_WEIGHT)


D√©but de l‚Äôentra√Ænement FixMatch‚Ä¶


Entra√Ænement FixMatch: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50/50 [01:47<00:00,  2.15s/it]


### ‚öôÔ∏è 2.2 Boucle d‚Äôentra√Ænement FlexMatch

FlexMatch adapte le seuil dynamiquement par classe pour g√©rer les jeux de donn√©es d√©s√©quilibr√©s.

**Instructions :**
1. Calculer la perte supervis√©e comme pr√©c√©demment.
2. G√©n√©rer des pseudo‚Äëlabels avec un seuil dynamique : utiliser la probabilit√© maximale moyenne par classe comme seuil.
3. Calculer la perte non supervis√©e avec le masque dynamique.
4. Combiner et r√©tropropager.

In [7]:
def train_flexmatch(model, labeled_loader, unlabeled_loader, epochs=20, threshold=0.95, unsupervised_weight=1.0):
    optimizer = torch.optim.Adam(model.parameters(), lr=0.002)
    sup_crit = nn.CrossEntropyLoss()
    unsup_crit = nn.CrossEntropyLoss(reduction='none')
    ema_conf = torch.full((n_classes,), 0.7)
    ema_m = 0.9
    for epoch in tqdm(range(epochs), desc='Entra√Ænement FlexMatch'):
        model.train()
        for (labeled_imgs, labels), (weak_unlabeled, strong_unlabeled) in zip(labeled_loader, unlabeled_loader):
            optimizer.zero_grad()
            # Supervised
            logits_sup = model(labeled_imgs)
            loss_sup = sup_crit(logits_sup, labels.squeeze())
            # Weak preds
            with torch.no_grad():
                logits_weak = model(weak_unlabeled)
                probs = F.softmax(logits_weak, dim=1)
                max_probs, pseudo_labels = torch.max(probs, dim=1)
                # Update class-wise EMA confidence using samples of each predicted class
                for k in range(n_classes):
                    mask_k = (pseudo_labels == k)
                    if mask_k.any():
                        conf_k = max_probs[mask_k].mean()
                        ema_conf[k] = ema_m * ema_conf[k] + (1 - ema_m) * conf_k
                # Class-wise dynamic thresholds
                max_ema = torch.clamp(ema_conf.max(), min=1e-6)
                tau_k = threshold * (max_ema / torch.clamp(ema_conf, min=1e-6))
                eff_thresh = tau_k[pseudo_labels]
                mask = max_probs.ge(eff_thresh).float()
            # Unsupervised loss on strong views
            logits_strong = model(strong_unlabeled)
            loss_unsup_raw = unsup_crit(logits_strong, pseudo_labels)
            loss_unsup = (loss_unsup_raw * mask).mean()
            # Total
            total_loss = loss_sup + unsupervised_weight * loss_unsup
            total_loss.backward()
            optimizer.step()
    return model

In [8]:
# Train and evaluate FlexMatch
print("D√©but de l‚Äôentra√Ænement FlexMatch‚Ä¶")
flex_model = SimpleCNN(in_channels=3, num_classes=n_classes)
flex_model = train_flexmatch(flex_model, labeled_loader, unlabeled_loader, epochs=EPOCHS, threshold=THRESHOLD, unsupervised_weight=UNSUPERVISED_WEIGHT)

D√©but de l‚Äôentra√Ænement FlexMatch‚Ä¶


Entra√Ænement FlexMatch: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50/50 [02:21<00:00,  2.82s/it]


### ‚öôÔ∏è 2.3 Boucle d‚Äôentra√Ænement MixMatch

MixMatch combine donn√©es √©tiquet√©es et non √©tiquet√©es via MixUp et un ¬´ sharpening ¬ª des probabilit√©s.

**Instructions :**
1. Calculer la perte supervis√©e sur les donn√©es √©tiquet√©es.
2. G√©n√©rer des pseudo‚Äëlabels avec sharpening (adoucir/affiner les probabilit√©s avec une temp√©rature).
3. M√©langer donn√©es √©tiquet√©es et non √©tiquet√©es avec MixUp.
4. Calculer la perte non supervis√©e sur les donn√©es m√©lang√©es.
5. Combiner et r√©tropropager.

In [9]:
def one_hot(labels, num_classes):
    y = torch.zeros(labels.size(0), num_classes, device=labels.device)
    return y.scatter_(1, labels.view(-1, 1).long(), 1)

def sharpen(p, T=0.5):
    p_power = p ** (1.0 / T)
    return p_power / p_power.sum(dim=1, keepdim=True)

def soft_cross_entropy(logits, soft_targets):
    log_probs = F.log_softmax(logits, dim=1)
    return -(soft_targets * log_probs).sum(dim=1)
    
def train_mixmatch(model, labeled_loader, unlabeled_loader, epochs=200, alpha=0.75, T=0.5, lambda_u=100.0):
    optimizer = torch.optim.Adam(model.parameters(), lr=0.002)
    for epoch in tqdm(range(epochs), desc='Entra√Ænement MixMatch'):
        model.train()
        for (labeled_imgs, labels), (u_imgs_w, _) in zip(labeled_loader, unlabeled_loader):
            b_l = labeled_imgs.size(0)
            b_u = u_imgs_w.size(0)
            # Guess labels for unlabeled
            with torch.no_grad():
                logits_u = model(u_imgs_w)
                probs_u = F.softmax(logits_u, dim=1)
                q_u = sharpen(probs_u, T)
            # One-hot for labeled
            y_l = one_hot(labels.squeeze(), n_classes)
            # Concatenate
            X = torch.cat([labeled_imgs, u_imgs_w], dim=0)
            Y = torch.cat([y_l, q_u], dim=0)
            # MixUp
            idx = torch.randperm(X.size(0))
            lam = np.random.beta(alpha, alpha)
            lam = max(lam, 1 - lam)
            X_mixed = lam * X + (1 - lam) * X[idx]
            Y_mixed = lam * Y + (1 - lam) * Y[idx]
            # Forward
            logits = model(X_mixed)
            # Losses
            loss_sup = soft_cross_entropy(logits[:b_l], Y_mixed[:b_l]).mean()
            probs_mixed = F.softmax(logits[b_l:], dim=1)
            loss_unsup = F.mse_loss(probs_mixed, Y_mixed[b_l:])
            loss = loss_sup + lambda_u * loss_unsup
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
    return model

In [10]:
# Train and evaluate MixMatch
print("D√©but de l‚Äôentra√Ænement MixMatch‚Ä¶")
mix_model = SimpleCNN(in_channels=3, num_classes=n_classes)
mix_model = train_mixmatch(mix_model, labeled_loader, unlabeled_loader, epochs=EPOCHS, alpha=0.75, T=0.5, lambda_u=50.0)


D√©but de l‚Äôentra√Ænement MixMatch‚Ä¶


Entra√Ænement MixMatch: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50/50 [02:20<00:00,  2.80s/it]


## 3. √âvaluation finale et r√©trospective

√âvaluons tous les mod√®les et comparons leurs performances.

In [11]:
@torch.no_grad()
def evaluate_model(model, test_dataset, data_flag):
    model.eval()
    y_true = torch.tensor([])
    y_score_logits = torch.tensor([])
    y_score_preds = torch.tensor([])
    test_loader = DataLoader(test_dataset, batch_size=128)
    for images, labels in test_loader:
        outputs = model(images)
        y_true = torch.cat((y_true, labels), 0)
        y_score_logits = torch.cat((y_score_logits, outputs), 0)
        preds = torch.argmax(outputs, dim=1)
        y_score_preds = torch.cat((y_score_preds, preds), 0)
    y_true_np = y_true.squeeze().cpu().numpy()
    y_score_logits_np = y_score_logits.detach().cpu().numpy()
    y_score_preds_np = y_score_preds.detach().cpu().numpy()
    evaluator = Evaluator(data_flag, 'test')
    metrics = evaluator.evaluate(y_score_logits_np)
    f1_macro = f1_score(y_true_np, y_score_preds_np, average='macro')
    f1_weighted = f1_score(y_true_np, y_score_preds_np, average='weighted')
    return metrics[0], metrics[1], f1_macro, f1_weighted

In [12]:
# Consolidated Evaluation
print("D√©but de l‚Äô√©valuation consolid√©e pour FixMatch, FlexMatch et MixMatch‚Ä¶")
results = []
for name, mdl in [("FixMatch", fix_model), ("FlexMatch", flex_model), ("MixMatch", mix_model)]:
    auc, acc, f1_macro, f1_weighted = evaluate_model(mdl, test_dataset, data_flag)
    results.append((name, auc, acc, f1_macro, f1_weighted))
    print(f"--- R√©sultats {name} ---")
    print(f"AUC : {auc:.3f}, Accuracy : {acc:.3f}, F1 (macro) : {f1_macro:.3f}, F1 (pond√©r√©) : {f1_weighted:.3f}")

D√©but de l‚Äô√©valuation consolid√©e pour FixMatch, FlexMatch et MixMatch‚Ä¶
--- R√©sultats FixMatch ---
AUC : 0.816, Accuracy : 0.685, F1 (macro) : 0.301, F1 (pond√©r√©) : 0.635
--- R√©sultats FlexMatch ---
AUC : 0.821, Accuracy : 0.694, F1 (macro) : 0.332, F1 (pond√©r√©) : 0.659
--- R√©sultats MixMatch ---
AUC : 0.804, Accuracy : 0.672, F1 (macro) : 0.162, F1 (pond√©r√©) : 0.542


## 9. Bilan chiffr√© et cap pour la suite

Voici un r√©capitulatif des r√©sultats obtenus dans ce notebook‚ÄØ:

- **Supervis√© (350 images √©tiquet√©es, mod√®le de base)**  
  AUC ‚âà `0.824` | Accuracy ‚âà `0.489` | F1 macro ‚âà `0.234`

- **Pseudo‚ÄëLabeling (it√©ratif, simple)**  
  Iter 1 ‚Üí AUC ‚âà `0.805`, Acc ‚âà `0.547`, F1 ‚âà `0.290`  
  Iter 2 ‚Üí AUC ‚âà `0.845`, Acc ‚âà `0.586`, F1 ‚âà `0.308`  
  Iter 3 ‚Üí AUC ‚âà `0.852`, Acc ‚âà `0.585`, F1 ‚âà `0.295`  
  Iter 4 ‚Üí AUC ‚âà `0.846`, Acc ‚âà `0.598`, F1 ‚âà `0.289`  
  Iter 5 ‚Üí AUC ‚âà `0.844`, Acc ‚âà `0.605`, F1 ‚âà `0.301`

- **Label Propagation (graphe sur embeddings du SimpleCNN)**  
  AUC ‚âà `0.505` | Accuracy ‚âà `0.367` | F1 macro ‚âà `0.355`

- **SGAN (Semi‚ÄëSupervised GAN)**  
  AUC ‚âà `0.832` | Accuracy ‚âà `0.482` | F1 macro ‚âà `0.297`

- **FixMatch / FlexMatch / MixMatch**  
  FixMatch ‚Üí AUC ‚âà `0.825`, Acc ‚âà `0.675`, F1 (macro) ‚âà `0.360`, F1 (weighted) ‚âà `0.663`  
  FlexMatch ‚Üí AUC ‚âà `0.824`, Acc ‚âà `0.678`, F1 (macro) ‚âà `0.318`, F1 (weighted) ‚âà `0.636`  
  MixMatch ‚Üí AUC ‚âà `0.793`, Acc ‚âà `0.671`, F1 (macro) ‚âà `0.149`, F1 (weighted) ‚âà `0.540`

> Note‚ÄØ: Mean Teacher a √©t√© utilis√© pour de la segmentation dans un autre contexte, donc non compar√© ici.

### Que retenir ici ?
- Dans ce contexte, la solution la plus simple ‚Äî le **pseudo‚Äëlabeling** ‚Äî fonctionne bien et offre d√©j√† un gain net sur le supervis√© seul.
- Les m√©thodes plus avanc√©es (Fix/Flex/MixMatch, SGAN) montrent des **hausses d‚Äôaccuracy** notables (‚âà `0.67`), mais le **F1 macro** peut fluctuer selon la m√©thode et la sensibilit√© au d√©s√©quilibre des classes.
- La question cl√© reste le **rapport complexit√©/b√©n√©fice**‚ÄØ: la mise en place, le tuning et le temps de calcul suppl√©mentaires valent‚Äëils le gain obtenu dans votre cas d‚Äôusage ?

### Si vous voulez pousser un cran plus loin
- Tenter des **embeddings plus expressifs** (ex. `ResNet` pr√©‚Äëentra√Æn√©) et r√©‚Äë√©valuer la propagation.
- Standardiser les embeddings et ajuster le graphe (`kernel`, `gamma`, `n_neighbors`).
- Tester une **strat√©gie hybride**‚ÄØ: pseudo‚Äëlabels de haute confiance comme seeds du graphe, ou pr√©‚Äëfiltrage pour Fix/Flex/MixMatch.

Si votre priorit√© est un bon compromis efficacit√©/temps, rester sur le **pseudo‚Äëlabeling simple** est un choix solide. Si vous visez le dernier pourcent, les m√©thodes avanc√©es peuvent valoir l‚Äôexploration ‚Äî en gardant un ≈ìil sur la complexit√© et la stabilit√© des m√©triques (dont le F1 macro).