# Notebook: Stable Diffusion Forge - SD XL Turbo

## Objectif

Ce notebook p√©dagogique vous apprend √† utiliser l'**API Stable Diffusion Forge** avec le mod√®le **SD XL Turbo** pour g√©n√©rer des images √† partir de descriptions textuelles (prompts).

## Contexte

- **API**: Stable Diffusion Forge (WebUI Automatic1111)
- **Mod√®le**: SD XL Turbo (optimis√© pour vitesse)
- **URL Base**: `https://turbo.stable-diffusion-webui-forge.myia.io`
- **Performance**: ~18s pour g√©n√©ration 512√ó512 (4 steps)

## Use Cases

- Prototypage rapide de concepts visuels
- It√©ration cr√©ative sur variations de prompts
- Exploration de styles artistiques
- Tests de faisabilit√© avant g√©n√©ration haute qualit√©

## Pr√©-requis

- Packages Python: `requests`, `Pillow`, `matplotlib`, `python-dotenv`
- Acc√®s r√©seau √† l'API Forge

In [None]:
"""
Configuration initiale: imports et param√®tres API
"""

# Imports standard
import requests
import json
import base64
from io import BytesIO
from typing import Optional, Dict, Any
import warnings

# Imports visualisation
from PIL import Image
import matplotlib.pyplot as plt

# Configuration API Forge
API_BASE_URL = "https://turbo.stable-diffusion-webui-forge.myia.io"
TIMEOUT = 60  # Timeout pour les requ√™tes HTTP (secondes)

# Suppression warnings non critiques
warnings.filterwarnings('ignore')

print("‚úÖ Configuration initiale charg√©e")
print(f"üì° API Forge: {API_BASE_URL}")

## 1. Comprendre l'API Stable Diffusion Forge

### Architecture

L'API Forge expose une interface RESTful pour interagir avec Stable Diffusion:

- **Endpoint principal**: `/sdapi/v1/txt2img` (g√©n√©ration texte‚Üíimage)
- **M√©thode HTTP**: POST
- **Format**: JSON (requ√™te et r√©ponse)
- **Authentification**: Non requise (API interne)

### Param√®tres Critiques SD XL Turbo

Le mod√®le **SD XL Turbo** est optimis√© pour la **vitesse**:

| Param√®tre | Valeur Optimale | Explication |
|-----------|----------------|-------------|
| `steps` | **4** | Nombre d'it√©rations de d√©bruitage (vs 20-50 pour mod√®les standard) |
| `cfg_scale` | **2.0** | Force de guidage du prompt (vs 7.0 typiquement) |
| `sampler_name` | `DPM++ 2M` | √âchantillonneur rapide compatible Turbo |
| `width` √ó `height` | **512√ó512** | R√©solution par d√©faut pour performances optimales |

### Flux de Travail Typique

1. **Construire payload JSON** avec prompt + param√®tres
2. **Envoyer requ√™te POST** √† l'endpoint `/sdapi/v1/txt2img`
3. **Recevoir r√©ponse JSON** contenant image(s) encod√©e(s) en base64
4. **D√©coder + afficher** image avec Pillow/Matplotlib

In [None]:
"""
Fonction helper pour g√©n√©rer des images via API Forge
"""

def generate_image_forge(
    prompt: str,
    negative_prompt: str = "",
    steps: int = 4,
    cfg_scale: float = 2.0,
    width: int = 512,
    height: int = 512,
    sampler_name: str = "DPM++ 2M",
    save_path: Optional[str] = None
) -> Optional[Image.Image]:
    """
    G√©n√®re une image via l'API Stable Diffusion Forge (SD XL Turbo).
    
    Args:
        prompt: Description textuelle de l'image d√©sir√©e
        negative_prompt: √âl√©ments √† √©viter dans l'image
        steps: Nombre d'it√©rations (4 recommand√© pour Turbo)
        cfg_scale: Force de guidage du prompt (2.0 recommand√© pour Turbo)
        width: Largeur de l'image en pixels
        height: Hauteur de l'image en pixels
        sampler_name: Algorithme d'√©chantillonnage
        save_path: Chemin optionnel pour sauvegarder l'image
    
    Returns:
        Image PIL si succ√®s, None si erreur
    """
    # Construction payload API
    payload = {
        "prompt": prompt,
        "negative_prompt": negative_prompt,
        "steps": steps,
        "cfg_scale": cfg_scale,
        "width": width,
        "height": height,
        "sampler_name": sampler_name
    }
    
    try:
        # Requ√™te POST vers endpoint txt2img
        print(f"üé® G√©n√©ration en cours: '{prompt[:50]}...'")
        response = requests.post(
            f"{API_BASE_URL}/sdapi/v1/txt2img",
            json=payload,
            timeout=TIMEOUT
        )
        response.raise_for_status()
        
        # Extraction de l'image depuis JSON
        result = response.json()
        if "images" not in result or len(result["images"]) == 0:
            print("‚ùå Erreur: Aucune image g√©n√©r√©e")
            return None
        
        # D√©codage base64 ‚Üí PIL Image
        image_data = base64.b64decode(result["images"][0])
        image = Image.open(BytesIO(image_data))
        
        # Sauvegarde optionnelle
        if save_path:
            image.save(save_path)
            print(f"üíæ Image sauvegard√©e: {save_path}")
        
        print(f"‚úÖ Image g√©n√©r√©e ({width}√ó{height})")
        return image
        
    except requests.exceptions.Timeout:
        print(f"‚è±Ô∏è Timeout apr√®s {TIMEOUT}s")
        return None
    except requests.exceptions.RequestException as e:
        print(f"‚ùå Erreur requ√™te: {e}")
        return None
    except Exception as e:
        print(f"‚ùå Erreur inattendue: {e}")
        return None

print("‚úÖ Fonction generate_image_forge() d√©finie")

## 2. Exemple Simple: Premi√®re G√©n√©ration

Testons la fonction avec un prompt simple pour g√©n√©rer un paysage de montagne au coucher du soleil.

**Note**: La g√©n√©ration prend environ **18 secondes** avec les param√®tres Turbo optimaux (4 steps).

In [None]:
# G√©n√©ration d'un paysage de montagne au coucher du soleil
image_simple = generate_image_forge(
    prompt="A serene mountain landscape at sunset, golden hour lighting, photorealistic",
    negative_prompt="blurry, low quality, distorted",
    steps=4,
    cfg_scale=2.0,
    width=512,
    height=512
)

# Affichage du r√©sultat
if image_simple:
    plt.figure(figsize=(8, 8))
    plt.imshow(image_simple)
    plt.axis('off')
    plt.title("Paysage de Montagne au Coucher du Soleil", fontsize=14, pad=10)
    plt.tight_layout()
    plt.show()
else:
    print("‚ö†Ô∏è La g√©n√©ration a √©chou√©. V√©rifiez la connexion √† l'API.")

## 3. Optimisation des Param√®tres SD XL Turbo

### Pourquoi `steps=4` ?

SD XL Turbo utilise une **distillation de mod√®le** qui r√©duit le nombre d'√©tapes n√©cessaires :

- **Mod√®les standard** : 20-50 steps pour qualit√© optimale
- **SD XL Turbo** : **4 steps** suffisent gr√¢ce √† l'entra√Ænement sp√©cialis√©

### Pourquoi `cfg_scale=2.0` ?

Le **Classifier-Free Guidance (CFG)** contr√¥le l'adh√©rence au prompt :

| Valeur | Effet | Usage |
|--------|-------|-------|
| 1.0 | Cr√©ativit√© maximale, prompt ignor√© | Exploration al√©atoire |
| **2.0** | **√âquilibre Turbo optimal** | **G√©n√©ration rapide coh√©rente** |
| 7.0 | Adh√©rence stricte (standard) | Mod√®les non-Turbo |
| 15.0+ | Sur-saturation, artefacts | √Ä √©viter |

### Samplers Compatibles

Samplers recommand√©s pour SD XL Turbo :

- **DPM++ 2M** (par d√©faut) : Rapide et stable
- **Euler a** : Variations cr√©atives
- **LMS** : Qualit√© l√©g√®rement sup√©rieure

‚ö†Ô∏è **√âviter** : DDIM, PLMS (trop lents pour Turbo)

In [None]:
# Test des param√®tres optimaux Turbo
print("üß™ Test comparatif: Impact du nombre de steps\n")

prompt_test = "A futuristic city at night, neon lights, cyberpunk style"

# Test avec 4 steps (optimal Turbo)
print("1Ô∏è‚É£ G√©n√©ration avec 4 steps (Turbo optimal)...")
image_turbo = generate_image_forge(
    prompt=prompt_test,
    steps=4,
    cfg_scale=2.0
)

# Note: Pour comparer avec 20 steps (standard), d√©commentez ci-dessous
# print("\n2Ô∏è‚É£ G√©n√©ration avec 20 steps (standard)...")
# image_standard = generate_image_forge(
#     prompt=prompt_test,
#     steps=20,
#     cfg_scale=7.0
# )

if image_turbo:
    plt.figure(figsize=(8, 8))
    plt.imshow(image_turbo)
    plt.axis('off')
    plt.title("Ville Futuriste (4 steps, cfg=2.0)", fontsize=14)
    plt.tight_layout()
    plt.show()
    
print("\n‚úÖ R√©sultat: 4 steps suffisent pour qualit√© acceptable en ~18s")

## 4. Cas d'Usage Avanc√©: Comparaison de Prompts

Explorons comment de **l√©g√®res variations de prompt** influencent le r√©sultat final.

### Technique: Grid Comparison

G√©n√©ration de plusieurs images avec prompts l√©g√®rement diff√©rents pour identifier les formulations les plus efficaces.

In [None]:
# D√©finition de 3 variations de prompt
prompts_comparison = [
    "A futuristic city at night",
    "A futuristic city at night, neon lights, rainy streets",
    "A futuristic city at night, cyberpunk style, flying cars, neon signs"
]

print("üé® G√©n√©ration de 3 variations de prompt...\n")

# G√©n√©ration des images
images_grid = []
for i, prompt in enumerate(prompts_comparison, 1):
    print(f"{i}. \"{prompt}\"")
    img = generate_image_forge(
        prompt=prompt,
        negative_prompt="blurry, low quality",
        steps=4,
        cfg_scale=2.0
    )
    if img:
        images_grid.append(img)
    print()

# Affichage en grille
if len(images_grid) == 3:
    fig, axes = plt.subplots(1, 3, figsize=(18, 6))
    
    for idx, (ax, img, prompt) in enumerate(zip(axes, images_grid, prompts_comparison)):
        ax.imshow(img)
        ax.axis('off')
        # Titre tronqu√© pour affichage
        short_title = prompt if len(prompt) <= 40 else prompt[:37] + "..."
        ax.set_title(f"Variation {idx+1}\n{short_title}", fontsize=10)
    
    plt.suptitle("Comparaison: Impact des Variations de Prompt", fontsize=14, y=1.02)
    plt.tight_layout()
    plt.show()
    
    print("\nüìä Analyse:")
    print("- Prompt simple ‚Üí Interpr√©tation g√©n√©rique")
    print("- Prompt + d√©tails ‚Üí Contr√¥le accru sur atmosph√®re")
    print("- Prompt + style ‚Üí Coh√©rence artistique maximale")
else:
    print("‚ö†Ô∏è Certaines g√©n√©rations ont √©chou√©")

## 5. Bonnes Pratiques et Recommandations

### ‚úÖ √Ä Faire

1. **Prompts descriptifs**: Inclure style, √©clairage, qualit√©
   ```
   "A serene lake, sunset lighting, photorealistic, 8k quality"
   ```

2. **Negative prompts efficaces**: Sp√©cifier d√©fauts courants
   ```
   "blurry, low quality, distorted, watermark, signature"
   ```

3. **Param√®tres Turbo**: Toujours utiliser `steps=4` et `cfg_scale=2.0`

4. **R√©solution optimale**: 512√ó512 pour vitesse maximale

5. **Gestion erreurs**: V√©rifier `image is not None` avant utilisation

### ‚ùå √Ä √âviter

1. **Steps √©lev√©s**: > 4 steps annule l'avantage Turbo
2. **CFG √©lev√©**: `cfg_scale > 3.0` produit artefacts avec Turbo
3. **R√©solutions extr√™mes**: < 256√ó256 ou > 768√ó768 (d√©gradation qualit√©)
4. **Prompts vagues**: "une image" ‚Üí r√©sultats impr√©visibles
5. **Timeouts courts**: G√©n√©ration prend ~18s, timeout < 30s risqu√©

### üéØ Cas d'Usage Recommand√©s

| Sc√©nario | SD XL Turbo | Autres Mod√®les |
|----------|-------------|----------------|
| Prototypage rapide | ‚úÖ Id√©al | ‚ùå Trop lent |
| It√©ration cr√©ative | ‚úÖ Excellent | ‚ö†Ô∏è Acceptable |
| Production finale | ‚ö†Ô∏è Acceptable | ‚úÖ Pr√©f√©rable |
| Haute r√©solution (>1024px) | ‚ùå Non adapt√© | ‚úÖ Recommand√© |

In [None]:
"""
Exemple 4: Version am√©lior√©e avec logging color√©
(Inspir√© du pattern LocalLlama)
"""

from enum import Enum

class LogColor(Enum):
    """Codes ANSI pour logging color√© dans notebooks"""
    RESET = '\033[0m'
    INFO = '\033[94m'      # Bleu
    SUCCESS = '\033[92m'   # Vert
    WARNING = '\033[93m'   # Jaune
    ERROR = '\033[91m'     # Rouge
    HEADER = '\033[95m'    # Magenta

def log_colored(message: str, color: LogColor = LogColor.INFO):
    """Affiche message color√©"""
    print(f"{color.value}{message}{LogColor.RESET.value}")

def generate_image_forge_v2(
    prompt: str,
    verbose: bool = True,
    **kwargs
) -> Optional[Image.Image]:
    """
    Version am√©lior√©e avec logging d√©taill√©
    """
    if verbose:
        log_colored(f"üé® Prompt: '{prompt}'", LogColor.HEADER)
        log_colored(f"‚öôÔ∏è  Param√®tres: steps={kwargs.get('steps', 4)}, "
                   f"size={kwargs.get('width', 512)}√ó{kwargs.get('height', 512)}",
                   LogColor.INFO)
    
    # G√©n√©ration
    image = generate_image_forge(prompt=prompt, **kwargs)
    
    # Logging r√©sultat
    if image:
        if verbose:
            log_colored(f"‚úÖ G√©n√©ration r√©ussie: {image.size[0]}√ó{image.size[1]}", 
                       LogColor.SUCCESS)
        return image
    else:
        if verbose:
            log_colored("‚ùå √âchec g√©n√©ration", LogColor.ERROR)
        return None

# Test
print("Test fonction avec logging color√©:")
print("-" * 50)
img_test = generate_image_forge_v2(
    prompt="A cozy cabin in snowy mountains",
    steps=4,
    width=512,
    height=512,
    verbose=True
)

if img_test:
    plt.figure(figsize=(6, 6))
    plt.imshow(img_test)
    plt.axis('off')
    plt.title("Test Logging Color√©", fontsize=11)
    plt.show()

## 6. Exercice Pratique

### Objectif

Cr√©ez votre propre g√©n√©ration d'image en appliquant les techniques apprises.

### Instructions

1. **Choisissez un sujet**: Paysage, portrait, objet, sc√®ne abstraite, etc.
2. **R√©digez un prompt descriptif**: Incluez style, √©clairage, qualit√©
3. **D√©finissez un negative prompt**: Sp√©cifiez les d√©fauts √† √©viter
4. **Utilisez les param√®tres Turbo optimaux**: `steps=4`, `cfg_scale=2.0`
5. **G√©n√©rez et affichez l'image**

### Template de Code

Compl√©tez le code ci-dessous avec vos propres param√®tres :

In [None]:
# üéØ EXERCICE PRATIQUE: Compl√©tez ce code avec vos propres param√®tres

# TODO: D√©finissez votre prompt personnalis√©
mon_prompt = "Votre description ici"  # Ex: "A majestic dragon flying over a medieval castle"

# TODO: D√©finissez votre negative prompt
mon_negative_prompt = ""  # Ex: "blurry, low quality, distorted"

# G√©n√©ration de votre image
mon_image = generate_image_forge(
    prompt=mon_prompt,
    negative_prompt=mon_negative_prompt,
    steps=4,          # Param√®tre Turbo optimal
    cfg_scale=2.0,    # Param√®tre Turbo optimal
    width=512,
    height=512
)

# Affichage du r√©sultat
if mon_image:
    plt.figure(figsize=(8, 8))
    plt.imshow(mon_image)
    plt.axis('off')
    plt.title(f"Ma Cr√©ation\n{mon_prompt[:60]}...", fontsize=12)
    plt.tight_layout()
    plt.show()
    
    print("\n‚úÖ F√©licitations! Votre image a √©t√© g√©n√©r√©e avec succ√®s.")
    print(f"üìù Prompt utilis√©: {mon_prompt}")
else:
    print("‚ùå La g√©n√©ration a √©chou√©. V√©rifiez vos param√®tres et la connexion √† l'API.")

## 7. Ressources et Documentation

### Documentation Compl√®te

Pour approfondir vos connaissances sur l'API Forge et SD XL Turbo, consultez :

- **Guide √âtudiants API Forge**: [`docs/suivis/genai-image/GUIDE-APIS-ETUDIANTS.md`](../../../docs/suivis/genai-image/GUIDE-APIS-ETUDIANTS.md)
- **Documentation Stable Diffusion**: [Stability AI Documentation](https://platform.stability.ai/docs)
- **API Forge WebUI**: [Automatic1111 API Wiki](https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/API)

### Endpoints API Disponibles

| Endpoint | Description | M√©thode |
|----------|-------------|--------|
| `/sdapi/v1/txt2img` | G√©n√©ration texte‚Üíimage | POST |
| `/sdapi/v1/img2img` | Transformation d'image | POST |
| `/sdapi/v1/options` | Configuration API | GET/POST |
| `/sdapi/v1/sd-models` | Liste mod√®les disponibles | GET |

### Param√®tres Avanc√©s (Optionnels)

Explorez ces param√®tres suppl√©mentaires pour contr√¥le accru :

```python
{
    "seed": -1,              # -1 = al√©atoire, valeur fixe = reproductible
    "batch_size": 1,        # Nombre d'images g√©n√©r√©es simultan√©ment
    "restore_faces": false, # Am√©lioration automatique des visages
    "tiling": false,        # Image r√©p√©table (textures)
    "enable_hr": false      # Hires.fix (haute r√©solution)
}
```

### Support et Contact

Pour toute question ou probl√®me technique :

- **API Status**: V√©rifiez l'accessibilit√© √† `https://turbo.stable-diffusion-webui-forge.myia.io`
- **Documentation Projet**: Consultez le README principal du projet CoursIA
- **Issues GitHub**: Signalez bugs/am√©liorations sur le d√©p√¥t du projet