# ü§ñ Entra√Ænement RL Agent sur Google Colab

Ce notebook est **sp√©cifiquement pour entra√Æner l'agent RL** sur Colab avec GPU.
Le mod√®le entra√Æn√© sera t√©l√©charg√© pour utilisation locale.


## üì¶ √âtape 1 : Installation des d√©pendances


In [None]:
# Installation PyTorch avec CUDA 11.8 (pour GPU Colab)
%pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118 -q

# D√©pendances principales pour RL
%pip install diffusers transformers accelerate -q
%pip install stable-baselines3[extra] gymnasium -q
%pip install pillow numpy requests pydantic pydantic-settings -q

print("‚úÖ D√©pendances install√©es")


## üîß √âtape 2 : Cloner et configurer le projet


In [None]:
# Remplacer par l'URL de votre repository GitHub
REPO_URL = "https://github.com/votre-user/votre-repo.git"

import os

# Cloner le repo
if not os.path.exists("Projet_fil_rouge_ML_DL"):
    !git clone {REPO_URL}

%cd Projet_fil_rouge_ML_DL

# Configuration pour Colab (GPU) - Entra√Ænement RL
os.environ["SD_DEVICE"] = "cuda"
os.environ["SD_DTYPE"] = "float16"
os.environ["OUTPUT_DIR"] = "outputs"
os.environ["MODELS_DIR"] = "models"
os.environ["RL_AGENT_PATH"] = "models/rl_agent.zip"

print("‚úÖ Projet configur√© pour entra√Ænement RL")


## üîç √âtape 3 : V√©rifier le GPU


In [None]:
!nvidia-smi

import torch
print(f"‚úÖ PyTorch version: {torch.__version__}")
print(f"‚úÖ CUDA disponible: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"‚úÖ GPU: {torch.cuda.get_device_name(0)}")
    print(f"‚úÖ M√©moire GPU: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")
    print("\n‚ö†Ô∏è IMPORTANT: Assurez-vous d'avoir un GPU activ√© pour l'entra√Ænement RL")
else:
    print("\n‚ùå ERREUR: Aucun GPU d√©tect√©. Activez le GPU dans Runtime > Change runtime type")


## üöÄ √âtape 4 : Entra√Æner l'agent RL

**‚ö†Ô∏è IMPORTANT :**
- Entra√Ænement 10k steps : ~1-2 heures sur GPU
- Entra√Ænement 20k steps : ~2-4 heures sur GPU
- Le mod√®le sera sauvegard√© dans `models/rl_agent.zip`


In [None]:
# Configuration de l'entra√Ænement
TOTAL_TIMESTEPS = 10000  # Ajustez selon vos besoins (10000 recommand√© minimum)
SAVE_PATH = "models/rl_agent.zip"

print(f"üöÄ D√©marrage entra√Ænement RL agent...")
print(f"üìä Steps d'entra√Ænement: {TOTAL_TIMESTEPS}")
print(f"‚è±Ô∏è Temps estim√©: {TOTAL_TIMESTEPS // 5000:.1f}-{TOTAL_TIMESTEPS // 2500:.1f} heures")
print("\n" + "="*50 + "\n")

# Importer les modules
from app.models.rl_agent import RLOptimizer
from training.rl_env import PromptOptimizationEnv

# Cr√©er environnement et agent
env = PromptOptimizationEnv()
agent = RLOptimizer(env=env)

# Entra√Æner l'agent
agent.train(
    total_timesteps=TOTAL_TIMESTEPS,
    save_path=SAVE_PATH
)

print("\n" + "="*50)
print("‚úÖ Entra√Ænement termin√© !")
print(f"üì¶ Mod√®le sauvegard√©: {SAVE_PATH}")


## ‚úÖ √âtape 5 : V√©rifier le mod√®le entra√Æn√©


In [None]:
# V√©rifier que le mod√®le existe et a la bonne taille
import os
model_path = "models/rl_agent.zip"

if os.path.exists(model_path):
    size_mb = os.path.getsize(model_path) / (1024 * 1024)
    print(f"‚úÖ Mod√®le trouv√©: {model_path}")
    print(f"üì¶ Taille: {size_mb:.2f} MB")
    
    # Lister tous les fichiers du mod√®le
    import zipfile
    with zipfile.ZipFile(model_path, 'r') as zip_ref:
        files = zip_ref.namelist()
        print(f"üìÅ Fichiers dans le mod√®le: {len(files)}")
        for f in files[:5]:  # Afficher les 5 premiers
            print(f"   - {f}")
        if len(files) > 5:
            print(f"   ... et {len(files) - 5} autres fichiers")
else:
    print(f"‚ùå ERREUR: Mod√®le non trouv√© √† {model_path}")


## üíæ √âtape 6 : Sauvegarder dans Google Drive


In [None]:
# Monter Google Drive pour sauvegarder le mod√®le
from google.colab import drive
drive.mount('/content/drive')

# Cr√©er dossier de sauvegarde
DRIVE_MODELS_DIR = "/content/drive/MyDrive/ai-creative-studio/models"
os.makedirs(DRIVE_MODELS_DIR, exist_ok=True)

# Copier le mod√®le vers Drive
model_name = "rl_agent.zip"
drive_model_path = f"{DRIVE_MODELS_DIR}/{model_name}"

!cp models/rl_agent.zip {drive_model_path}

print(f"‚úÖ Mod√®le sauvegard√© dans Google Drive")
print(f"üì¶ Chemin: {drive_model_path}")
print(f"\nüí° Vous pourrez t√©l√©charger depuis Drive ou utiliser sur Colab")


## üì• √âtape 7 : T√©l√©charger le mod√®le localement

**Option 1 : T√©l√©chargement direct depuis Colab**


In [None]:
# T√©l√©charger le mod√®le directement depuis Colab
from google.colab import files

model_path = "models/rl_agent.zip"
if os.path.exists(model_path):
    print(f"üì• T√©l√©chargement de {model_path}...")
    files.download(model_path)
    print("‚úÖ T√©l√©chargement termin√© !")
    print("\nüí° Placez le fichier dans le dossier 'models/' de votre projet local")
else:
    print(f"‚ùå Mod√®le non trouv√©: {model_path}")


**Option 2 : T√©l√©charger depuis Google Drive**

1. Allez sur [Google Drive](https://drive.google.com)
2. Naviguez vers `ai-creative-studio/models/`
3. T√©l√©chargez `rl_agent.zip`
4. Placez-le dans `models/rl_agent.zip` de votre projet local


## üß™ √âtape 8 : Test rapide du mod√®le (optionnel)

Tester que le mod√®le fonctionne correctement avant t√©l√©chargement.


In [None]:
# Test rapide d'optimisation de prompt
test_prompt = "a cat"

print(f"üß™ Test d'optimisation pour: '{test_prompt}'...")

try:
    result = agent.optimize_prompt(
        base_prompt=test_prompt,
        n_iterations=5  # Test rapide avec 5 it√©rations
    )
    
    print("\nüìä R√©sultats:")
    print(f"  Prompt original: {result['original_prompt']}")
    print(f"  Prompt optimis√©: {result['optimized_prompt']}")
    print(f"  Score original: {result['original_score']:.2f}")
    print(f"  Score optimis√©: {result['optimized_score']:.2f}")
    print(f"  Am√©lioration: {result['improvement']:+.2f}")
    print(f"  Param√®tres: {result['best_params']}")
    print("\n‚úÖ Mod√®le fonctionne correctement !")
except Exception as e:
    print(f"‚ö†Ô∏è Erreur lors du test: {e}")
    print("üí° Le mod√®le peut quand m√™me fonctionner localement")
