# üéØ G√©n√©ration de Formulaires avec Llama 3.2 3B

Ce notebook permet de charger votre mod√®le Llama 3.2 3B entra√Æn√© et de g√©n√©rer des structures de formulaires JSON.

**Configuration:**
- Runtime: Python 3
- Hardware accelerator: GPU (optionnel mais recommand√©)

**Pr√©requis:**
- Avoir entra√Æn√© le mod√®le avec `train_colab.ipynb`
- Le mod√®le doit √™tre disponible sur Google Drive

## üìã √âtape 1: Installation des d√©pendances

In [None]:
# Installation des biblioth√®ques
!pip install -q -U transformers accelerate peft sentencepiece

print("‚úÖ Installation termin√©e!")

In [None]:
# V√©rifier le mat√©riel disponible
import torch

print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"GPU: {torch.cuda.get_device_name(0)}")
    print(f"Memory: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")
else:
    print("CPU mode - La g√©n√©ration sera plus lente")

## üíæ √âtape 2: Monter Google Drive

Pour acc√©der au mod√®le sauvegard√©.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

# V√©rifier que le mod√®le existe
import os

model_path = "/content/drive/MyDrive/llama3-form-generator"

if os.path.exists(model_path):
    print(f"‚úÖ Mod√®le trouv√©: {model_path}")
    # Lister les fichiers
    files = os.listdir(model_path)
    print(f"\nFichiers: {', '.join(files[:5])}...")
else:
    print(f"‚ùå Mod√®le non trouv√© √†: {model_path}")
    print("\nAssurez-vous d'avoir:")
    print("1. Entra√Æn√© le mod√®le avec train_colab.ipynb")
    print("2. Sauvegard√© le mod√®le sur Google Drive")

## üîÑ √âtape 3: Charger le mod√®le

Chargement du mod√®le entra√Æn√©.

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Chemin du mod√®le
model_path = "/content/drive/MyDrive/llama3-form-generator"

print("üì• Chargement du tokenizer...")
tokenizer = AutoTokenizer.from_pretrained(
    model_path,
    trust_remote_code=True
)

if tokenizer.pad_token is None:
    tokenizer.pad_token = tokenizer.eos_token
    tokenizer.pad_token_id = tokenizer.eos_token_id

print("üì• Chargement du mod√®le...")
device = "cuda" if torch.cuda.is_available() else "cpu"

model = AutoModelForCausalLM.from_pretrained(
    model_path,
    torch_dtype=torch.float16 if device == "cuda" else torch.float32,
    device_map="auto",
    low_cpu_mem_usage=True,
    trust_remote_code=True
)

model.eval()

print(f"\n‚úÖ Mod√®le charg√© sur {device}!")

## üõ†Ô∏è √âtape 4: D√©finir la fonction de g√©n√©ration

In [None]:
import json

def generate_form(description, max_new_tokens=1024, temperature=0.7, top_p=0.9, verbose=True):
    """
    G√©n√®re une structure de formulaire √† partir d'une description.

    Args:
        description: Description du formulaire
        max_new_tokens: Nombre maximum de tokens √† g√©n√©rer
        temperature: Temp√©rature (0.0-1.0)
        top_p: Top-p sampling
        verbose: Afficher les d√©tails

    Returns:
        dict: Structure de formulaire JSON
    """
    if verbose:
        print(f"üìù Description: {description}\n")

    # Format de prompt pour Llama 3.2 Instruct
    prompt = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Tu es un assistant sp√©cialis√© dans la g√©n√©ration de structures de formulaires JSON.<|eot_id|><|start_header_id|>user<|end_header_id|>

{description}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

"""

    inputs = tokenizer(prompt, return_tensors="pt").to(device)

    if verbose:
        print("üîÑ G√©n√©ration en cours...")

    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=max_new_tokens,
            temperature=temperature,
            top_p=top_p,
            do_sample=True,
            pad_token_id=tokenizer.pad_token_id,
            eos_token_id=tokenizer.eos_token_id
        )

    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Extraire la r√©ponse
    if "assistant" in generated_text:
        response = generated_text.split("assistant")[1].strip()
    else:
        response = generated_text.strip()

    response = response.replace("<|eot_id|>", "").strip()

    # Parser le JSON
    try:
        form_structure = json.loads(response)
        if verbose:
            print("‚úÖ G√©n√©ration r√©ussie!\n")
        return form_structure
    except json.JSONDecodeError as e:
        if verbose:
            print(f"‚ö†Ô∏è Erreur de parsing JSON: {e}")
            print(f"R√©ponse brute: {response[:200]}...\n")
        return {"raw_output": response, "error": str(e)}

print("‚úÖ Fonction de g√©n√©ration d√©finie!")

## üé® √âtape 5: Exemples de g√©n√©ration

In [None]:
# Exemple 1: Formulaire d'inscription
print("=" * 60)
print("EXEMPLE 1: Formulaire d'inscription")
print("=" * 60)

form1 = generate_form(
    "Cr√©e un formulaire d'inscription avec nom, pr√©nom, email, t√©l√©phone et adresse"
)

print("üìã R√©sultat:")
print(json.dumps(form1, indent=2, ensure_ascii=False))

In [None]:
# Exemple 2: Formulaire de contact
print("=" * 60)
print("EXEMPLE 2: Formulaire de contact")
print("=" * 60)

form2 = generate_form(
    "Cr√©e un formulaire de contact avec nom, email, sujet et message"
)

print("üìã R√©sultat:")
print(json.dumps(form2, indent=2, ensure_ascii=False))

In [None]:
# Exemple 3: Formulaire de commande
print("=" * 60)
print("EXEMPLE 3: Formulaire de commande")
print("=" * 60)

form3 = generate_form(
    "Cr√©e un formulaire de commande avec produit, quantit√©, prix et adresse de livraison"
)

print("üìã R√©sultat:")
print(json.dumps(form3, indent=2, ensure_ascii=False))

## ‚úèÔ∏è √âtape 6: G√©n√©ration personnalis√©e

Modifiez la description ci-dessous pour g√©n√©rer votre propre formulaire.

In [None]:
# üéØ Personnalisez votre description ici
custom_description = "Cr√©e un formulaire d'inscription √† un √©v√©nement avec nom, pr√©nom, email, entreprise et commentaires"

print("=" * 60)
print("G√âN√âRATION PERSONNALIS√âE")
print("=" * 60)

custom_form = generate_form(
    custom_description,
    temperature=0.7,  # Ajustez la cr√©ativit√© (0.0-1.0)
    top_p=0.9,        # Ajustez la diversit√© (0.0-1.0)
)

print("üìã R√©sultat:")
print(json.dumps(custom_form, indent=2, ensure_ascii=False))

## üì¶ √âtape 7: G√©n√©ration en batch

G√©n√©rez plusieurs formulaires d'un coup.

In [None]:
# Liste de descriptions
descriptions = [
    "Cr√©e un formulaire de feedback avec note de 1 √† 5 et commentaire",
    "Cr√©e un formulaire de candidature avec nom, CV et lettre de motivation",
    "Cr√©e un formulaire de r√©servation avec date, heure et nombre de personnes",
]

print("=" * 60)
print("G√âN√âRATION EN BATCH")
print("=" * 60)

batch_forms = []
for i, desc in enumerate(descriptions, 1):
    print(f"\nüìù Formulaire {i}/{len(descriptions)}")
    form = generate_form(desc, verbose=False)
    batch_forms.append(form)
    print(f"‚úÖ G√©n√©r√©!")

print("\n" + "=" * 60)
print("R√âSULTATS")
print("=" * 60)

for i, form in enumerate(batch_forms, 1):
    print(f"\nüìã Formulaire {i}:")
    print(json.dumps(form, indent=2, ensure_ascii=False))
    print()

## üíæ √âtape 8: Exporter les r√©sultats

Sauvegardez vos formulaires g√©n√©r√©s.

In [None]:
# Sauvegarder dans un fichier JSON
output_file = "generated_forms.json"

with open(output_file, 'w', encoding='utf-8') as f:
    json.dump(batch_forms, f, indent=2, ensure_ascii=False)

print(f"‚úÖ R√©sultats sauvegard√©s dans: {output_file}")

# T√©l√©charger le fichier
from google.colab import files
files.download(output_file)

print("üì• T√©l√©chargement lanc√©!")

In [None]:
# Sauvegarder sur Google Drive
import shutil

drive_output = "/content/drive/MyDrive/generated_forms.json"
shutil.copy(output_file, drive_output)

print(f"‚úÖ R√©sultats sauvegard√©s sur Drive: {drive_output}")

## üéÆ √âtape 9: Mode interactif

G√©n√©rez des formulaires interactivement.

In [None]:
# Mode interactif
while True:
    print("\n" + "=" * 60)
    description = input("üìù D√©crivez le formulaire (ou 'quit' pour quitter): ")

    if description.lower() in ['quit', 'q', 'exit']:
        print("üëã Au revoir!")
        break

    if not description.strip():
        print("‚ö†Ô∏è Description vide!")
        continue

    form = generate_form(description)
    print("\nüìã R√©sultat:")
    print(json.dumps(form, indent=2, ensure_ascii=False))

## üí° Conseils et astuces

### Param√®tres de g√©n√©ration:
- **temperature** (0.0-1.0): Contr√¥le la cr√©ativit√©
  - Basse (0.1-0.3): R√©sultats plus d√©terministes
  - Moyenne (0.5-0.7): Bon √©quilibre
  - Haute (0.8-1.0): Plus cr√©atif mais moins pr√©visible

- **top_p** (0.0-1.0): Contr√¥le la diversit√©
  - Valeur recommand√©e: 0.9

- **max_new_tokens**: Nombre de tokens √† g√©n√©rer
  - Formulaire simple: 512
  - Formulaire complexe: 1024-2048

### Conseils pour de meilleurs r√©sultats:
1. Soyez sp√©cifique dans vos descriptions
2. Listez tous les champs n√©cessaires
3. Mentionnez les types de champs si n√©cessaire (select, checkbox, etc.)
4. Indiquez les champs obligatoires si pertinent
5. Ajustez la temp√©rature selon vos besoins

### Exemples de descriptions efficaces:
- ‚úÖ "Cr√©e un formulaire d'inscription avec nom (texte obligatoire), email (obligatoire), t√©l√©phone (optionnel) et pays (menu d√©roulant)"
- ‚úÖ "Cr√©e un formulaire de commande avec choix de produit, quantit√©, mode de livraison (express/standard) et adresse compl√®te"
- ‚ùå "Fais un formulaire" (trop vague)

### D√©pannage:
- Si le JSON est invalide, essayez de diminuer la temp√©rature
- Si les r√©sultats sont trop r√©p√©titifs, augmentez la temp√©rature
- Si le mod√®le est lent, v√©rifiez que vous utilisez un GPU
- En cas d'erreur de m√©moire, r√©duisez max_new_tokens