# üöÄ Inf√©rence LLaMA + LoRA - Notebook Colab Pr√™t √† l'Emploi

Ce notebook teste l'inf√©rence avec votre mod√®le LLaMA fine-tun√© avec LoRA.

## üìã Instructions rapides

1. **Activer le GPU** : Runtime ‚Üí Change runtime type ‚Üí GPU (T4 ou A100)
2. **Remplacer les chemins** dans les cellules ci-dessous (marqu√©s avec ‚ö†Ô∏è)
3. **Ex√©cuter les cellules** dans l'ordre (Shift+Enter)

## üìù Checklist

- [ ] GPU activ√©
- [ ] Token Hugging Face pr√™t
- [ ] Mod√®le LoRA disponible (Google Drive, Hugging Face, ou upload)
- [ ] PDF de test + template JSON pr√™ts


## √âTAPE 1 : V√©rifier le GPU


In [None]:
import torch
print(f"GPU disponible: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"‚úÖ GPU: {torch.cuda.get_device_name(0)}")
    print(f"‚úÖ M√©moire GPU: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")
else:
    print("‚ùå ATTENTION: Aucun GPU d√©tect√©!")
    print("   Allez dans Runtime ‚Üí Change runtime type ‚Üí GPU (T4 ou A100)")


## √âTAPE 2 : Installer les d√©pendances depuis requirements.txt


In [None]:
# Option A: T√©l√©charger requirements.txt depuis votre repo GitHub
# D√©commentez et modifiez l'URL si vous avez le fichier sur GitHub
# !wget -q https://raw.githubusercontent.com/VOTRE_USERNAME/VOTRE_REPO/main/amalytics-ml/code/requirements.txt -O /content/requirements.txt

# Option B: Cr√©er requirements.txt directement avec toutes les d√©pendances
requirements_content = """torch
transformers
accelerate
bitsandbytes
peft
datasets
trl
pdfplumber
pyffx
scikit-learn
natsort
fpdf2
lxml
nltk
huggingface_hub"""

# V√©rifier si requirements.txt existe d√©j√†, sinon le cr√©er
import os
req_file = "/content/requirements.txt"
if not os.path.exists(req_file):
    with open(req_file, "w") as f:
        f.write(requirements_content)
    print("‚úÖ requirements.txt cr√©√© localement")
else:
    print("‚úÖ requirements.txt trouv√© (probablement t√©l√©charg√© depuis GitHub)")

print("\nüì¶ Installation des d√©pendances depuis requirements.txt...")
print("   (Cela peut prendre 5-10 minutes, soyez patient...)")

# Installer depuis requirements.txt
!pip install -q -r /content/requirements.txt

print("\n‚úÖ Toutes les d√©pendances sont install√©es!")
print("\nüìã Packages install√©s:")
!pip list | grep -E "(torch|transformers|peft|bitsandbytes|pdfplumber)"


## √âTAPE 3 : Authentification Hugging Face


In [None]:
from huggingface_hub import login

# ‚ö†Ô∏è REMPLACER PAR VOTRE TOKEN Hugging Face
# Obtenez votre token sur: https://huggingface.co/settings/tokens
HF_TOKEN = "VOTRE_TOKEN_HF"  # Token commen√ßant par hf_...

login(HF_TOKEN)
print("‚úÖ Authentification Hugging Face r√©ussie")


## √âTAPE 4 : T√©l√©charger/Uploadez votre code


In [None]:
import sys
from pathlib import Path
import os

# ============================================
# OPTION A : Cloner depuis GitHub (RECOMMAND√â)
# ============================================
# ‚ö†Ô∏è MODIFIER : Remplacez par l'URL de votre repository GitHub
GITHUB_REPO_URL = "https://github.com/VOTRE_USERNAME/amalytics-ml.git"  # ‚ö†Ô∏è MODIFIER

# Si le repo est private, utilisez un token:
# GITHUB_REPO_URL = "https://VOTRE_TOKEN@github.com/VOTRE_USERNAME/amalytics-ml.git"

# Cloner depuis GitHub
if not os.path.exists("/content/amalytics-ml"):
    print(f"üì• Clonage depuis GitHub: {GITHUB_REPO_URL}")
    !git clone {GITHUB_REPO_URL} /content/amalytics-ml
    print("‚úÖ Code clon√© depuis GitHub!")
else:
    print("‚úÖ Le repository existe d√©j√† (peut-√™tre d√©j√† clon√©)")

# ============================================
# OPTION B : Upload manuel (si vous n'utilisez pas GitHub)
# ============================================
# D√©commentez cette section si vous pr√©f√©rez uploader manuellement
# !mkdir -p /content/amalytics-ml/code
# print("‚úÖ Dossier cr√©√©")
# print("\nüí° Uploadez maintenant votre code via l'interface Files (üìÅ) de Colab")
# print("   dans le dossier /content/amalytics-ml/code/")

# Ajouter le code au path Python
code_dir = Path("/content/amalytics-ml/code")
if not code_dir.exists():
    # Si le repo GitHub a une structure diff√©rente, ajustez ici
    code_dir = Path("/content/amalytics-ml")

src_dir = code_dir / "src"
if src_dir.exists():
    sys.path.insert(0, str(src_dir))
    print(f"‚úÖ Code ajout√© au path: {src_dir}")
else:
    print(f"‚ö†Ô∏è Dossier src non trouv√© dans {code_dir}")
    print("   V√©rifiez la structure de votre repository GitHub")

# V√©rifier la structure
print(f"\nüìÅ Structure du repository:")
for item in sorted(code_dir.rglob("*"))[:15]:  # Afficher les 15 premiers
    if item.is_file() and item.suffix in ['.py', '.json', '.txt', '.md']:
        print(f"  üìÑ {item.relative_to(code_dir)}")


## √âTAPE 5 : V√©rifier les imports


In [None]:
# V√©rifier que le code peut √™tre import√©
try:
    from amalytics_ml.config import InferenceConfig
    from amalytics_ml.models.inference import run_inference
    print("‚úÖ Tous les imports fonctionnent!")
except ImportError as e:
    print(f"‚ùå Erreur d'import: {e}")
    print("\nüí° Assurez-vous que:")
    print("   - Le code est bien upload√© dans /content/amalytics-ml/code/")
    print("   - La structure est: /content/amalytics-ml/code/src/amalytics_ml/...")
    import traceback
    traceback.print_exc()


## √âTAPE 6 : T√©l√©charger votre mod√®le LoRA


### Option A : Depuis Google Drive


In [None]:
from google.colab import drive
drive.mount('/content/drive')

# ‚ö†Ô∏è MODIFIER LE CHEMIN selon votre structure sur Google Drive
LORA_DRIVE_PATH = "/content/drive/MyDrive/path/to/lora-output"  # ‚ö†Ô∏è MODIFIER

!cp -r {LORA_DRIVE_PATH} /content/lora-output

print("‚úÖ LoRA copi√© depuis Google Drive")


### Option B : Depuis Hugging Face Hub


In [None]:
from huggingface_hub import snapshot_download

# ‚ö†Ô∏è REMPLACER par votre repo Hugging Face
LORA_REPO_ID = "VOTRE_USERNAME/VOTRE_LORA_REPO"  # ‚ö†Ô∏è MODIFIER

snapshot_download(
    repo_id=LORA_REPO_ID,
    local_dir="/content/lora-output",
    token=HF_TOKEN
)

print("‚úÖ LoRA t√©l√©charg√© depuis Hugging Face")


### Option C : Upload direct


In [None]:
!mkdir -p /content/lora-output
print("‚úÖ Dossier cr√©√©")
print("\nüí° Uploadez maintenant vos fichiers LoRA via l'interface Files (üìÅ) de Colab")
print("   dans le dossier /content/lora-output/")


### V√©rifier que les fichiers LoRA sont pr√©sents


In [None]:
import os
lora_path = "/content/lora-output"
if os.path.exists(lora_path):
    files = os.listdir(lora_path)
    print(f"‚úÖ {len(files)} fichiers trouv√©s dans {lora_path}")
    print("\nFichiers LoRA:")
    for f in sorted(files)[:10]:
        print(f"  - {f}")
    if len(files) > 10:
        print(f"  ... et {len(files) - 10} autres fichiers")
    
    # V√©rifier les fichiers importants
    important_files = ["adapter_config.json", "adapter_model.bin", "adapter_model.safetensors"]
    found_important = [f for f in important_files if any(f in file for file in files)]
    if found_important:
        print(f"\n‚úÖ Fichiers LoRA importants trouv√©s: {', '.join(found_important)}")
else:
    print("‚ùå Dossier LoRA non trouv√©!")
    print(f"   V√©rifiez que {lora_path} existe")


## √âTAPE 7 : Pr√©parer les fichiers de test


In [None]:
!mkdir -p /content/test_data/templates
print("‚úÖ Dossiers cr√©√©s")
print("\nüìÅ Uploadez maintenant via l'interface Files (üìÅ) de Colab:")
print("   - Un PDF de test ‚Üí /content/test_data/")
print("   - Un template JSON vide ‚Üí /content/test_data/templates/")

# V√©rifier les fichiers upload√©s
import os
test_dir = "/content/test_data"
if os.path.exists(test_dir):
    pdfs = [f for f in os.listdir(test_dir) if f.endswith('.pdf')]
    templates = []
    if os.path.exists(f"{test_dir}/templates"):
        templates = [f for f in os.listdir(f"{test_dir}/templates") if f.endswith('.json')]
    
    print(f"\nüìÑ Fichiers trouv√©s:")
    print(f"   PDFs: {len(pdfs)} - {pdfs[:3]}")
    print(f"   Templates: {len(templates)} - {templates[:3]}")


## √âTAPE 8 : Configuration


In [None]:
import json
from pathlib import Path
from amalytics_ml.config import InferenceConfig

# ‚ö†Ô∏è MODIFIER LES CHEMINS selon votre structure
config = {
    "model_path": "meta-llama/Meta-Llama-3.1-8B-Instruct",
    "lora_path": "/content/lora-output",
    "template_path": "/content/test_data/templates/sample_1_template_empty.json",  # ‚ö†Ô∏è MODIFIER
    "max_new_tokens": 3000,
    "do_sample": False,
    "return_scores": True,
    "load_in_4bit": True,
    "device_map": "auto",
    "use_batch_inference": False,
    "apply_anonymization": False,
}

cfg = InferenceConfig(**config)

# Charger le template
if cfg.template_path:
    template_path = Path(cfg.template_path)
    if template_path.exists():
        with template_path.open("r", encoding="utf-8") as f:
            cfg.template = json.load(f)
        print(f"‚úÖ Template charg√©: {cfg.template_path}")
        print(f"   Cl√©s principales: {list(cfg.template.keys())[:5]}")
    else:
        print(f"‚ùå Template non trouv√©: {cfg.template_path}")
        print("   V√©rifiez le chemin dans la configuration ci-dessus")

print(f"\n‚úÖ Configuration pr√™te")
print(f"   Model: {cfg.model_path}")
print(f"   LoRA: {cfg.lora_path}")
print(f"   4-bit quantization: {cfg.load_in_4bit}")
print(f"   Device: {cfg.device_map}")


## √âTAPE 9 : üöÄ EX√âCUTER L'INF√âRENCE

‚ö†Ô∏è **ATTENTION** : Cette √©tape va charger le mod√®le en m√©moire GPU (5-15 minutes la premi√®re fois)


In [None]:
from amalytics_ml.models.inference import run_inference
from pathlib import Path
import json
import time

# ‚ö†Ô∏è MODIFIER LE CHEMIN vers votre PDF de test
pdf_path = "/content/test_data/sample_1.pdf"  # ‚ö†Ô∏è MODIFIER

print("üöÄ D√©marrage de l'inf√©rence...")
print("‚è≥ Chargement du mod√®le (cela peut prendre 5-15 minutes)...")
print("üí° Vous pouvez surveiller l'utilisation GPU dans Runtime ‚Üí Manage sessions")
print("-" * 60)

start_time = time.time()

try:
    result = run_inference(
        model_path=cfg.model_path,
        lora_path=cfg.lora_path if cfg.lora_path else "",
        input_text=Path(pdf_path),
        config=cfg,
    )
    
    elapsed_time = time.time() - start_time
    
    print("-" * 60)
    print(f"‚úÖ Inf√©rence termin√©e avec succ√®s! (temps: {elapsed_time/60:.2f} minutes)")
    
except Exception as e:
    elapsed_time = time.time() - start_time
    print("-" * 60)
    print(f"‚ùå Erreur pendant l'inf√©rence: {e}")
    print(f"   Temps √©coul√©: {elapsed_time/60:.2f} minutes")
    import traceback
    traceback.print_exc()


## √âTAPE 10 : Afficher les r√©sultats


In [None]:
# Afficher le r√©sultat JSON
print("=" * 60)
print("R√âSULTAT JSON")
print("=" * 60)
print(json.dumps(result.parsed_json, indent=2, ensure_ascii=False))


In [None]:
# Afficher les scores de confiance
if result.confidence_scores:
    print("\n" + "=" * 60)
    print("SCORES DE CONFIANCE")
    print("=" * 60)
    print(json.dumps(result.confidence_scores, indent=2, ensure_ascii=False))
    
    # Statistiques
    scores = list(result.confidence_scores.values())
    print(f"\nüìä Statistiques:")
    print(f"   Nombre de champs: {len(scores)}")
    print(f"   Score moyen: {sum(scores) / len(scores):.4f}")
    print(f"   Score min: {min(scores):.4f}")
    print(f"   Score max: {max(scores):.4f}")
else:
    print("\n‚ö†Ô∏è Pas de scores de confiance disponibles (return_scores=False)")


## √âTAPE 11 : Sauvegarder les r√©sultats


In [None]:
output_dir = Path("/content/outputs")
output_dir.mkdir(exist_ok=True)

# Sauvegarder le r√©sultat JSON
result_file = output_dir / "result.json"
with result_file.open("w", encoding="utf-8") as f:
    json.dump(result.parsed_json, f, indent=2, ensure_ascii=False)
print(f"‚úÖ R√©sultat sauvegard√©: {result_file}")

# Sauvegarder les scores de confiance si disponibles
if result.confidence_scores:
    confidence_file = output_dir / "confidence.json"
    with confidence_file.open("w", encoding="utf-8") as f:
        json.dump(result.confidence_scores, f, indent=2, ensure_ascii=False)
    print(f"‚úÖ Scores sauvegard√©s: {confidence_file}")

print(f"\nüí° Pour t√©l√©charger:")
print(f"   Clic droit sur les fichiers dans l'interface Files (üìÅ) ‚Üí Download")
print(f"   Ou utilisez: files.download('{result_file}')")


## üìä Visualisation des scores (optionnel)


In [None]:
if result.confidence_scores:
    import matplotlib.pyplot as plt
    
    scores = list(result.confidence_scores.values())
    
    plt.figure(figsize=(10, 6))
    plt.hist(scores, bins=20, edgecolor='black', alpha=0.7)
    plt.xlabel('Score de confiance', fontsize=12)
    plt.ylabel('Nombre de champs', fontsize=12)
    plt.title('Distribution des scores de confiance', fontsize=14)
    plt.grid(True, alpha=0.3)
    avg_score = sum(scores) / len(scores)
    plt.axvline(avg_score, color='r', linestyle='--', label=f'Moyenne: {avg_score:.3f}')
    plt.legend()
    plt.tight_layout()
    plt.show()
else:
    print("‚ö†Ô∏è Pas de scores de confiance pour visualiser")
