# Traitement des exercices LaTeX avec IA

Ce notebook utilise le module `latex_analysis.py` pour traiter des exercices LaTeX avec l'API Gemini afin de générer :
1. Des métadonnées détaillées (compétences, difficulté, etc.)
2. Des résumés synthétiques des exercices

Vous pouvez exécuter ces processus séparément ou ensemble.

In [3]:
# Import du module d'analyse LaTeX
from main_analyzer import extract_all

## Configuration

Définissez les paramètres de traitement ici.

In [5]:
# Paramètres généraux
SOURCE_DIR = "../src/latex/amscc"  # Répertoire contenant les fichiers LaTeX
OUTPUT_DIR = "../metadata/amscc-complet"  # Répertoire unique pour tous les résultats

# Paramètres d'exécution
MODEL_NAME = "gemini-2.0-flash"  # Modèle Gemini à utiliser
API_DELAY = 5.0  # Délai entre les appels API (secondes)
FORCE_REPROCESS = False  # Retraiter les fichiers déjà analysés
DEBUG = False  # Afficher des informations de débogage
MAX_FILES = None  # Nombre max de fichiers à traiter (None = tous)

## Option 1 : Extraction des métadonnées uniquement

Cette option génère uniquement les métadonnées détaillées pour chaque exercice.

In [3]:
# Pour les métadonnées uniquement
from main_analyzer import extract_metadata

results_metadata = extract_metadata(
    source_dir=SOURCE_DIR,
    output_dir=OUTPUT_DIR,
    model_name=MODEL_NAME,
    max_files=MAX_FILES,
    api_delay=API_DELAY,
    force_reprocess=FORCE_REPROCESS,
    debug=DEBUG
)



## Option 2 : Extraction des résumés uniquement

Cette option génère uniquement les résumés synthétiques pour chaque exercice.

In [4]:
# Pour les résumés uniquement
from main_analyzer import extract_resume

results_resume = extract_resume(
    source_dir=SOURCE_DIR,
    output_dir=OUTPUT_DIR,
    model_name=MODEL_NAME,
    max_files=MAX_FILES,
    api_delay=API_DELAY,
    force_reprocess=FORCE_REPROCESS,
    debug=DEBUG
)

## Option 3 : Traitement complet (métadonnées + résumés)

Cette option génère à la fois les métadonnées et les résumés pour chaque exercice.

In [6]:
# Import du nouveau module
from main_analyzer import extract_all

# Exécution du processus complet (métadonnées + résumés)
results = extract_all(
    source_dir=SOURCE_DIR,
    output_dir=OUTPUT_DIR,
    model_name=MODEL_NAME,
    max_files=MAX_FILES,
    api_delay=API_DELAY,
    force_reprocess=FORCE_REPROCESS,
    debug=DEBUG
)

=== EXTRACTION DES MÉTADONNÉES ET RÉSUMÉS ===
Traitement de 460 fichiers LaTeX...

[1/460] Analyse de YBwt.tex...
Extraction des métadonnées pour YBwt...
Extraction du résumé pour YBwt...
Pause de 5.0 secondes...

[2/460] Analyse de trhY.tex...
Extraction des métadonnées pour trhY...
Extraction du résumé pour trhY...
Pause de 5.0 secondes...


KeyboardInterrupt: 

## Option 4 : Fusion des résultats existants

Cette option fusionne les métadonnées et résumés déjà générés dans un seul ensemble de fichiers.

In [6]:
# Décommentez pour exécuter
# merged_results = merge_results(
#     metadata_dir=METADATA_DIR,
#     resume_dir=RESUME_DIR,
#     output_dir=MERGED_DIR
# )