# Traitement des exercices LaTeX avec IA

Ce notebook utilise le module `main_analyzer.py` pour traiter des exercices LaTeX avec l'API Gemini afin de générer :
1. Des métadonnées détaillées (compétences, difficulté, etc.)
2. Des résumés synthétiques des exercices

Vous pouvez exécuter ces processus séparément ou ensemble.

In [1]:
# Import du module d'analyse LaTeX
from main_analyzer import extract_all

  from .autonotebook import tqdm as notebook_tqdm


## Configuration

Définissez les paramètres de traitement ici.

In [2]:
# Paramètres généraux
SOURCE_DIR = "../src/latex/amscc"  # Répertoire contenant les fichiers LaTeX
OUTPUT_DIR = "../metadata/amscc"  # Répertoire unique pour tous les résultats

# Paramètres d'exécution
MODEL_NAME = "gemini-2.0-flash"  # Modèle Gemini à utiliser
API_DELAY = 5.0  # Délai entre les appels API (secondes)
FORCE_REPROCESS = False  # Retraiter les fichiers déjà analysés
DEBUG = False  # Afficher des informations de débogage
MAX_FILES = None  # Nombre max de fichiers à traiter (None = tous)

## Option 1 : Extraction des métadonnées uniquement

Cette option génère uniquement les métadonnées détaillées pour chaque exercice.

In [None]:
# Pour les métadonnées uniquement
from main_analyzer import extract_metadata

results_metadata = extract_metadata(
    source_dir=SOURCE_DIR,
    output_dir=OUTPUT_DIR,
    model_name=MODEL_NAME,
    max_files=MAX_FILES,
    api_delay=API_DELAY,
    force_reprocess=FORCE_REPROCESS,
    debug=DEBUG
)



## Option 2 : Extraction des résumés uniquement

Cette option génère uniquement les résumés synthétiques pour chaque exercice.

In [None]:
# Pour les résumés uniquement
from main_analyzer import extract_resume

results_resume = extract_resume(
    source_dir=SOURCE_DIR,
    output_dir=OUTPUT_DIR,
    model_name=MODEL_NAME,
    max_files=MAX_FILES,
    api_delay=API_DELAY,
    force_reprocess=FORCE_REPROCESS,
    debug=DEBUG
)

## Option 3 : Traitement complet (métadonnées + résumés)

Cette option génère à la fois les métadonnées et les résumés pour chaque exercice.

In [3]:
# Import du nouveau module
from main_analyzer import extract_all

# Exécution du processus complet (métadonnées + résumés)
results = extract_all(
    source_dir=SOURCE_DIR,
    output_dir=OUTPUT_DIR,
    model_name=MODEL_NAME,
    max_files=MAX_FILES,
    api_delay=API_DELAY,
    force_reprocess=FORCE_REPROCESS,
    debug=DEBUG,
    analysis_only=False
)

=== EXTRACTION DES MÉTADONNÉES ET RÉSUMÉS ===
Traitement de 487 fichiers LaTeX...

[1/487] Analyse de YBwt.tex...
Fichier YBwt déjà traité, ignoré.

[2/487] Analyse de trhY.tex...
Fichier trhY déjà traité, ignoré.

[3/487] Analyse de aWAS.tex...
Fichier aWAS déjà traité, ignoré.

[4/487] Analyse de DEZs.tex...
Fichier DEZs déjà traité, ignoré.

[5/487] Analyse de avca.tex...
Fichier avca déjà traité, ignoré.

[6/487] Analyse de 5cbY.tex...
Fichier 5cbY déjà traité, ignoré.

[7/487] Analyse de ouYw.tex...
Fichier ouYw déjà traité, ignoré.

[8/487] Analyse de 6NIK.tex...
Fichier 6NIK déjà traité, ignoré.

[9/487] Analyse de PPhD.tex...
Fichier PPhD déjà traité, ignoré.

[10/487] Analyse de td24.tex...
Fichier td24 déjà traité, ignoré.

[11/487] Analyse de 0oHk.tex...
Fichier 0oHk déjà traité, ignoré.

[12/487] Analyse de hWFx.tex...
Fichier hWFx déjà traité, ignoré.

[13/487] Analyse de Uijb.tex...
Fichier Uijb déjà traité, ignoré.

[14/487] Analyse de 7aqI.tex...
Fichier 7aqI déjà trait

## Option 4 : Fusion des résultats existants

Cette option fusionne les métadonnées et résumés déjà générés dans un seul ensemble de fichiers.

In [None]:
# Décommentez pour exécuter
# merged_results = merge_results(
#     metadata_dir=METADATA_DIR,
#     resume_dir=RESUME_DIR,
#     output_dir=MERGED_DIR
# )