In [9]:
!pip install dotenv



In [8]:
import google.generativeai as genai
from dotenv import load_dotenv
import os

# Charger les variables d'environnement depuis le fichier .env
load_dotenv()

api_key = os.environ.get("cle_gemini_api")
if not api_key:
    raise ValueError("La clé API n'est pas définie dans le fichier .env. Veuillez configurer la variable 'cle_api'.")

# Configurer le module avec la clé API
genai.configure(api_key=api_key)

# Exemple d'utilisation de l'API
for m in genai.list_models():
    print(m)


Model(name='models/chat-bison-001',
      base_model_id='',
      version='001',
      display_name='PaLM 2 Chat (Legacy)',
      description='A legacy text-only model optimized for chat conversations',
      input_token_limit=4096,
      output_token_limit=1024,
      supported_generation_methods=['generateMessage', 'countMessageTokens'],
      temperature=0.25,
      max_temperature=None,
      top_p=0.95,
      top_k=40)
Model(name='models/text-bison-001',
      base_model_id='',
      version='001',
      display_name='PaLM 2 (Legacy)',
      description='A legacy model that understands text and generates text as an output',
      input_token_limit=8196,
      output_token_limit=1024,
      supported_generation_methods=['generateText', 'countTextTokens', 'createTunedTextModel'],
      temperature=0.7,
      max_temperature=None,
      top_p=0.95,
      top_k=40)
Model(name='models/embedding-gecko-001',
      base_model_id='',
      version='001',
      display_name='Embedding Gecko

In [11]:
import google.generativeai as genai
from dotenv import load_dotenv
import os
import json
import glob
import re

# Charger les variables d'environnement depuis le fichier .env
load_dotenv()

api_key = os.environ.get("cle_gemini_api")
if not api_key:
    raise ValueError("La clé API n'est pas définie dans le fichier .env. Veuillez configurer la variable 'cle_api'.")

# Configurer le module avec la clé API
genai.configure(api_key=api_key)

# Sélectionner le modèle.  gemini-1.5-pro est un bon choix
model = genai.GenerativeModel('gemini-1.5-pro')


def load_chapters(json_file):
    """Charge les chapitres et sous-chapitres depuis un fichier JSON."""
    with open(json_file, 'r', encoding='utf-8') as f:
        data = json.load(f)
    return data


def extract_text_from_tex(tex_file):
    """Extrait le texte d'un fichier .tex en supprimant les commandes LaTeX de base."""
    try:
        with open(tex_file, 'r', encoding='utf-8') as f:
            text = f.read()

        # Supprimer les commentaires
        text = re.sub(r"%.*", "", text)

        # Supprimer les commandes LaTeX (peut être amélioré pour plus de robustesse)
        text = re.sub(r"\\[a-zA-Z]+\{.*?\}", "", text)  # Supprimer les commandes avec arguments entre accolades
        text = re.sub(r"\\[a-zA-Z]+", "", text) # Supprimer les commandes sans arguments

        # Supprimer les environnements (begin...end)
        text = re.sub(r"\\begin\{.*?\}.*?\\end\{.*?\}.*", "", text, flags=re.DOTALL)

        # Supprimer les balises mathématiques inline et hors ligne
        text = re.sub(r"\$.*?\$", "", text)
        text = re.sub(r"\$\$[\s\S]*?\$\$", "", text)

        # Supprimer les figures
        text = re.sub(r"\\begin\{figure\}.*?\\end\{figure\}", "", text, flags=re.DOTALL)


        # Nettoyer les espaces multiples et les sauts de ligne
        text = re.sub(r"\s+", " ", text).strip()
        return text
    except Exception as e:
        print(f"Erreur lors de la lecture/extraction du fichier {tex_file}: {e}")
        return ""


import time

def classify_tex_file(text_content, chapters):
    """
    Classifie le contenu d'un fichier .tex et retourne le chapitre et le sous-chapitre les plus pertinents.
    """
    prompt = f"""
    Vous êtes un classificateur de documents. Votre tâche est de déterminer le chapitre et le sous-chapitre les plus pertinents pour un texte donné.
    Vous devez absolument respecter le format de sortie.

    Voici une liste de chapitres et sous-chapitres possibles:
    {json.dumps(chapters, indent=2, ensure_ascii=False)}

    Texte à classifier:
    {text_content}

    Fournissez votre réponse au format JSON suivant :
    {{
        "chapitre": "Nom du chapitre",
        "sousChapitre": "Nom du sous-chapitre"
    }}

    Ne répondez qu'avec le JSON.
    """

    max_retries = 5
    delay = 1  # secondes

    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            # print(response.text)
            json_string = response.text.strip()

            # Supprimer le préfixe "json" s'il est présent
            if json_string.startswith("json"):
                json_string = json_string[4:].strip()

            #Correction si besoin d'erreurs dans la string JSON
            json_string = json_string.replace("`","")

            try:
                classification = json.loads(json_string)
                return classification["chapitre"], classification["sousChapitre"]
            except json.JSONDecodeError as e:
                print(f"Erreur de décodage JSON: {e}")
                print(f"String JSON recue: {json_string}")
                return None, None  # Gérer l'erreur de décodage JSON

        except Exception as e:
            print(f"Erreur lors de l'appel à l'API Gemini (tentative {attempt + 1}/{max_retries}): {e}")
            if "429" in str(e):  # Vérifie si l'erreur est liée au quota
                print(f"Quota dépassé. Attente de {delay} secondes...")
                time.sleep(delay)
                delay *= 2  # Augmente le délai de façon exponentielle
            else:
                # Autre erreur, ne pas réessayer
                return None, None

    print(f"Échec après {max_retries} tentatives.")
    return None, None  # Retourne None si toutes les tentatives échouent


def insert_chapter_info(tex_file, chapitre, sous_chapitre):
    """Insère les commandes \\chapitre et \\sousChapitre au début du fichier .tex."""
    try:
        with open(tex_file, 'r+', encoding='utf-8') as f:
            content = f.read()
            f.seek(0, 0)  # Retour au début du fichier
            f.write(f"\\chapitre{{{chapitre}}}\n")
            f.write(f"\\sousChapitre{{{sous_chapitre}}}\n")
            f.write(content)
    except Exception as e:
        print(f"Erreur lors de l'écriture dans le fichier {tex_file}: {e}")


def main():
    """Fonction principale pour classifier et insérer les informations dans les fichiers .tex."""
    chapters = load_chapters("../metadata/exo7/chapitres_complet.json")
    tex_files = glob.glob("../src/latex/amscc/*.tex")

    for tex_file in tex_files:
        print(f"Traitement du fichier: {tex_file}")
        text_content = extract_text_from_tex(tex_file)

        if text_content:
            chapitre, sous_chapitre = classify_tex_file(text_content, chapters)

            if chapitre and sous_chapitre:
                print(f"  Chapitre: {chapitre}")
                print(f"  Sous-chapitre: {sous_chapitre}")
                insert_chapter_info(tex_file, chapitre, sous_chapitre)
                print(f"  Informations insérées dans {tex_file}")
            else:
                print(f"  Impossible de classifier {tex_file}")
        else:
            print(f"  Impossible d'extraire le texte de {tex_file}")


if __name__ == "__main__":
    main()

Traitement du fichier: ../src/latex/amscc/YBwt.tex
Erreur de décodage JSON: Expecting value: line 1 column 1 (char 0)
String JSON recue: json
{
  "chapitre": "Probabilité discrète",
  "sousChapitre": "Lois de distributions"
}

  Impossible de classifier ../src/latex/amscc/YBwt.tex
Traitement du fichier: ../src/latex/amscc/trhY.tex
Erreur de décodage JSON: Expecting value: line 1 column 1 (char 0)
String JSON recue: json
{
  "chapitre": "Statistique",
  "sousChapitre": "Tests d'hypothèses, intervalle de confiance"
}

  Impossible de classifier ../src/latex/amscc/trhY.tex
Traitement du fichier: ../src/latex/amscc/aWAS.tex
Erreur lors de l'appel à l'API Gemini: 429 Resource has been exhausted (e.g. check quota).
  Impossible de classifier ../src/latex/amscc/aWAS.tex
Traitement du fichier: ../src/latex/amscc/DEZs.tex
Erreur lors de l'appel à l'API Gemini: 429 Resource has been exhausted (e.g. check quota).
  Impossible de classifier ../src/latex/amscc/DEZs.tex
Traitement du fichier: ../src