<a href="https://colab.research.google.com/github/acherm/SEAI4Sport/blob/main/LLM_repeat.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import os

# ‚ö†Ô∏è Remplace "TON_API_KEY_ICI" par ta cl√© Groq :
os.environ["GROQ_API_KEY"] = "" # https://console.groq.com/keys


In [2]:
import os
import csv
import time
import hashlib
from datetime import datetime

import requests
import pandas as pd  # üëà nouveau

# Constantes "globales" configurables en √©ditant ce bloc
GROQ_BASE_URL = "https://api.groq.com/openai/v1/chat/completions"
SLEEP_SECONDS_BETWEEN_CALLS = 0.0   # mets 0.1 ou 0.2 si tu veux espacer les requ√™tes
OUTPUT_DIR = "."                    # ou par ex. "/content/drive/MyDrive/groq_results"

# max_tokens : D√©termine la longueur maximale de la r√©ponse.
# temperature : Contr√¥le la cr√©ativit√© des r√©ponses (0 pour des r√©ponses d√©terministes, 1 pour des r√©ponses plus cr√©atives).
# top_p : Ajuste le niveau de variation dans le choix des mots.

def run_sensitivity_experiment(
    prompt: str,
    model: str = "llama-3.1-8b-instant",
    temperature: float = 0.7,
    max_tokens: int = 50,
    n_repeats: int = 10,
):
    """
    Appelle un LLM Groq plusieurs fois avec les m√™mes param√®tres
    et enregistre les r√©ponses dans un CSV.

    Chaque appel √† cette fonction cr√©e un nouveau CSV dont le nom contient :
    - la date/heure actuelle
    - le nom du mod√®le
    - un hash des param√®tres (prompt, temperature, max_tokens, model)

    Le CSV contient une ligne par appel :
    - model_name
    - temperature
    - max_tokens
    - prompt
    - answer
    - run_index (0..n_repeats-1)

    Retourne
    -------
    filepath : str
        Chemin du fichier CSV cr√©√©.
    df : pandas.DataFrame
        DataFrame contenant les r√©sultats.
    """

    # Cl√© API : uniquement via l'environnement
    api_key = os.getenv("GROQ_API_KEY")
    if not api_key:
        raise ValueError(
            "API key is missing. Set GROQ_API_KEY in the environment (voir la cellule 1)."
        )

    # Construction d'un hash stable des param√®tres exp√©rimentaux
    hash_input = f"{model}||{temperature}||{max_tokens}||{prompt}".encode("utf-8")
    short_hash = hashlib.sha1(hash_input).hexdigest()[:8]

    # Timestamp pour le nom de fichier
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")

    # Nettoyage du nom du mod√®le pour √©viter les caract√®res probl√©matiques
    safe_model_name = "".join(c if c.isalnum() or c in "-_" else "_" for c in model)

    # Nom du fichier CSV
    filename = f"{timestamp}_{safe_model_name}_{short_hash}.csv"
    filepath = os.path.join(OUTPUT_DIR, filename)

    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {api_key}",
    }

    # Cr√©ation du dossier de sortie si n√©cessaire
    os.makedirs(OUTPUT_DIR, exist_ok=True)

    # On garde les r√©sultats en m√©moire pour construire le DataFrame
    rows = []

    for i in range(n_repeats):
        payload = {
            "model": model,
            "messages": [
                {
                    "role": "user",
                    "content": prompt,
                }
            ],
            "temperature": temperature,
            "max_tokens": max_tokens,
        }

        try:
            response = requests.post(GROQ_BASE_URL, json=payload, headers=headers)
        except requests.RequestException as e:
            answer = f"REQUEST_ERROR: {e}"
        else:
            if response.status_code == 200:
                try:
                    json_resp = response.json()
                    answer = json_resp["choices"][0]["message"]["content"]
                except (KeyError, ValueError) as e:
                    answer = f"PARSE_ERROR: {e} | RAW: {response.text[:200]}"
            else:
                answer = f"HTTP_{response.status_code}: {response.text[:200]}"

        rows.append(
            {
                "model_name": model,
                "temperature": temperature,
                "max_tokens": max_tokens,
                "prompt": prompt,
                "answer": answer,
                "run_index": i,
            }
        )

        if SLEEP_SECONDS_BETWEEN_CALLS > 0:
            time.sleep(SLEEP_SECONDS_BETWEEN_CALLS)

    # Construction du DataFrame
    df = pd.DataFrame(rows)

    # Sauvegarde en CSV
    df.to_csv(filepath, index=False, encoding="utf-8")

    return filepath, df


In [3]:
prompt = "Faut-il n√©cessairement manger avant d'aller courir le matin ? R√©pond uniquement oui ou non"

csv_path, df = run_sensitivity_experiment(
    prompt=prompt,
    model="llama-3.1-8b-instant", # "moonshotai/kimi-k2-instruct" or "openai/gpt-oss-20b"
    temperature=0.8,
    max_tokens=10,
    n_repeats=20,
)

print("CSV enregistr√© dans :", csv_path)
df


CSV enregistr√© dans : ./20251202_163204_llama-3_1-8b-instant_7ec64e7c.csv


Unnamed: 0,model_name,temperature,max_tokens,prompt,answer,run_index
0,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non,0
1,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,1
2,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,2
3,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,3
4,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non,4
5,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non,5
6,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non,6
7,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non,7
8,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,8
9,llama-3.1-8b-instant,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,9


In [4]:
# Sur une √©chelle de 1 (absolument non) √† 5 (absolument oui), faut-il n√©cessairement manger avant d'aller courir le matin ?

In [5]:
prompt = "Sur une √©chelle de 1 (absolument non) √† 5 (absolument oui), faut-il n√©cessairement manger avant d'aller courir le matin ? R√©pond uniquement par 1, 2, 3, 4, ou 5"

csv_path, df = run_sensitivity_experiment(
    prompt=prompt,
    model="llama-3.1-8b-instant",
    temperature=0.8,
    max_tokens=10,
    n_repeats=20,
)

print("CSV enregistr√© dans :", csv_path)
df

CSV enregistr√© dans : ./20251202_163212_llama-3_1-8b-instant_821213e4.csv


Unnamed: 0,model_name,temperature,max_tokens,prompt,answer,run_index
0,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,3,0
1,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,4,1
2,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,4,2
3,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,3,3
4,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,3,4
5,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,2\n\n(Vous devriez prendre un petit,5
6,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,2,6
7,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,3,7
8,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,3,8
9,llama-3.1-8b-instant,0.8,10,Sur une √©chelle de 1 (absolument non) √† 5 (abs...,2,9


In [6]:
prompt = "Faut-il n√©cessairement manger avant d'aller courir le matin ? R√©pond uniquement oui ou non" 

csv_path, df = run_sensitivity_experiment(
    prompt=prompt,
    model="moonshotai/kimi-k2-instruct", # changement de mod√®le
    temperature=0.8,
    max_tokens=10,
    n_repeats=20,
)

print("CSV enregistr√© dans :", csv_path)
df

CSV enregistr√© dans : ./20251202_163217_moonshotai_kimi-k2-instruct_466d46ac.csv


Unnamed: 0,model_name,temperature,max_tokens,prompt,answer,run_index
0,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,0
1,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non,1
2,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non,2
3,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,3
4,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,4
5,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,5
6,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,6
7,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,7
8,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,8
9,moonshotai/kimi-k2-instruct,0.8,10,Faut-il n√©cessairement manger avant d'aller co...,Non.,9


In [7]:
prompt = "Faut-il manger avant d'aller courir le matin ? R√©pond uniquement oui ou non" # n√©cessairement a √©t√© enlev√©

csv_path, df = run_sensitivity_experiment(
    prompt=prompt,
    model="moonshotai/kimi-k2-instruct", # changement de mod√®le
    temperature=0.8,
    max_tokens=10,
    n_repeats=20,
)

print("CSV enregistr√© dans :", csv_path)
df

CSV enregistr√© dans : ./20251202_163234_moonshotai_kimi-k2-instruct_7fabc810.csv


Unnamed: 0,model_name,temperature,max_tokens,prompt,answer,run_index
0,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non.,0
1,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non,1
2,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non.,2
3,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non.,3
4,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non.,4
5,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non.,5
6,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Oui,6
7,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non,7
8,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non.,8
9,moonshotai/kimi-k2-instruct,0.8,10,Faut-il manger avant d'aller courir le matin ?...,Non.,9


# Montrer la sensibilit√© des LLMs, en r√©p√©tant les r√©ponses √† des prompts, sur des questions de sant√©/performance 

# Montrer la robustesse des LLMs, en r√©p√©tant les r√©ponses √† des prompts, sur des questions de sant√©/performance 

# Montrer la coh√©rence ou la non-coh√©rence des LLMs sur des pr√©dictions dans le temps‚Ä¶ demander, par exemple, la pr√©vision du record du monde de 800m f√©minin en 2026, 2030, 2040, 2050.


In [1]:
 # "What will be the women's 800 meter run world record by the year 2025?",
 #           "What will be the women's 800 meter run world record by the year 2028?",
 #           "What will be the women's 800 meter run world record by the year 2032?",
 #           "What will be the women's 800 meter run world record by the year 2036?",
 #           "What will be the women's 800 meter run world record by the year 2040?"

In [9]:
# Exemple pour BPCO
prompt = "Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point de vue respiratoire (grade D), mais qu‚Äôils ont une bonne force musculaire (force du quadriceps environ 90% des valeurs normales), est ce qu‚Äôil est quand m√™me important de faire du renforcement musculaire ?"

csv_path, df = run_sensitivity_experiment(
    prompt=prompt,
    model="llama-3.1-8b-instant", # ou  or openai/gpt-oss-20b	 
    temperature=0.8,
    max_tokens=1000,
    n_repeats=5,
)

print("CSV enregistr√© dans :", csv_path)
df

CSV enregistr√© dans : ./20251202_163330_llama-3_1-8b-instant_eee9f254.csv


Unnamed: 0,model_name,temperature,max_tokens,prompt,answer,run_index
0,llama-3.1-8b-instant,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, m√™me si vos patients atteints de bronchop...",0
1,llama-3.1-8b-instant,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, il est encore important de faire du renfo...",1
2,llama-3.1-8b-instant,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, il est encore important de faire du renfo...",2
3,llama-3.1-8b-instant,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, m√™me si vos patients BPCO (broncho-pneumo...",3
4,llama-3.1-8b-instant,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, il est toujours important de faire du ren...",4


In [8]:
# Exemple pour BPCO
prompt = "Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point de vue respiratoire (grade D), mais qu‚Äôils ont une bonne force musculaire (force du quadriceps environ 90% des valeurs normales), est ce qu‚Äôil est quand m√™me important de faire du renforcement musculaire ?"

csv_path, df = run_sensitivity_experiment(
    prompt=prompt,
    model="moonshotai/kimi-k2-instruct", # ou llama-3.1-8b-instant or openai/gpt-oss-20b	 
    temperature=0.8,
    max_tokens=1000,
    n_repeats=5,
)

print("CSV enregistr√© dans :", csv_path)
df

CSV enregistr√© dans : ./20251202_163259_moonshotai_kimi-k2-instruct_ada3364c.csv


Unnamed: 0,model_name,temperature,max_tokens,prompt,answer,run_index
0,moonshotai/kimi-k2-instruct,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, c‚Äôest **toujours pertinent** de proposer ...",0
1,moonshotai/kimi-k2-instruct,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, **il est toujours important de proposer u...",1
2,moonshotai/kimi-k2-instruct,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, **le renforcement musculaire reste import...",2
3,moonshotai/kimi-k2-instruct,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, **m√™me si la force musculaire est conserv...",3
4,moonshotai/kimi-k2-instruct,0.8,1000,Si j‚Äôai des patients BPCO s√©v√®res d‚Äôun point d...,"Oui, **le renforcement musculaire reste import...",4
