Skip to content

BadreddineEK/ForecastingLLM

Repository files navigation

🔬 ForecastingLLM — AI Forecasting Laboratory

Évaluation probabiliste multi-domaine d'un LLM (GPT-5.2) : MĂ©tĂ©o · MarchĂ©s Financiers · Performance Sportive

Streamlit App


🎯 Objectif

Ce laboratoire compare les capacités de prédiction probabiliste d'un LLM avancé (GPT-5.2 avec reasoning) dans 3 domaines distincts, selon deux conditions expérimentales :

  • Web OFF : prĂ©diction basĂ©e uniquement sur les donnĂ©es fournies dans le prompt (pas d'accĂšs internet)
  • Web ON : mĂȘmes donnĂ©es + accĂšs aux connaissances externes (navigation web)

L'évaluation s'appuie sur des métriques probabilistes rigoureuses (Brier Score, MAE, Coverage P10-P90) comparées à des baselines spécialisées par domaine.


📊 Études RĂ©alisĂ©es

Domaine Prédictions Baseline Métrique principale
đŸŒŠïž MĂ©tĂ©o 35 prĂ©dictions (5 villes × 7 jours) Open-Meteo API MAE (°C) + Brier Score
📈 MarchĂ©s 10 actifs europĂ©ens (horizon J+5) StratĂ©gie alĂ©atoire (p=0.5) Brier Score
🏃 Running 7 mĂ©thodes, 1 marathon (Run In Lyon 2025) Riegel, Coros, HR→Pace MAE (minutes)

🏆 RĂ©sultats ClĂ©s (V1 — DĂ©cembre 2025)

  • ✅ MĂ©tĂ©o : L'IA amĂ©liore la prĂ©cision de ~15-20% vs API professionnelle (MAE ~2°C)
  • ✅ MarchĂ©s : Brier Score ~0.22 (vs 0.25 pour le hasard pur) — compĂ©tence prĂ©dictive rĂ©elle
  • ✅ Running : Performance comparable aux formules physiologiques Ă©tablies (Riegel, Coros)
  • ⚠ Biais identifiĂ© : Web ON tend Ă  rendre les prĂ©dictions plus optimistes (+10-20% en finance)

đŸ—‚ïž Structure du Projet

ForecastingLLM/
├── forecasting_llm_lab.py     # Streamlit app (entrypoint)
├── requirements.txt           # DĂ©pendances Python
├── protocol.md                # Protocole expĂ©rimental dĂ©taillĂ©
│
├── WEATHER/
│   └── weather_experiment_FINAL.xlsx   # DonnĂ©es mĂ©tĂ©o (35 lignes)
│
├── MARKETS/
│   └── markets_experiments_FINAL.xlsx  # DonnĂ©es marchĂ©s (10 actifs)
│
└── RUNNING/
    ├── marathon_predictions_oneshot.csv # PrĂ©dictions toutes mĂ©thodes
    └── CSVs_transitions/
        ├── marathon_snapshot_16w.csv    # RĂ©sumĂ© 16 semaines
        ├── marathon_weekly_16w.csv      # AgrĂ©gats hebdomadaires
        └── marathon_runs_16w.csv        # DĂ©tail des sĂ©ances

🚀 Lancer en local

Prérequis : Python 3.10+

# 1. Cloner le repo
git clone https://github.com/BadreddineEK/ForecastingLLM.git
cd ForecastingLLM

# 2. Créer un environnement virtuel
python -m venv .venv
source .venv/bin/activate      # macOS/Linux
# .venv\Scripts\activate       # Windows

# 3. Installer les dépendances
pip install -r requirements.txt

# 4. Lancer l'app
streamlit run forecasting_llm_lab.py

⚠ Lancer depuis la racine du repo pour que les chemins relatifs vers les dossiers WEATHER/, MARKETS/, RUNNING/ soient corrects.


☁ DĂ©ployer sur Streamlit Community Cloud

  1. Aller sur share.streamlit.io
  2. Sélectionner le repo : BadreddineEK/ForecastingLLM
  3. Branche : main
  4. Main file path : forecasting_llm_lab.py
  5. Cliquer Deploy

Aucun secret ou variable d'environnement requis pour la V1 — les donnĂ©es sont bundlĂ©es dans le repo.


📐 Protocole ExpĂ©rimental

Le protocole complet (design expérimental, templates de prompts, rÚgles anti-leak, métriques) est disponible dans protocol.md.

RÚgles clés :

  • J0 (prĂ©dictions gĂ©nĂ©rĂ©es) : 17 dĂ©cembre 2025
  • J+7 (rĂ©solution des outcomes) : 24 dĂ©cembre 2025
  • Anti-leak strict : aucune donnĂ©e post-J0 utilisĂ©e pour les prĂ©dictions
  • 4 threads expĂ©rimentaux hermĂ©tiques (Weather OFF/ON, Markets OFF/ON)

đŸ› ïž Stack Technique

  • App : Streamlit
  • Data : Pandas, NumPy, OpenPyXL
  • Viz : Plotly Express / Graph Objects
  • Stats : SciPy (t-tests, bootstrap CI)
  • LLM Ă©valuĂ© : GPT-5.2 (reasoning ON) via Perplexity Pro
  • Baselines mĂ©tĂ©o : Open-Meteo API
  • Baselines running : Formule de Riegel, Coros, HR→Pace regression

đŸ‘€ Auteur

EL KHAMLICHI Badreddine — Data Scientist
Ingénieur Mathématiques Appliquées · Polytech Lyon (2024)
GitHub


V1 — Mars 2026

About

🔬 Évaluation probabiliste d'un LLM sur 3 domaines : MĂ©tĂ©o, MarchĂ©s, Marathon — Brier Score + MAE. Streamlit app.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages