SYNSYNTH+ — Package de Reproductibilité

Architecture d'IA frugale pour la synthèse et le raisonnement sur graphes de connaissances : de l'extraction relationnelle au RAG structuré.

Jourlin, P. (2026). SYNSYNTH+ : Vers une architecture d'IA frugale pour la synthèse et le raisonnement sur graphes de connaissances. Avignon Université, LIA.

Ce dépôt contient les scripts, données, résultats pré-calculés et la démo interactive permettant de reproduire intégralement les expériences décrites dans l'article.

Vue d'ensemble

SYNSYNTH+ est un pipeline complet qui transforme du texte non structuré en un graphe de connaissances interrogeable, en utilisant des modèles légers déployés localement sur un seul GPU grand public. Le projet évalue quatre axes :

Axe	Benchmark	Modèle principal
Extraction de relations	Re-DocRED (N=500)	gemma4:26b (MoE, 4B actifs)
Text-to-Cypher	WebQuestionsSP	qwen3-deep:latest
Raisonnement multi-hop	HotpotQA (N=500)	phi4:latest (14B)
RAG Faithfulness	RAGAS	mistral-small:latest

Le pipeline inclut également des analyses de self-consistency (SC), un pipeline cascade (phi4 → gpt-oss), des courbes d'apprentissage QLoRA, et des études de calibration et de variance.

Structure du dépôt

synsynth/
├── README.md                  # Ce document
├── LICENSE.md                 # Hippocratic License 3.0
├── requirements.txt           # Dépendances Python (109 packages)
├── scripts/
│   ├── run_synsynth.py        # Point d'entrée CLI principal
│   ├── synsynth_config.py     # Configuration centralisée (auto-détecte les chemins)
│   ├── synsynth_model.py      # Interface Ollama API
│   ├── synsynth_data.py       # Chargeurs de datasets (HotpotQA, Re-DocRED, etc.)
│   ├── synsynth_io.py         # I/O sandboxées
│   ├── synsynth_stats.py      # Bootstrap CI, token F1
│   ├── synsynth_checkpoint.py # Gestion des checkpoints
│   ├── synsynth_viz.py        # Visualisations matplotlib
│   ├── synsynth_article.py    # Générateur d'article markdown
│   ├── exp_extraction.py      # Exp 1 — Extraction de relations
│   ├── exp_query.py           # Exp 2 — Text-to-Graph Query
│   ├── exp_multihop.py        # Exp 3 — Raisonnement multi-hop
│   ├── exp_rag.py             # Exp 4 — RAG Faithfulness
│   ├── self_consistency.py    # Self-consistency (SC) k passées
│   ├── pipeline_self_consistency.py  # Cascade phi4→gpt-oss avec SC
│   ├── variance_self_consistency.py  # Variance inter-runs SC (R=5)
│   ├── variance_cascade.py    # Variance inter-runs cascade (R=3)
│   ├── benchmark_models.py    # Benchmark multi-modèles
│   ├── benchmark_model_selection.py  # Sélection de modèle par tâche
│   ├── benchmark_extraction.py       # Extraction cross-modèle
│   ├── extraction_cross_model.py     # Extraction comparée 8 modèles
│   ├── learning_curve.py      # Courbes d'apprentissage QLoRA
│   ├── qlora_finetune.py      # Fine-tuning QLoRA 4-bit
│   ├── faithfulness_checker.py       # Vérificateur NLI de fidélité
│   ├── calibration_analysis.py       # Analyse de calibration
│   ├── confusion_clustering.py       # Clustering matrice de confusion
│   └── rebuild_multihop_data.py      # Génération données multi-hop V2/V3/V4
├── data/                      # Datasets (téléchargés automatiquement)
│   ├── extraction.json        # Cache Re-DocRED
│   ├── multihop.json          # Cache HotpotQA
│   ├── query.json             # Questions WebQuestionsSP
│   └── rag.json               # Exemples RAG
├── results/                   # Résultats pré-calculés (JSON + PNG)
│   ├── all_results.json       # Résumé consolidé de toutes les expériences
│   ├── self_consistency/      # SC k=5 pour phi4, gpt-oss, phi4-reasoning
│   │   └── variance/          # Variance inter-runs R=5 (15 fichiers)
│   ├── pipeline_self_consistency/  # Cascade V5b + SC V5a
│   ├── extraction_benchmark/  # F1 extraction pour 8 modèles
│   ├── extraction_cross_model/# Détails cross-modèle
│   ├── model_selection/       # Sélection de modèle par tâche
│   ├── calibration/           # Diagrammes de calibration
│   ├── confusion_analysis/    # Heatmaps & dendrogrammes
│   └── learning_curve/        # Courbes QLoRA (JSON + PNG)
├── article/
│   └── jourlin_2026a_fr.pdf   # Article compilé (22 pages)
└── demo/                      # Application Gradio interactive
    ├── app.py                 # Serveur de démo
    ├── data/all_results.json  # Données pour la démo
    ├── requirements.txt       # Dépendances Gradio
    └── README.md              # Carte HuggingFace Spaces

Prérequis matériels et logiciels

Matériel

Composant	Minimum	Recommandé (config. de référence)
GPU	NVIDIA 16 Go VRAM	NVIDIA RTX 3090 (24 Go)
RAM	32 Go	64 Go
Stockage	50 Go	100 Go (modèles quantifiés)
OS	Linux (Ubuntu 22.04+)	Ubuntu 24.04

Logiciel

Composant	Version
Python	≥ 3.10
Ollama	≥ 0.6
CUDA	≥ 12.x
Pilote NVIDIA	≥ 550

Installation

1. Installer Ollama et télécharger les modèles

curl -fsSL https://ollama.com/install.sh | sh
ollama serve &   # Démarre le serveur si ce n'est pas déjà fait

# Modèles principaux utilisés dans l'article
ollama pull phi4:latest          # 14B, raisonnement multi-hop
ollama pull gpt-oss:20b          # MoE 20B, cascade
ollama pull phi4-reasoning:plus  # 14B, raisonnement chaîne de pensée
ollama pull gemma4:26b           # MoE 26B (4B actifs), extraction

2. Cloner le dépôt et installer les dépendances

git clone https://github.com/jourlin/synsynth.git
cd synsynth
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

Reproduction des expériences

Pipeline complet (4 axes)

cd scripts
python run_synsynth.py

Cela exécute séquentiellement les 4 expériences (extraction, query, multihop, RAG) et génère les résultats dans results/.

Expériences individuelles

# Extraction de relations (Re-DocRED, N=50)
python scripts/exp_extraction.py

# Text-to-Cypher (WebQuestionsSP, N=20)
python scripts/exp_query.py

# Raisonnement multi-hop (HotpotQA, N=500)
python scripts/exp_multihop.py

# RAG Faithfulness (RAGAS, N=20)
python scripts/exp_rag.py

Self-consistency et cascade

# SC k=5 avec phi4:latest
python scripts/self_consistency.py

# Pipeline cascade phi4→gpt-oss k=5
python scripts/pipeline_self_consistency.py

# Variance inter-runs SC (R=5, ≈20h GPU)
python scripts/variance_self_consistency.py

# Variance inter-runs cascade (R=3, ≈15h GPU)
python scripts/variance_cascade.py

Analyses additionnelles

# Benchmark multi-modèles
python scripts/benchmark_models.py

# Extraction comparée sur 8 modèles
python scripts/extraction_cross_model.py

# Courbes d'apprentissage QLoRA
python scripts/learning_curve.py

# Calibration de la confiance
python scripts/calibration_analysis.py

# Clustering de la matrice de confusion
python scripts/confusion_clustering.py

Exploration des résultats pré-calculés

Tous les résultats sont fournis sous forme de fichiers JSON dans results/. Vous pouvez les explorer sans GPU :

import json

# Résumé consolidé
with open("results/all_results.json") as f:
    results = json.load(f)

# Self-consistency phi4 k=5
with open("results/self_consistency/sc_phi4_latest_k5.json") as f:
    sc = json.load(f)
    print(f"EM voté: {sc['summary']['em_voted']}")

# Variance inter-runs (15 fichiers, R=5 × 3 modèles)
import glob
for f in sorted(glob.glob("results/self_consistency/variance/*.json")):
    data = json.load(open(f))
    print(f"{f}: EM={data['summary']['em_voted']:.3f}")

Démo interactive

Une application Gradio permet d'explorer visuellement les résultats :

cd demo
pip install -r requirements.txt
python app.py

Ouvrir http://localhost:7860 dans un navigateur.

Résultats clés

Pipeline cascade V5b (phi4 → gpt-oss, SC k=5)

Métrique	Valeur	IC 95%
Exact Match	0.552	[0.508 ; 0.594]
Questions reroutées	45.4%	—

Self-consistency V5a (phi4, SC k=3)

Métrique	Valeur	IC 95%
Exact Match	0.482	[0.440 ; 0.522]

Variance inter-runs (R=5, N=181 questions difficiles)

Modèle	σ(EM)
phi4:latest	≤ 0.032
gpt-oss:20b	≤ 0.032
phi4-reasoning:plus	≤ 0.032

Extraction (Re-DocRED, QLoRA 4-bit)

n_train	F1
0 (zero-shot Gemma-4)	0.702
3000	0.794
DREEAM (SOTA)	0.802

Licence et citation

Code source

Distribué sous Hippocratic License 3.0 (HL3). Voir LICENSE.md pour le texte complet.

Article

L'article (article/jourlin_2026a_fr.pdf) est diffusé sous Creative Commons CC BY-NC-SA 4.0.

Citation

@article{jourlin2026synsynth,
  title   = {SYNSYNTH+ : Vers une architecture d'IA frugale pour la synthèse
             et le raisonnement sur graphes de connaissances},
  author  = {Jourlin, Pierre},
  year    = {2026},
  institution = {Avignon Université, Laboratoire d'Informatique d'Avignon}
}

Contact

Pierre Jourlin — Laboratoire Informatique d'Avignon (LIA), Avignon Université

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SYNSYNTH+ — Package de Reproductibilité

Table des matières

Vue d'ensemble

Structure du dépôt

Prérequis matériels et logiciels

Matériel

Logiciel

Installation

1. Installer Ollama et télécharger les modèles

2. Cloner le dépôt et installer les dépendances

Reproduction des expériences

Pipeline complet (4 axes)

Expériences individuelles

Self-consistency et cascade

Analyses additionnelles

Exploration des résultats pré-calculés

Démo interactive

Résultats clés

Pipeline cascade V5b (phi4 → gpt-oss, SC k=5)

Self-consistency V5a (phi4, SC k=3)

Variance inter-runs (R=5, N=181 questions difficiles)

Extraction (Re-DocRED, QLoRA 4-bit)

Licence et citation

Code source

Article

Citation

Contact

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
article		article
data		data
demo		demo
results		results
scripts		scripts
.gitignore		.gitignore
LICENSE.md		LICENSE.md
README.md		README.md
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

SYNSYNTH+ — Package de Reproductibilité

Table des matières

Vue d'ensemble

Structure du dépôt

Prérequis matériels et logiciels

Matériel

Logiciel

Installation

1. Installer Ollama et télécharger les modèles

2. Cloner le dépôt et installer les dépendances

Reproduction des expériences

Pipeline complet (4 axes)

Expériences individuelles

Self-consistency et cascade

Analyses additionnelles

Exploration des résultats pré-calculés

Démo interactive

Résultats clés

Pipeline cascade V5b (phi4 → gpt-oss, SC k=5)

Self-consistency V5a (phi4, SC k=3)

Variance inter-runs (R=5, N=181 questions difficiles)

Extraction (Re-DocRED, QLoRA 4-bit)

Licence et citation

Code source

Article

Citation

Contact

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages