# **Réseaux de neurones**

Projet de Master 2 TAL de Soumia DAAS, Ashley RATIER et Myriam DULOR

## Objectif du projet


La génération de résumés automatiques, de questions ou bien de réponses sont des sujets actuels. Notre projet a pour objectif de développer une interface web en python permettant de générer automatiquement des questions à partir d'un texte donné. L'objectif est de faciliter la création d'interrogations, contrôles ou examens pour les enseignants, dans la langue française.

## Description du système

 Les architectures neuronales comme le modèle “Transformer” (Vaswani et al., 2017) permettent aujourd’hui d’obtenir de bonnes performances pour ces différents objectifs.  

 PyTorch est une bibliothèque logicielle Python open source d'apprentissage automatique qui s'appuie sur Torch développée par Meta. PyTorch permet d'effectuer les calculs tensoriels nécessaires notamment pour l'apprentissage profond. Ces calculs sont optimisés et effectués par un processeur graphique (GPU) supportant CUDA.
 L'algorithme de tokenisation Sentencepiece de PyTorch a été aussi implémenter dans le cadre de notre projet.

Le modèle BARThez pour des tâches de génération a été utilisé.

Les modèles de langue sont en général appris sur des tâches de reconstruction de l’entrée ou de prédiction du prochain mot. Dès lors, il est nécessaire d’adapter ces modèles à la tâche visée. Pour adapter le modèle à une tâche, comme la génération, une méthode consiste à adapter les poids du réseaux de neurones, cette approche est connue sous le nom de fine-tuning.

Le dataset LsTam/CQuAE, corpus de question-réponse en français dans le domaine de l'éducation issue de la publication (Gerald et al., JEP/TALN/RECITAL 2024) et mis à disposition sur Hugging Face a été utilisé dans le cadre de notre projet pour fine-tuner notre modèle.

Ce corpus se compose de paragraphes de cours, puis de questions et de réponses fondées sur ces textes. Les auteurs de ce corpus ont recueilli un ensemble de textes en Français dans le domaine éducatif, en s’appuyant sur des livres scolaires (des cours) concernant les niveaux collège et lycée, principalement en Histoire mais aussi en Géographie, en Sciences de la Vie et de la Terre
et Éducation Civique. Les premiers textes proviennent du site "le livre scolaire" (https ://www.lelivrescolaire.fr). Ils ont aussi complété ce corpus en recherchant des articles Wikipedia liés à ces sujets scolaires. Ils les ont  filtrés en utilisant des API Wikipedia. Pour ne pas avoir des contenus trop gros, ils ont découpé les articles en ne conservant pas plus de trois paragraphes par document.
Ce corpus contient ainsi globalement 3.891 documents (dont 1.122 sont annotés), constitués de 14.433 paragraphes (dont 3.893 sont annotés). Ils ont ensuite procédé à des campagnes d’annotation sur la base des annotations suivantes :
(a) une question à poser;
(b) le type de la question qui peut-être factuelle, définition, cours ou synthèse;
(c) le support de la question, à savoir l’extrait du document à partir duquel la question est construite;
(d) les éléments de réponse, c’est à dire les passages permettant de répondre à la question;
(e) la réponse rédigée par l’annotateur, à partir des éléments précédents.
L’un de leurs objectifs principaux était de recueillir des questions requérant des niveaux d’expertise différents pour y répondre. Ce niveau de "difficulté" est lié au type de la question qui peut donc être :
 — factuelle : la réponse est un fait ou une liste de faits (événement, personne, lieu, date...);
 — définition : la réponse correspond à la définition d’un mot ou d’un concept;
 — cours: la réponse n’est pas réduite à un fait mais contient des explications ou des détails, qui doivent être explicites dans le document;
 — synthèse : la réponse s’appuie sur plusieurs éléments du document fournissant des informations diverses qui doivent être réunies ou impliquant une interprétation pour être produite.
 Les questions factuelles et définition sont assez simples à formuler et découlent directement du texte du document. Pour les questions de cours, elles sont un peu plus complexes et les réponses nécessitent plus de détails. La réponse aux questions de synthèse nécessite un raisonnement à partir du document




Bibliographie :

Gerald T., Tamames L., Ettayeb S., Paroubek P., and Vilnat A.. 2024. CQuAE : Un nouveau corpus de question-réponse pour l’enseignement. In Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position, pages 50–63, Toulouse, France. ATALA and AFPC.

Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A. N., Kaiser L. & Polosukhin I. 2017. Attention is all you need. In I. GUYON, U. VON LUXBURG, S. BENGIO, H. M. WALLACH, R. FERGUS, S. V. N. VISHWANATHAN & R. GARNETT, Éds., Advances in Neural Information Processing Systems 30 : Annual Conference on Neural Information Processing Systems 2017, December 4-9, 2017, Long Beach, CA, USA, p. 5998–6008.

📜 Licence : Creative Commons Attribution-NonCommercial 4.0 International





##Méthodologie

L'idée première du projet était de générer dans le domaine de l'éducation un quizz à partir d'un corpus de cours pour aider les élèves à réviser. Générer les questions et les réponses pour entrainer le modèle s'est avérée être une tâche trop ardue, ainsi Ashley et Soumia ont envisagé de changer de projet. La deuxième idée de projet a été de détecter des fake-news. Elles ont essayé de comparer deux modèles existants. Elles ont fait plusieurs essais. Toutefois ce dernier sujet leur paraissait trop simple. Elles ont préférés trouver des solutions sur le thème de l'éducation et l'assistante virtuelle aux devoirs.

Elles se sont réparties le travail de programmation et d'essais informatiques. Ashley a rencontré des difficultés pour trouver un modèle en français et un corpus français en lien avec les fakes news.
Finalement, Soumia a réussi à faire tourner un modèle en lien avec la première idée du projet.
Ashley et Soumia ont dû faire face à des inconvénients comme l’optimisation de des temps de calculs et des poids du modèles. Le modèle ne se sauvegardait pas correctement. Après plusieurs tentatives, elles ont trouvé la solution. En parallèle, elles ont essayé de finetuner un modèle pour classer les questions en fonction de leur difficulté : le modèle classait les questions, des plus simples aux plus complexes. Avec un corpus sous-dimensionné, la généralisation des résultats n'était pas satisfaisantes.


**Présentation du Dataset :**

Le dataset **CQuAE_synthetic** IA Extended est une extension du corpus original **CQuAE**  issue de la publication (Gerald et al., JEP/TALN/RECITAL 2024), enrichi par des questions générées automatiquement via GPT-4. Son objectif principal est d'élargir le volume de données d'entraînement pour les modèles spécialisés en question-réponse (QA) en français, en particulier dans le domaine éducatif.Chaque document dans le dataset est associé à quatre questions, chacune appartenant à une catégorie distincte, définie dans le cadre de CQuAE.
Le dataset est conçu pour entraîner et évaluer des modèles de question-réponse destinés à des applications éducatives en français.

**Structure du dataset**
Chaque entrée du dataset contient les champs suivants :

* `text (string)` : Le texte de référence sur lequel les questions sont basées.

* `qid (string/int) `: Identifiant unique de chaque question.

* `course / definition / factual / synthesis (dict) `:
Chaque type de question est stocké sous forme d’un dictionnaire contenant :
"question" : la question générée.
"answer" : la réponse associée.

L'entraînement du modèle BARThez a été effectué sur Google Colab, une plateforme cloud qui permet d'exécuter du code Python avec des ressources GPU et TPU. Afin d'optimiser la performance et d'accélérer le fine-tuning, nous avons souscrit à un abonnement Google Colab Pro, ce qui nous a permis d'accéder à un GPU NVIDIA L4.

L'implémentation de notre projet repose sur l'utilisation de **PyTorch** et de la bibliothèque **Transformers** de **Hugging Face** pour fine-tuner le modèle **BARThez** sur le dataset **CQuAE_synthetic** . Cette section détaille les étapes de l'installation, du prétraitement des données, de l'entraînement du modèle et de la génération automatique de questions.
* Instalation des dépendances , bibliothèques (`transformers datasets torch accelerate sentencepiece huggingface_hub`, `AutoTokenizer, AutoModelForSeq2SeqLM, TrainingArguments, Trainer load_dataset `)



**Pourquoi avoir utilisé BARThez ?**

Pour ce projet de génération automatique de questions en français, nous avons choisi d'utiliser BARThez, un modèle de type seq2seq (sequence-to-sequence) basé sur BART et pré-entraîné spécifiquement pour la langue française. Plusieurs raisons justifient ce choix:

* un modèle Encoder-Decoder : analyse le texte d'entrée `(le paragraphe du cours)`et
génère un texte en sortie `(une question cohérente basée sur le texte)`.

**💡 Pourquoi ne pas utiliser mBART ?**

Bien que **mBART** prenne en charge le français, il a été entraîné sur un corpus multilingue, ce qui réduit sa spécialisation pour une seule langue.


**BARThez**, bien qu'entraîné sur des corpus français généraux, n’était pas directement spécialisé pour la tâche de génération de questions éducatives. Nous avons donc réalisé un fine-tuning sur le dataset **CQuAE_synthetic**  pour adapter **BARThez** à notre tâche spécifique.


Préparation des données :

Chargement du dataset : Nous avons utilisé le dataset "LsTam/CQuAE_synthetic" de Hugging Face, qui contient des textes et des questions associées.

Traitement des données : Nous avons créé une fonction pour préparer les données. Cette fonction effectue plusieurs tâches importantes :

Elle extrait le contexte et l'identifiant de la question (QID) de chaque exemple.

Pour chaque type de question (définition, factuelle, synthèse), elle crée une entrée distincte.

Elle formate l'entrée en incluant des marqueurs spéciaux pour le type de question, le contexte et le QID.

Elle tokenize les entrées et les cibles (questions) en utilisant le tokenizer de BARThez.

Elle applique un padding et une troncature pour s'assurer que toutes les séquences ont la même longueur.

Elle prépare les labels en remplaçant les tokens de padding par -100 pour qu'ils soient ignorés lors du calcul de la perte.

Application de la préparation : Cette fonction de préparation est appliquée à l'ensemble du dataset d'entraînement, créant ainsi un dataset prêt pour l'entraînement du modèle.

Entraînement :

Configuration du modèle : Nous avons utilisé le modèle BARThez pré-entraîné, qui est une version française du modèle BART.

Configuration de l'entraînement : Nous avons défini les paramètres d'entraînement, incluant :

Le nombre d'époques (8)

La taille des batchs pour l'entraînement et l'évaluation

Les étapes de warmup et le taux de décroissance des poids

La stratégie d'évaluation et de sauvegarde

L'utilisation de la précision mixte (FP16) pour optimiser les performances

Initialisation du Trainer : Nous avons utilisé la classe Trainer de Hugging Face, qui gère l'entraînement et l'évaluation du modèle. Nous lui avons fourni le modèle, les arguments d'entraînement, les datasets d'entraînement et d'évaluation, ainsi que le tokenizer.

Entraînement : Le processus d'entraînement a été lancé, permettant au modèle d'apprendre à générer des questions à partir des contextes fournis.

Sauvegarde du modèle : Après l'entraînement, le modèle a été sauvegardé sur Google Drive pour une utilisation ultérieure.

##Résultats et Exemples

Nous avons inclus dans notre documentation un exemple d'utilisation de notre modèle afin d'illustrer son fonctionnement. Cependant, en raison d'un manque de mémoire GPU, de l'impossibilité de renouveler un abonnement à Google Colab Pro et du temps limité dont nous disposions, nous n'avons pas pu relancer l'entraînement du modèle ni effectuer une évaluation complète sur un corpus d’évaluation dédié. En effet nous avons lancé notre entrainement sur un corpus de train uniquement et nous nous sommes rendus compte en retard que nous aurons du également l'évaluer.

Nous avons donc choisi de montrer comment l’évaluation aurait pu être réalisée en appliquant notre modèle sur un exemple spécifique. Cet exemple permet malgré tout d'illustrer le processus de génération et d’évaluation, bien que les résultats ne reflètent pas une analyse complète sur l’ensemble du corpus d’évaluation.

### Explications des métriques BLEU, METEOR et ROUGE

**BLEU** : évalue la similarité des n-grams.

**METEOR** : métrique qui prend en compte les synonymes, les formes fléclies et l'ordre des mots

**ROUGE** : compare la structure globale

In [None]:
pip install transformers datasets torch evaluate rouge_score nltk

Collecting datasets
  Downloading datasets-3.3.2-py3-none-any.whl.metadata (19 kB)
Collecting evaluate
  Downloading evaluate-0.4.3-py3-none-any.whl.metadata (9.2 kB)
Collecting rouge_score
  Downloading rouge_score-0.1.2.tar.gz (17 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting dill<0.3.9,>=0.3.0 (from datasets)
  Downloading dill-0.3.8-py3-none-any.whl.metadata (10 kB)
Collecting xxhash (from datasets)
  Downloading xxhash-3.5.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (12 kB)
Collecting multiprocess<0.70.17 (from datasets)
  Downloading multiprocess-0.70.16-py311-none-any.whl.metadata (7.2 kB)
Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12=

In [None]:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, TrainingArguments, Trainer
from datasets import load_dataset
import torch
import evaluate

In [None]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Chargement du modèle et du tokenizer BARThez
model_path = "SOUMI23/generator_question_barthez"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForSeq2SeqLM.from_pretrained(model_path).to(device)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/1.37k [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/1.12M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/7.17M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/964 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/1.47k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/557M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/264 [00:00<?, ?B/s]

In [None]:
# Fonction pour générer des questions
def generate_multiple_questions(text, model, tokenizer, device, question_types=['definition', 'factual', 'synthesis']):
    questions = []

    # On vérifie que le texte n'est pas vide
    if not text.strip():
        return [(q_type, "Le texte est vide.") for q_type in question_types]

    for q_type in question_types:
        input_text = f"<type:{q_type}> Contexte: {text}"

        inputs = tokenizer(input_text, return_tensors="pt", max_length=512, truncation=True).to(device)

        with torch.no_grad():
            outputs = model.generate(
                **inputs,
                max_length=128,
                num_return_sequences=1,
                do_sample=True,
                top_k=50,
                top_p=0.95,
                temperature=0.7,
                no_repeat_ngram_size=2
            )

        generated_question = tokenizer.decode(outputs[0], skip_special_tokens=True).strip()
        if not generated_question:
            generated_question = "Aucune question générée."

        questions.append((q_type, generated_question))

    return questions

In [None]:
# Exemple d'utilisation
text = """
La pollution atmosphérique tue 5,5 millions de personnes par an dans le monde (dont 2,6 millions de décès indirects) selon des chiffres 2016 de la Banque mondiale: elle est devenue le quatrième facteur de décès prématuré sur Terre. Maladies cardiovasculaires, cancers des poumons, maladies pulmonaires chroniques, infections respiratoires... La pollution de l'air est coupable d'un décès sur dix dans le monde, six fois plus que le paludisme. La cause est l'Homme et son activité, par les industries, le trafic routier, les incinérateurs de déchets, le chauffage individuel et les centrales électriques aux combustibles fossiles. La pollution dans les villes provoque souvent un brouillard de polluants ou smog, souvent révélateurs de la densité de micro-particules et de l'impact du CO2 et autres polluants sur l'environnement.
"""
# Fonction pour générer des questions
def generate_multiple_questions(text, model, tokenizer, device, question_types=['definition', 'factual', 'synthesis']):
    questions = []

    # Vérifier si le texte est vide
    if not text.strip():
        return [(q_type, "Aucune question générée : texte vide.") for q_type in question_types]

    for q_type in question_types:
        input_text = f"<type:{q_type}> Contexte: {text}"

        inputs = tokenizer(input_text, return_tensors="pt", max_length=512, truncation=True).to(device)

        with torch.no_grad():
            outputs = model.generate(
                **inputs,
                max_length=128,
                num_return_sequences=1,
                do_sample=True,
                top_k=50,
                top_p=0.95,
                temperature=0.7,
                no_repeat_ngram_size=2
            )

        generated_question = tokenizer.decode(outputs[0], skip_special_tokens=True).strip()
        if not generated_question:
            generated_question = "Aucune question générée."

        questions.append((q_type, generated_question))

    return questions

In [None]:
# Exemple d'utilisation
text = """
La pollution atmosphérique tue 5,5 millions de personnes par an dans le monde (dont 2,6 millions de décès indirects) selon des chiffres 2016 de la Banque mondiale: elle est devenue le quatrième facteur de décès prématuré sur Terre. Maladies cardiovasculaires, cancers des poumons, maladies pulmonaires chroniques, infections respiratoires... La pollution de l'air est coupable d'un décès sur dix dans le monde, six fois plus que le paludisme. La cause est l'Homme et son activité, par les industries, le trafic routier, les incinérateurs de déchets, le chauffage individuel et les centrales électriques aux combustibles fossiles. La pollution dans les villes provoque souvent un brouillard de polluants ou smog, souvent révélateurs de la densité de micro-particules et de l'impact du CO2 et autres polluants sur l'environnement.
"""

# Génération des questions
generated_questions = generate_multiple_questions(text, model, tokenizer, device)

In [None]:
# Affichage des questions générées
for q_type, question in generated_questions:
    print(f"{q_type.capitalize()} question: {question}")

Definition question: Qu'est-ce que le brouillard de polluants?
Factual question: Combien de personnes sont mortes de la pollution atmosphérique chaque année dans le monde?
Synthesis question: Quels sont les impacts de la pollution atmosphérique sur l'environnement et les populations locales?


In [None]:
# Chargement des métriques BLEU, METEOR et ROUGE
bleu = evaluate.load("bleu")
meteor = evaluate.load("meteor")
rouge = evaluate.load("rouge")

def compute_bleu(generated_questions, reference_questions):
    formatted_references = [[ref] for ref in reference_questions]
    results = bleu.compute(predictions=generated_questions, references=formatted_references)
    return results["bleu"]

def compute_meteor(generated_questions, reference_questions):
    formatted_references = [[ref] for ref in reference_questions]
    results = meteor.compute(predictions=generated_questions, references=formatted_references)
    return results["meteor"]

def compute_rouge(generated_questions, reference_questions):
    formatted_references = [[ref] for ref in reference_questions]
    results = rouge.compute(predictions=generated_questions, references=formatted_references)
    return results["rougeL"]

# Exemple de références
reference_questions = [
    "Quelles sont les conséquences de la pollution atmosphérique ?",
    "Quel est l'impact du CO2 sur l'environnement ?",
    "Pourquoi la pollution est-elle considérée comme un facteur de décès prématuré ?"
]

# On extrait les questions générées
generated_only = [question for _, question in generated_questions]

# Calcul des scores BLEU, METEOR et ROUGE
bleu_score = compute_bleu(generated_only, reference_questions)
meteor_score = compute_meteor(generated_only, reference_questions)
rouge_score = compute_rouge(generated_only, reference_questions)

print(f"BLEU Score : {bleu_score:.4f}")
print(f"METEOR Score : {meteor_score:.4f}")
print(f"ROUGE-L Score : {rouge_score:.4f}")


Downloading builder script:   0%|          | 0.00/5.94k [00:00<?, ?B/s]

Downloading extra modules:   0%|          | 0.00/1.55k [00:00<?, ?B/s]

Downloading extra modules:   0%|          | 0.00/3.34k [00:00<?, ?B/s]

Downloading builder script:   0%|          | 0.00/7.02k [00:00<?, ?B/s]

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt_tab.zip.
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...


Downloading builder script:   0%|          | 0.00/6.27k [00:00<?, ?B/s]

BLEU Score : 0.0000
METEOR Score : 0.1615
ROUGE-L Score : 0.0774


### Interprétation des résultats

La métrique **BLEU** n'est pas la plus adaptée car le modèle ne génère pas exactement la meme question, ce qui n'est pa sun poitn négatif car il génère tout de même des questions pertinentes.

La métrique **METEOR** détecte une certaine similarité car celle ci prend en compte les synonymes. Le modèle reformule pas mal les questions.

La métrique **ROUGE** montre que les questions générées utilisent des mots très différents que les références avec un score très bas.

# **Interface**

## Description du système

L'interface repose sur du HTML et du CSS.
Elle communique avec une API en FastAPI.

index.hmtl : page principale de l'interface  
style.css : style de la page

Fonctionnalités principales :

- Remplissage du texte à traiter par l'utilisateur
- Choix du type de questions (définition, factuel, synthèse)
- Le modèle génère les questions

L'interface contient :
- un champ "textarea" où l'utilisateur peut coller le texte sur lequel il veut générer des questions
- une liste de choix de type de questions
  -  défintion,
  - factuel,
  - synthèse
- un bouton de soumission "générer"
- un espace d'affichage des questions générées

## Implémentation

Le fichier api.py contient :

- L'initialisation de l'**API** avec **FastAPI**
- La configuration de **CORS** pour permettre les requêtes du **frontend**
- Le chargement du **modèle** et du **tokenizer** via Hugging Face
- Une fonction de **découpage en phrases** pour améliorer la précision des questions générées
- Une fonction de **génération de questions** en fonction des **types demandés**
- Un **endpoint POST** qui prend un texte et renvoie des questions générées
- Un **endpoint GET** pour tester si l’API est en ligne

Le fichier index.html contient :
- Un &lt;**body**&gt; pour la structure principale
- Un &lt;**textarea**&gt; pour entrer du texte
- Un &lt;**input type="checkbox**"&gt; pour sélectionner le type de questions
- Un &lt;**button**&gt; pour envoyer la demande
- Une &lt;**div**&gt; pour afficher le résultat


Le fichier style.css contient :  
- **body** : style du contenu  
- **.container** : cadre blanc centré
- **textarea** : style de la zone de texte
- **.checkbox-title** : mise en forme du titre des types de questions
- **.checkbox** : cases à cocher
- **button** : style du bouton "générer"
- **.result** : cadre du résultat
- **.question** : style des questions


## Résultats

Lorsque l'utilisateur rentre un texte dans le champ de saisie, une fois avoir défini le type de questions qu'il souhaite, il peut appuyer sur le bouton "générer". Ansi les questions s'afficheront sous cette forme :
![Description de l’image](image.png)



## Améliorations possibles

Pour améliorer ce projet, nous aurions pu tout d'abord l'évaluer suite au finet-tuning. Nous aurions également pu, utiliser une méthode plus poussée telle que la similarité sémantique afin de voir si nos questions ont du sens. Nous aurions pu intégrer du JavaScript afin de rendre l’interface plus dynamique. Par exemple, l’ajout d’une barre de progression aurait permis d’indiquer visuellement que le modèle est en cours de chargement, afin d'offir un meilleur retour utilisateur, notamment lorsque le traitement prend du temps. Nous aurions également pu modifier certains paramètres afin d'augmenter la vitesse du modèle.

Pour conclure nos résultats semblent globalement satisfaisants, le modèle fonctionne plutôt bien malgré quelles erreurs dans les questions générées avec des questions parfois inutiles.