In [6]:
# ----- Extraction PDF et d√©coupage du texte -----

from pypdf import PdfReader

# Fonction pour extraire le texte de chaque page d‚Äôun PDF
def extract_text_from_pdf(file_path):
    reader = PdfReader(file_path)
    return " ".join(page.extract_text() or "" for page in reader.pages)

# Fonction pour d√©couper le texte en morceaux de taille raisonnable
def split_text(text, max_length=500):
    sentences = text.split(". ")
    chunks, chunk = [], ""
    for sentence in sentences:
        if len(chunk) + len(sentence) < max_length:
            chunk += sentence + ". "
        else:
            chunks.append(chunk.strip())
            chunk = sentence + ". "
    if chunk:
        chunks.append(chunk.strip())
    return chunks

# Nettoie les caract√®res ind√©sirables dans un morceau de texte
def clean_chunk(chunk):
    return chunk.replace("\xa0", " ").replace("\n", " ").strip()

In [7]:
# üìÑ Lecture du PDF et pr√©paration des chunks
pdf_path = "data/loups_garous.pdf"
raw_text = extract_text_from_pdf(pdf_path)  # Extraction du texte brut
chunks = split_text(raw_text)               # D√©coupage en morceaux exploitables
print(f"‚úÖ {len(chunks)} morceaux extraits.")  # Affichage du nombre de morceaux extraits

‚úÖ 40 morceaux extraits.


In [8]:
# üî° Embedding des textes + FAISS
from sentence_transformers import SentenceTransformer
import faiss
import numpy as np

# Chargement du mod√®le d'embedding multilingue
embedder = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
corpus_embeddings = embedder.encode(chunks, convert_to_numpy=True)  # Vectorisation des chunks

# Cr√©ation de l'index FAISS pour la recherche rapide par similarit√©
index = faiss.IndexFlatL2(corpus_embeddings.shape[1])
index.add(corpus_embeddings)  # Ajout des embeddings √† l'index

In [10]:
# ü§ñ Chargement du mod√®le de g√©n√©ration de texte
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_name = "Qwen/Qwen3-0.6B"  # Mod√®le l√©ger pour des r√©ponses rapides
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name, 
    torch_dtype=torch.float16,      # Utilisation de la m√©moire optimis√©e
    device_map="auto"               # Utilise automatiquement le GPU si dispo
)

In [11]:
import gradio as gr

# Fonction principale : g√©n√®re une r√©ponse √† partir d‚Äôune question
def generate_response(question):
    # Recherche des morceaux de texte les plus pertinents (top 5)
    q_embedding = embedder.encode([question], convert_to_numpy=True)
    D, I = index.search(q_embedding, k=5)
    
    # Nettoyage et assemblage du contexte extrait
    top_chunks = [clean_chunk(chunks[i]) for i in I[0]]
    context = " ".join(top_chunks)
    
    # Prompt envoy√© au mod√®le : consignes + contexte + question
    prompt = f"""
Tu es un expert des r√®gles de jeux de soci√©t√©. Ci-dessous se trouve un extrait du manuel de r√®gles.

Contexte extrait du manuel :
{context}

Question pos√©e par un joueur :
{question}

R√©ponds pr√©cis√©ment et clairement en te basant uniquement sur ce contexte. Si la r√©ponse n‚Äôest pas dans le texte, indique-le poliment. Sois p√©dagogique et clair.
"""
    # Encodage du prompt pour le mod√®le
    inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=2048).to(model.device)

    # G√©n√©ration de la r√©ponse sans apprentissage (inf√©rence)
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=200,      # Limite la longueur de la r√©ponse
            temperature=0.7,         # Cr√©ativit√© mod√©r√©e
            top_p=0.9,               # Nucleus sampling
            do_sample=True,          # G√©n√©ration al√©atoire
            num_beams=1              # Pas de recherche faisceau (plus rapide)
        )
    
    # D√©codage du texte g√©n√©r√© + r√©cup√©ration des chunks utilis√©s
    response = tokenizer.decode(outputs[0][inputs.input_ids.shape[1]:], skip_special_tokens=True)
    used_chunks = "\n\n".join(f"[Chunk {i+1}]\n{chunks[i]}" for i in I[0])
    
    return response.strip(), used_chunks

# üîß Interface Gradio adapt√©e √† la consultation de r√®gles
iface = gr.Interface(
    fn=generate_response,
    inputs=gr.Textbox(lines=2, placeholder="Exemple : Que se passe-t-il si deux joueurs ont le m√™me nombre de votes ?", label="Question sur une r√®gle du jeu"),
    outputs=[
        gr.Textbox(label="R√©ponse claire √† votre question"),                    # R√©ponse g√©n√©r√©e
        gr.Textbox(label="Extraits du manuel utilis√©s (pour transparence)")    # Chunks utilis√©s
    ],
    title="Assistant R√®gles - Jeu de Soci√©t√©",
    description="Posez une question sur une r√®gle que vous ne comprenez pas, et l'assistant vous explique simplement √† partir du manuel."
)

iface.launch()  # Lancement de l'application Gradio

* Running on local URL:  http://127.0.0.1:7861
* To create a public link, set `share=True` in `launch()`.


