# ü§ñ Syst√®me RAG Complet avec Mistral AI

Chatbot conversationnel avec recherche s√©mantique et g√©n√©ration de r√©ponses via **Mistral LLM**.

**√âtapes :**

1. Chargement du syst√®me RAG
2. Configuration du LLM Mistral
3. Tests conversationnels
4. √âvaluation qualitative


## 1Ô∏è‚É£ Configuration


In [1]:
import json
import numpy as np
from pathlib import Path
from typing import List, Dict

import faiss
from mistralai import Mistral

from src.config.constants import PROCESSED_DATA_DIR
from src.config.settings import settings

print("‚úÖ Configuration OK")
print(f"üß† Provider : {settings.embedding_provider}")
print(f"üí¨ LLM : {settings.llm_model}")

‚úÖ Configuration OK
üß† Provider : mistral
üí¨ LLM : mistral-small-latest


## 2Ô∏è‚É£ Syst√®me RAG avec Mistral


In [None]:
# Importer la classe d'embeddings du notebook 03
from mistralai import Mistral
from sentence_transformers import SentenceTransformer


class EmbeddingGenerator:
    """G√©n√©rateur d'embeddings unifi√© (copi√© du notebook 03)."""

    def __init__(self, provider: str = None, model_name: str = None, api_key: str = None):
        self.provider = provider or settings.embedding_provider
        self.model_name = model_name or settings.embedding_model

        if self.provider == "mistral":
            if not api_key and not settings.mistral_api_key:
                raise ValueError("Mistral API key required")
            self.client = Mistral(api_key=api_key or settings.mistral_api_key)
            self.dimension = 1024
        else:
            self.model = SentenceTransformer(self.model_name)
            self.dimension = self.model.get_sentence_embedding_dimension()

    def encode_single(self, text: str) -> np.ndarray:
        """Encode un seul texte."""
        if self.provider == "mistral":
            response = self.client.embeddings.create(model=self.model_name, inputs=[text])
            return np.array([response.data[0].embedding], dtype=np.float32)
        else:
            return self.model.encode([text], convert_to_numpy=True)


print("‚úÖ Classe EmbeddingGenerator d√©finie")

‚úÖ Classe EmbeddingGenerator d√©finie


In [4]:
class MistralEventsRAG:
    """Syst√®me RAG pour √©v√©nements avec Mistral AI."""

    def __init__(self):
        print("üîÑ Initialisation du syst√®me RAG...")

        # Chemins
        index_dir = PROCESSED_DATA_DIR / "faiss_index"

        # Charger configuration
        with open(index_dir / "config.json", "r") as f:
            self.config = json.load(f)

        # Charger index FAISS
        self.index = faiss.read_index(str(index_dir / "events.index"))
        print(f"  ‚úÖ Index FAISS charg√© ({self.index.ntotal} vecteurs)")

        # Charger documents
        documents_path = PROCESSED_DATA_DIR / "rag_documents.json"
        with open(documents_path, "r", encoding="utf-8") as f:
            self.documents = json.load(f)
        print(f"  ‚úÖ {len(self.documents)} documents charg√©s")

        # Charger g√©n√©rateur d'embeddings
        self.embedding_generator = EmbeddingGenerator()
        print(f"  ‚úÖ G√©n√©rateur d'embeddings charg√©")

        # Charger client Mistral pour le LLM
        self.mistral_client = Mistral(api_key=settings.mistral_api_key)
        print(f"  ‚úÖ Client Mistral LLM charg√©")

        print("\n‚úÖ Syst√®me RAG pr√™t !")

    def search(self, query: str, top_k: int = 5) -> List[Dict]:
        """Recherche s√©mantique d'√©v√©nements."""

        # Encoder la requ√™te
        query_embedding = self.embedding_generator.encode_single(query)
        faiss.normalize_L2(query_embedding)

        # Recherche
        distances, indices = self.index.search(query_embedding, top_k)

        # Formater les r√©sultats
        results = []
        for idx, dist in zip(indices[0], distances[0]):
            doc = self.documents[idx]
            results.append(
                {"document": doc, "similarity": float(1 - dist), "distance": float(dist)}
            )

        return results

    def generate_response(self, query: str, results: List[Dict]) -> str:
        """G√©n√®re une r√©ponse conversationnelle avec Mistral LLM."""

        if not results:
            return "Je n'ai trouv√© aucun √©v√©nement correspondant √† votre recherche. Pouvez-vous reformuler ou pr√©ciser votre demande ?"

        # Construire le contexte pour le LLM
        context = "Voici les √©v√©nements pertinents :\n\n"
        for i, result in enumerate(results, 1):
            doc = result["document"]
            context += f"√âv√©nement {i}:\n{doc['content']}\n\n"

        # Prompt pour le LLM
        system_prompt = """Tu es un assistant sp√©cialis√© dans la recommandation d'√©v√©nements culturels.
Ton r√¥le est d'aider les utilisateurs √† trouver des √©v√©nements qui correspondent √† leurs int√©r√™ts.
R√©ponds de mani√®re naturelle, conviviale et concise en fran√ßais.
Base tes r√©ponses uniquement sur les √©v√©nements fournis dans le contexte."""

        user_prompt = f"""Question de l'utilisateur : {query}

{context}

R√©ponds √† la question de l'utilisateur en te basant sur ces √©v√©nements.
Pr√©sente 2-3 √©v√©nements maximum de mani√®re attrayante avec :
- Le titre
- La ville
- Une br√®ve description
- Le lien si disponible

Sois concis et engageant."""

        # Appel √† Mistral LLM
        response = self.mistral_client.chat.complete(
            model=settings.llm_model,
            messages=[
                {"role": "system", "content": system_prompt},
                {"role": "user", "content": user_prompt},
            ],
            temperature=settings.llm_temperature,
            max_tokens=settings.max_tokens,
        )

        return response.choices[0].message.content

    def chat(self, query: str, top_k: int = 5) -> str:
        """Interface conversationnelle compl√®te."""
        results = self.search(query, top_k)
        return self.generate_response(query, results)


# Initialiser le syst√®me
print("üöÄ Initialisation...\n")
rag = MistralEventsRAG()

üöÄ Initialisation...

üîÑ Initialisation du syst√®me RAG...
  ‚úÖ Index FAISS charg√© (497 vecteurs)
  ‚úÖ 497 documents charg√©s
  ‚úÖ G√©n√©rateur d'embeddings charg√©
  ‚úÖ Client Mistral LLM charg√©

‚úÖ Syst√®me RAG pr√™t !


## 3Ô∏è‚É£ Tests Conversationnels


In [5]:
# Test 1 : Recherche par type
print("üí¨ User: Je cherche des concerts de jazz\n")
response = rag.chat("concerts de jazz")
print(f"ü§ñ Assistant:\n{response}")
print("\n" + "=" * 80 + "\n")

üí¨ User: Je cherche des concerts de jazz

ü§ñ Assistant:
Voici quelques concerts de jazz qui pourraient t'int√©resser :

1. **Concert au mus√©e Cantini avec Oliver Foster**
   - **Ville** : Marseille
   - **Description** : Un concert intimiste au mus√©e Cantini, parfait pour les amateurs de jazz.
   - **Date** : 17/05/2025 de 17:00 √† 20:00

2. **Black sound tricks & Friends**
   - **Ville** : Marseille
   - **Description** : Un √©v√©nement festif pour la F√™te de la Musique 2025, avec une programmation √©clectique.
   - **Date** : 21/06/2025 de 10:00 √† 22/06/2025 √† 00:00

Profite bien de ces moments musicaux !




In [6]:
# Test 2 : Recherche par ville
print("üí¨ User: Quels √©v√©nements √† Marseille ce week-end ?\n")
response = rag.chat("√©v√©nements √† Marseille")
print(f"ü§ñ Assistant:\n{response}")
print("\n" + "=" * 80 + "\n")

üí¨ User: Quels √©v√©nements √† Marseille ce week-end ?

ü§ñ Assistant:
Voici quelques √©v√©nements √† ne pas manquer √† Marseille :

1. **"Si Victor m'√©tait cont√©"**
   - **Date** : Du 20/09/2025 √† 18:30 au 21/09/2025 √† 16:30
   - **Description** : Plongez dans un spectacle captivant m√™lant contes, l√©gendes chevaleresques, chants gr√©goriens et lyriques, danses et apparitions fantomatiques. Un voyage √† travers quinze si√®cles d'histoire m√©diterran√©enne.
   - **Adresse** : Place Saint-Victor, 13007 Marseille, France

2. **"√Ä la rencontre de celles et ceux qui r√©inventent la Citadelle de Marseille"**
   - **Date** : Du 20/09/2025 √† 10:00 au 21/09/2025 √† 16:00
   - **Description** : D√©couvrez les projets innovants qui animent le fort Saint-Nicolas lors des Journ√©es Europ√©ennes du Patrimoine 2025.
   - **Adresse** : Mont√©e du Souvenir Fran√ßais, 13007 Marseille

3. **"Veill√©e de paroles et musiques"**
   - **Date** : Du 21/07/2025 √† 07:30 au 31/07/2025 √† 15:30
   - *

In [7]:
# Test 3 : Recherche pour enfants
print("üí¨ User: Des activit√©s cr√©atives pour mes enfants\n")
response = rag.chat("activit√©s cr√©atives pour enfants")
print(f"ü§ñ Assistant:\n{response}")
print("\n" + "=" * 80 + "\n")

üí¨ User: Des activit√©s cr√©atives pour mes enfants

ü§ñ Assistant:
Voici quelques activit√©s cr√©atives pour enfants √† Marseille :

1. **Atelier pratiques artistiques**
   - **Ville** : Marseille
   - **Description** : Un projet de sensibilisation et d'exp√©rimentation autour de la peinture et du volume avec l'argile, sp√©cialement con√ßu pour les enfants.
   - **Adresse** : 5 Traverse Paul Converset 13014 Marseille

2. **Rouvrir le monde / Cadavre exquis anim√© / Clara Buffey**
   - **Ville** : Marseille
   - **Description** : Une exp√©rience collaborative o√π les enfants cr√©ent ensemble un court m√©trage d'animation en combinant leurs dessins individuels.
   - **Adresse** : 7 Rue Pascal Posado, 13015 Marseille

3. **Ateliers d'√©criture cr√©ative avec le Labo des histoires**
   - **Ville** : Marseille
   - **Description** : Des ateliers d'√©criture cr√©ative pour les enfants, organis√©s en collaboration avec le Labo des histoires et l'auteur dramaturge Lionel Parrini.
   - **Ad

In [8]:
# Test 4 : Recherche culturelle
print("üí¨ User: Je m'int√©resse √† l'art contemporain\n")
response = rag.chat("expositions art contemporain")
print(f"ü§ñ Assistant:\n{response}")
print("\n" + "=" * 80 + "\n")

üí¨ User: Je m'int√©resse √† l'art contemporain

ü§ñ Assistant:
Voici quelques expositions d'art contemporain √† ne pas manquer √† Marseille :

1. **Exposition d'art contemporain**
   - **Ville** : Marseille
   - **Description** : D√©couvrez une galerie d'art contemporain avec un showroom permanent pr√®s du Vieux-Port. La galerie abrite √©galement un atelier d'artistes.
   - **Adresse** : 25, cours d'Estienne d'Orves 13001 Marseille

2. **Friche la Belle de Mai : Les expositions d'art contemporain**
   - **Ville** : Marseille
   - **Description** : Plongez dans l'univers de Madison Bycroft avec l'exposition ¬´ Les mensonges du m√©t√©orologue ¬ª.
   - **Adresse** : 41 rue Jobin 13003 Marseille

3. **Exposition "Hors Site (mais pas hors sol)"**
   - **Ville** : Marseille
   - **Description** : Une exposition fascinante sur la pr√©fabrication en architecture.
   - **Adresse** : 12 boulevard Th√©odore Thurner 13006 Marseille

Profitez de ces √©v√©nements culturels pour explorer l'art con

In [9]:
# Test 5 : Recherche gratuite
print("üí¨ User: Des √©v√©nements gratuits ce week-end\n")
response = rag.chat("√©v√©nements gratuits")
print(f"ü§ñ Assistant:\n{response}")
print("\n" + "=" * 80 + "\n")

üí¨ User: Des √©v√©nements gratuits ce week-end

ü§ñ Assistant:
Voici quelques √©v√©nements gratuits √† ne pas manquer √† Marseille :

1. **Les expositions en acc√®s libre tout le weekend**
   - **Ville** : Marseille
   - **Description** : Profitez d'un acc√®s gratuit aux expositions du J4 et du Fort Saint-Jean, comme ¬´ Lire le ciel ¬ª et ¬´ Amazighes ¬ª.
   - **Date** : Du 20/09/2025 √† 08:00 au 21/09/2025 √† 17:00

2. **Visites guid√©es gratuites √† la d√©couverte du CICRP**
   - **Ville** : Marseille
   - **Description** : D√©couvrez les b√¢timents et les ateliers de restauration du Centre Interdisciplinaire de Conservation et de Restauration du Patrimoine.
   - **Date** : Du 20/09/2025 √† 07:30 au 20/09/2025 √† 14:00

3. **Veill√©e de paroles et musiques**
   - **Ville** : Marseille
   - **Description** : Une veill√©e partag√©e avec le collectif Transbordeur pour un voyage √† la rencontre des habitants d'un quartier.
   - **Date** : Du 21/07/2025 √† 07:30 au 31/07/2025 √† 15:30


## 4Ô∏è‚É£ Interface Interactive


In [10]:
from IPython.display import display, Markdown, clear_output
import ipywidgets as widgets

# Cr√©er l'interface
query_input = widgets.Text(
    placeholder="Posez votre question...",
    description="Question:",
    layout=widgets.Layout(width="80%"),
)

search_button = widgets.Button(description="üîç Rechercher", button_style="primary")

output_area = widgets.Output()


def on_search_click(b):
    with output_area:
        clear_output()
        query = query_input.value

        if query:
            print(f"üí¨ Recherche : {query}\n")
            print("‚è≥ G√©n√©ration de la r√©ponse...\n")

            response = rag.chat(query, top_k=5)
            print("ü§ñ Assistant :")
            display(Markdown(response))
        else:
            print("‚ö†Ô∏è Veuillez saisir une question")


search_button.on_click(on_search_click)

# Afficher l'interface
display(
    widgets.VBox(
        [
            widgets.HTML("<h2>ü§ñ Assistant √âv√©nements Mistral</h2>"),
            query_input,
            search_button,
            output_area,
        ]
    )
)

VBox(children=(HTML(value='<h2>ü§ñ Assistant √âv√©nements Mistral</h2>'), Text(value='', description='Question:', ‚Ä¶

## 5Ô∏è‚É£ M√©triques de Performance


In [12]:
import time

# Benchmark end-to-end
queries = [
    "concert jazz",
    "expo art",
    "th√©√¢tre enfants",
]

times = []
for query in queries:
    print(f"‚è±Ô∏è Test : {query}")
    start = time.time()
    _ = rag.chat(query)
    elapsed = time.time() - start
    times.append(elapsed)
    print(f"   ‚Üí {elapsed:.2f}s\n")

print("\n‚ö° Performance syst√®me complet :")
print(f"  Temps moyen : {np.mean(times):.2f} s")
print(f"  Temps min : {min(times):.2f} s")
print(f"  Temps max : {max(times):.2f} s")

‚è±Ô∏è Test : concert jazz
   ‚Üí 2.34s

‚è±Ô∏è Test : expo art
   ‚Üí 2.54s

‚è±Ô∏è Test : th√©√¢tre enfants
   ‚Üí 2.02s


‚ö° Performance syst√®me complet :
  Temps moyen : 2.30 s
  Temps min : 2.02 s
  Temps max : 2.54 s


## ‚úÖ R√©sum√©

### Points forts du syst√®me

‚úÖ **Embeddings Mistral** : Vecteurs de haute qualit√© (1024 dimensions)  
‚úÖ **LLM Mistral** : R√©ponses naturelles et contextuelles  
‚úÖ **Recherche s√©mantique** : Pertinence √©lev√©e  
‚úÖ **API unique** : Un seul provider pour tout le pipeline

### Avantages Mistral AI

- üá´üá∑ Optimis√© pour le fran√ßais
- üöÄ R√©ponses rapides et coh√©rentes
- üîí H√©bergement europ√©en (conformit√© RGPD)
- üí∞ Tarification comp√©titive
