In [None]:
### Import
import os
import sys
import numpy as np
import logging
from dotenv import load_dotenv
from typing import cast

# Configuration logging
logging.basicConfig(level=logging.INFO, format='%(levelname)s: %(message)s')

# Load environment variables from .env file
load_dotenv()

from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_mistralai import MistralAIEmbeddings, ChatMistralAI
from langchain_community.vectorstores import FAISS
from langchain_classic.chains.retrieval import create_retrieval_chain
from langchain_classic.chains.combine_documents import create_stuff_documents_chain
from langchain_core.prompts import ChatPromptTemplate

sys.path.insert(0, '/Users/xaviercoulon/Documents/OC/OC_P7_POC_RAG')
from openagenda_fetch import fetch_all_events, BASE_URL
from utils import event_to_langchain_document, invoke_rag_with_retry, invoke_with_intent_routing
from query_classifier import classify_query_intent, INTENT_RAG, INTENT_CHAT

# Configuration API
MISTRAL_API_KEY = cast(str, os.getenv("MISTRAL_API_KEY"))
if not MISTRAL_API_KEY:
	raise ValueError("MISTRAL_API_KEY environment variable not set")

print("‚úÖ Tous les imports charg√©s avec succ√®s")

‚úÖ Tous les imports charg√©s avec succ√®s


In [2]:
# Fetch all events et cr√©er les LangChain Documents optimis√©s
events = fetch_all_events(BASE_URL)
print(f"Total events fetched: {len(events)}")

# Convertir les events en LangChain Documents optimis√©s
documents = [event_to_langchain_document(event) for event in events]
print(f"Total documents created: {len(documents)}")
print(f"Sample metadata keys: {list(documents[0].metadata.keys())}")


Total events fetched: 699
Total documents created: 699
Sample metadata keys: ['uid', 'slug', 'canonicalurl', 'location_city', 'location_department', 'location_region', 'location_address', 'location_postalcode', 'firstdate_begin', 'firstdate_end', 'lastdate_begin', 'lastdate_end', 'originagenda_title', 'originagenda_uid', 'age_min', 'age_max']


In [3]:
# Chunking, embedding et FAISS avec LangChain - Optimal setup

splitter = RecursiveCharacterTextSplitter(
	chunk_size=500,
	chunk_overlap=50,
	separators=["\n\n", "\n", ".", " ", ""],
)

# Split les documents
split_documents = splitter.split_documents(documents)
print(f"Total chunks created: {len(split_documents)}")

# Initialiser les embeddings Mistral
embeddings = MistralAIEmbeddings(
	model="mistral-embed",
	api_key=MISTRAL_API_KEY
)

# 3. Vector store FAISS (cosine auto-g√©r√©)
vector_store = FAISS.from_documents(
    documents=split_documents,
    embedding=embeddings,
    distance_strategy="COSINE",  # rend ton flow propre et explicite
)

print("‚úì FAISS index created")
print("‚úì Distance: cosine similarity (0-1)")
print(f"‚úì Total vectors: {vector_store.index.ntotal}")

Total chunks created: 1629


  from .autonotebook import tqdm as notebook_tqdm
INFO: HTTP Request: HEAD https://huggingface.co/mistralai/Mixtral-8x7B-v0.1/resolve/main/tokenizer.json "HTTP/1.1 307 Temporary Redirect"
INFO: HTTP Request: HEAD https://huggingface.co/mistralai/Mixtral-8x7B-v0.1/resolve/main/tokenizer.json "HTTP/1.1 307 Temporary Redirect"
INFO: HTTP Request: HEAD https://huggingface.co/api/resolve-cache/models/mistralai/Mixtral-8x7B-v0.1/fc7ac94680e38d7348cfa806e51218e6273104b0/tokenizer.json "HTTP/1.1 200 OK"
INFO: HTTP Request: HEAD https://huggingface.co/api/resolve-cache/models/mistralai/Mixtral-8x7B-v0.1/fc7ac94680e38d7348cfa806e51218e6273104b0/tokenizer.json "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 429 Too Many Requests"
INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 429 Too Many Requests"
INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/emb

‚úì FAISS index created
‚úì Distance: cosine similarity (0-1)
‚úì Total vectors: 1629


In [4]:
# Recherche s√©mantique avec LangChain - Cosine similarity optimis√©e
query = "Quels √©v√©nements sur la cuisine √† Bayonne ?"

# Recherche de similarit√© avec cosine (normalis√©e)
results = vector_store.similarity_search_with_score(query, k=5)

print(f"\nTop 5 results for query: '{query}'")

for i, (doc, score) in enumerate(results):
    similarity_percent = (
        1 - score
    ) * 100  # score = distance ‚Üí on convertit pour lisibilit√©

    print(f"--- Result {i+1} (Cosine Similarity: {similarity_percent:.1f}%) ---")
    print(f"Title: {doc.metadata.get('slug')}")
    print(f"City: {doc.metadata.get('location_city')}")
    print(f"Department: {doc.metadata.get('location_department')}")
    print(f"Date: {doc.metadata.get('firstdate_begin')}")
    print(f"Content: {doc.page_content[:250]}...\n")

INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 429 Too Many Requests"
INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 429 Too Many Requests"
INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 429 Too Many Requests"
INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 200 OK"



Top 5 results for query: 'Quels √©v√©nements sur la cuisine √† Bayonne ?'
--- Result 1 (Cosine Similarity: 55.3%) ---
Title: le-secteur-de-lhotellerie-restauration-vous-interesse-participez-a-latelier-de-detection-de-potentiels-9363036
City: Bayonne
Department: Pyr√©n√©es-Atlantiques
Date: 2025-03-13 14:15:00+00:00
Content: . A l'issue de cette d√©tection de potentiel vous aurez l‚Äôopportunit√© de rencontrer les acteurs du secteur lors du job dating H√¥tellerie Caf√© Restaurant le m√™me jour √† la CCI de Bayonne ‚Äì Pays Basque Rendez-vous √† la CCI Bayonne Pays Basque le 13/03 √†...

--- Result 2 (Cosine Similarity: 55.3%) ---
Title: le-secteur-de-lhotellerie-restauration-vous-interesse-participez-a-latelier-de-detection-de-potentiels-6108864
City: Bayonne
Department: Pyr√©n√©es-Atlantiques
Date: 2025-03-13 14:15:00+00:00
Content: . A l'issue de cette d√©tection de potentiel vous aurez l‚Äôopportunit√© de rencontrer les acteurs du secteur lors du job dating H√¥tellerie Caf√© Restaur

In [5]:
# Setup LLM Mistral et RAG chain
llm = ChatMistralAI(
    api_key=MISTRAL_API_KEY, model_name="mistral-small-latest", temperature=0.3
)

# D√©finir le prompt - AM√âLIOR√â pour mieux g√©rer les cas limites
template = """Tu es un assistant expert en √©v√©nements fran√ßais.

IMPORTANT:
- Utilise TOUT le contexte fourni pour r√©pondre
- Si tu trouves des √©v√©nements partiellement pertinents, mentionne-les quand m√™me
- Sois exhaustif dans tes r√©ponses
- Propose des √©v√©nements similaires si l'exact n'existe pas

Contexte fourni (√©v√©nements):
{context}

Question de l'utilisateur: {input}

R√©ponds en d√©tail sur la base du contexte. Si vraiment aucun √©v√©nement ne correspond, dis "Je n'ai pas trouv√© d'√©v√©nement exactement correspondant, mais voici ce qui pourrait vous int√©resser..." et sugg√®re les plus proches."""

prompt = ChatPromptTemplate.from_template(template)

# Cr√©er la cha√Æne de combinaison des documents
stuff_chain = create_stuff_documents_chain(llm, prompt)

# Cr√©er la cha√Æne RAG compl√®te - AM√âLIOR√â : augmenter k √† 5 ou 6
rag_chain = create_retrieval_chain(
    retriever=vector_store.as_retriever(search_kwargs={"k": 6}),  # ‚Üê Augment√© de 3 √† 6
    combine_docs_chain=stuff_chain
)

print("‚úì RAG chain cr√©√©e et pr√™te")
print("  - Retriever: k=6 chunks (augment√© pour plus de contexte)")
print("  - Prompt: Assoupliss√© pour accepter √©v√©nements proches")

‚úì RAG chain cr√©√©e et pr√™te
  - Retriever: k=6 chunks (augment√© pour plus de contexte)
  - Prompt: Assoupliss√© pour accepter √©v√©nements proches


In [6]:
# Test du routing intelligent (RAG vs CHAT)
print("üéØ Test Routing Intelligent\n")

test_queries = [
    ("Bonjour, comment allez-vous ?", "CHAT"),
    ("Quels √©v√©nements sur la cuisine √† Bayonne ?", "RAG"),
    ("Merci beaucoup !", "CHAT"),
    ("Y a-t-il des concerts en novembre ?", "RAG"),
]

for query, expected_intent in test_queries:
    print(f"‚ùì Question: {query}")
    print(f"   Intent attendu: {expected_intent}")
    
    detected_intent = classify_query_intent(query, llm)
    print(f"   Intent d√©tect√©: {detected_intent}")
    print(f"   Status: {'‚úÖ' if detected_intent == expected_intent else '‚ö†Ô∏è'}\n")

INFO: Classification de la requ√™te: 'Bonjour, comment allez-vous ?...'


üéØ Test Routing Intelligent

‚ùì Question: Bonjour, comment allez-vous ?
   Intent attendu: CHAT


INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO: Intention d√©tect√©e: CHAT
INFO: Classification de la requ√™te: 'Quels √©v√©nements sur la cuisine √† Bayonne ?...'
INFO: Intention d√©tect√©e: CHAT
INFO: Classification de la requ√™te: 'Quels √©v√©nements sur la cuisine √† Bayonne ?...'


   Intent d√©tect√©: CHAT
   Status: ‚úÖ

‚ùì Question: Quels √©v√©nements sur la cuisine √† Bayonne ?
   Intent attendu: RAG


INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO: Intention d√©tect√©e: RAG
INFO: Classification de la requ√™te: 'Merci beaucoup !...'
INFO: Intention d√©tect√©e: RAG
INFO: Classification de la requ√™te: 'Merci beaucoup !...'


   Intent d√©tect√©: RAG
   Status: ‚úÖ

‚ùì Question: Merci beaucoup !
   Intent attendu: CHAT


INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO: Intention d√©tect√©e: CHAT
INFO: Classification de la requ√™te: 'Y a-t-il des concerts en novembre ?...'
INFO: Intention d√©tect√©e: CHAT
INFO: Classification de la requ√™te: 'Y a-t-il des concerts en novembre ?...'


   Intent d√©tect√©: CHAT
   Status: ‚úÖ

‚ùì Question: Y a-t-il des concerts en novembre ?
   Intent attendu: RAG


INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO: Intention d√©tect√©e: RAG
INFO: Intention d√©tect√©e: RAG


   Intent d√©tect√©: RAG
   Status: ‚úÖ



In [7]:
# Test du chatbot RAG avec gestion des erreurs 429
print("ü§ñ Chatbot RAG - Test avec gestion rate limit\n")

queries = [
    "Quels √©v√©nements sur la cuisine √† Bayonne ?",
    "Trouve-moi des √©v√©nements agricoles",
    "Y a-t-il des concerts en novembre ?"
]

for query in queries:
	print(f"‚ùì Question: {query}")
	result = invoke_rag_with_retry(rag_chain, query, max_retries=3, initial_delay=2)
	print(f"‚úì R√©ponse:\n{result['answer']}\n")
	print("-" * 80 + "\n")

ü§ñ Chatbot RAG - Test avec gestion rate limit

‚ùì Question: Quels √©v√©nements sur la cuisine √† Bayonne ?
üîÑ Tentative 1/3...


INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"


‚úì R√©ponse:
D'apr√®s le contexte fourni, voici les √©v√©nements li√©s √† la cuisine et √† la gastronomie √† Bayonne :

1. **Foire au Jambon de Bayonne**
   - **Description** : √âv√©nement gourmand mettant en avant le "Jambon de Bayonne", un produit embl√©matique du territoire. Les restaurateurs sont encourag√©s √† le valoriser, et la foire c√©l√®bre le savoir-faire artisanal et l'identit√© culinaire locale.
   - **Th√®me** : Gastronomie, produits locaux, patrimoine culinaire.

2. **Job Dating H√¥tellerie Caf√© Restaurant**
   - **Description** : Organis√© √† la CCI de Bayonne le **13/03** (15h15-16h30 pour les exercices, puis job dating √† partir de 16h30). Bien que centr√© sur l'emploi, cet √©v√©nement rassemble des acteurs du secteur de la restauration, ce qui peut √™tre pertinent pour d√©couvrir des opportunit√©s ou des tendances culinaires locales.

3. **Visite guid√©e de Bayonne (th√®me "chocolat")**
   - **Description** : Les √©l√®ves de Bac Pro M√©tiers de l'Accueil et du Tour

INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"


‚úì R√©ponse:
Voici les √©v√©nements agricoles pertinents bas√©s sur le contexte fourni :

### **1. Animations agricoles et concours**
- **√âv√©nement** : Animations pour petits et grands, concours de fourrage et de fromage, exposition sur les sonnailles des troupeaux, bal ossalois.
- **Lieu** : Non pr√©cis√© (mais probablement dans le B√©arn ou les Pyr√©n√©es).
- **Cat√©gories** : √âlevage, agroalimentaire, traditions rurales.
- **D√©tails** : Id√©al pour d√©couvrir les m√©tiers de l'√©levage et les produits locaux.

### **2. Information collective sur les m√©tiers agricoles**
- **√âv√©nement** : "Les m√©tiers de l'√©levage, de l'agroalimentaire, l'am√©nagement paysager, etc."
- **Date/Heure** : Jeudi 11 septembre √† 10h.
- **Lieu** : ERIP du B√©arn, site de Nay.
- **Cat√©gories** : √âlevage, agroalimentaire, installation agricole, am√©nagement paysager.
- **D√©tails** : Gratuit, ouvert √† tous. Contact : 09 70 72 01 63 / eripbearnpau@mljpau.

### **3. D√©couverte des m√©tiers agricol

INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO: HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"


‚úì R√©ponse:
D'apr√®s le contexte fourni, voici les √©v√©nements en novembre qui pourraient vous int√©resser :

1. **Concert du Ch≈ìur Arraya** (sans date pr√©cise, mais dans le cadre des visites libres de 10h √† 17h) :
   - Ce concert cl√¥ture une journ√©e et se d√©roule dans un lieu historique (chapelle de l'ancien couvent des Franciscains).
   - Il met en avant de jeunes artistes avec un programme m√™lant classique et d√©couvertes musicales.
   - La participation est libre, ce qui en fait un √©v√©nement accessible.

2. **S√©rie de 6 concerts de l‚ÄôAcad√©mie Ravel** (dans le cadre des Journ√©es Europ√©ennes du Patrimoine, mais sans pr√©cision sur le mois) :
   - Ces concerts mettent en avant des jeunes talents et se d√©roulent dans des lieux patrimoniaux du Pays basque.
   - Certains pourraient avoir lieu en novembre, notamment des formats courts ou impromptus (gratuits ou √† tarif mod√©r√©).

3. **Concert po√©tique avec instruments rares** (sans date pr√©cise, mais en partenariat 

In [8]:
# Diagnostic: Voir ce que le retriever trouve pour "concerts"
print("üîç Diagnostic Retriever - Cherchant 'concerts en janvier'\n")

diagnostic_query = "Y a-t-il eu des concerts en janvier ?"
retrieved_docs = vector_store.similarity_search_with_score(diagnostic_query, k=6)

print(f"Documents retrouv√©s par le retriever (k=6):\n")
for i, (doc, score) in enumerate(retrieved_docs):
    similarity = (1 - score) * 100
    print(f"--- Document {i+1} (Similarit√©: {similarity:.1f}%) ---")
    print(f"Titre: {doc.metadata.get('slug')}")
    print(f"Ville: {doc.metadata.get('location_city')}")
    print(f"Contenu: {doc.page_content[:300]}...\n")

print("-" * 80)
print("üí° Si les documents ci-dessus contiennent des concerts,")
print("   c'est un probl√®me de prompt (trop restrictif).")
print("   Si pas de concerts du tout, c'est un probl√®me de recherche.")
print("-" * 80 + "\n")

üîç Diagnostic Retriever - Cherchant 'concerts en janvier'



INFO: HTTP Request: POST https://api.mistral.ai/v1/embeddings "HTTP/1.1 200 OK"


Documents retrouv√©s par le retriever (k=6):

--- Document 1 (Similarit√©: 48.8%) ---
Titre: journees-europeennes-du-patrimoine-les-jardins-du-chateau-bijou
Ville: Labastide-Villefranche
Contenu: . Visites libres de 10h √† 17h La journ√©e se cl√¥turera par un concert du Ch≈ìur Arraya. Cat√©gories:...

--- Document 2 (Similarit√©: 48.0%) ---
Titre: concert-festival-off-ravel
Ville: Saint-Palais
Contenu: . La soir√©e aura lieu au c≈ìur de la chapelle de l'ancien couvent des Franciscains, un lieu charg√© d‚Äôhistoire et propice √† l‚Äô√©motion musicale. Ce concert mettra en lumi√®re de jeunes artistes en devenir, tous passionn√©s et port√©s par l‚Äôexcellence musicale. Ils interpr√©teront un programme riche et sens...

--- Document 3 (Similarit√©: 47.8%) ---
Titre: concert-des-jeunes-solistes-de-lacademie-ravel
Ville: Saint-P√©e-sur-Nivelle
Contenu: . Ce temps fort mettra √† l‚Äôhonneur une s√©lection de jeunes talents issus des derni√®res √©ditions de l‚ÄôAcad√©mie Ravel avec une s√©rie 