In [2]:
# Configuration initiale
import sys
from pathlib import Path

# Ajouter le r√©pertoire racine au path pour les imports
project_root = Path.cwd().parent
sys.path.insert(0, str(project_root))

print(f"Project root: {project_root}")
print(f"Current working directory: {Path.cwd()}")


Project root: c:\Projet_AI\Assistant_regulation
Current working directory: c:\Projet_AI\Assistant_regulation\notebook


In [None]:
# Imports des services
from assistant_regulation.planning.services import (
    RetrievalService,
    ValidationService,
    GenerationService,
    MemoryService,
    ContextBuilderService,
    RerankerService,
)
from assistant_regulation.planning.Orchestrator.modular_orchestrator import ModularOrchestrator

print("‚úÖ Tous les imports r√©ussis !")

In [None]:
# Test du RetrievalService
print("=== Test RetrievalService ===")

try:
    retrieval_service = RetrievalService()
    print("‚úÖ RetrievalService initialis√©")
    
    # Test de recherche
    query = "r√©glementation R107 bus PMR"
    results = retrieval_service.retrieve(
        query,
        use_images=True,
        use_tables=True,
        top_k=3
    )
    
    print(f"‚úÖ Recherche effectu√©e pour: '{query}'")
    print(f"R√©sultats texte: {len(results.get('text', []))}")
    print(f"R√©sultats images: {len(results.get('images', []))}")
    print(f"R√©sultats tableaux: {len(results.get('tables', []))}")
    text_chunks = results.get('text')
    images_chunks = results.get('images')
    tables_chunks = results.get('tables')
    print(text_chunks)
    print(images_chunks)
    print(tables_chunks)
    # Afficher un √©chantillon
    if results.get('text'):
        print("\nüìÑ Premier r√©sultat texte:")
        first_text = results['text'][0]
        content = first_text.get('content', first_text.get('documents', 'Pas de contenu'))
        print(content[:200] + "..." if len(content) > 200 else content)
        
except Exception as e:
    print(f"‚ùå Erreur RetrievalService: {e}")


In [None]:
# Test du RerankerService (n√©cessite des d√©pendances optionnelles)
print("=== Test RerankerService ===")
try:
    # Test avec mock si les d√©pendances ne sont pas install√©es
    reranker_service = RerankerService(model_name="jina-reranker-m0")
    
    print("‚úÖ RerankerService initialis√© avec BGE")
    
    # Test de rerank
    test_chunks = [
        {"content": "La m√©t√©o est belle aujourd'hui."},
        {"content": "R√©glementation R107 pour les v√©hicules de transport."},
        {"content": "Les bus PMR doivent √™tre accessibles."}
    ]
    
    query = "r√©glementation bus PMR"
    reranked = reranker_service.rerank_chunks(query, test_chunks, top_k=2)
    
    print(f"‚úÖ Rerank effectu√© pour: '{query}'")
    print(f"Chunks avant: {len(test_chunks)}")
    print(f"Chunks apr√®s: {len(reranked)}")
    
    print("\nüèÜ Chunks reclass√©s:")
    for i, chunk in enumerate(reranked):
        print(f"  {i+1}. {chunk['content']}")
            
        
except Exception as e:
    print(f"‚ùå Erreur RerankerService: {e}")


In [None]:
print("=== Test Retrieval + Reranking ===")

query = "Quelle sont les dimensions des mannequins passager r√®glementaire permettant de v√©rifier le passage dans le v√©hicule"

# 1) R√©cup√©ration des chunks
retrieval_service = RetrievalService()
results = retrieval_service.retrieve(
    query,
    use_images=True,   # on se concentre sur le texte
    use_tables=False,
    top_k=30            # nombre de chunks bruts
)

text_chunks = results.get("text", [])
print(f"Chunks r√©cup√©r√©s : {len(text_chunks)}")

# 2) Reranking des chunks
reranker = RerankerService(model_name="jina-reranker-m0")        # cl√© JINA_API_KEY n√©cessaire
best_chunks = reranker.rerank_chunks(
    query,
    text_chunks,
    top_k=5                         # nombre de chunks r√©ordonn√©s √† garder
)
# 3) Affichage d'un aper√ßu
for i, chunk in enumerate(best_chunks, 1):
    content = chunk.get("content") or chunk.get("documents") or "‚Äî"
    print(f"\n#{i} ‚Äî score original : {chunk.get('score', 'N/A')}")
    print(content[:250] + ("‚Ä¶" if len(content) > 250 else ""))

In [None]:
# Test du RerankerService (n√©cessite des d√©pendances optionnelles)
print("=== Test RerankerService ===")
try:
    # Test avec mock si les d√©pendances ne sont pas install√©es
    reranker_service = RerankerService(model_name="jina-reranker-m0")
    
    print("‚úÖ RerankerService initialis√© avec BGE")
    
    # Test de rerank
    test_chunks = [
        {"content": "La m√©t√©o est belle aujourd'hui."},
        {"content": "R√©glementation R107 pour les v√©hicules de transport."},
        {"content": "Les bus PMR doivent √™tre accessibles."}
    ]
    
    query = "r√©glementation bus PMR"
    reranked = reranker_service.rerank_chunks(query, test_chunks, top_k=2)
    
    print(f"‚úÖ Rerank effectu√© pour: '{query}'")
    print(f"Chunks avant: {len(test_chunks)}")
    print(f"Chunks apr√®s: {len(reranked)}")
    
    print("\nüèÜ Chunks reclass√©s:")
    for i, chunk in enumerate(reranked):
        print(f"  {i+1}. {chunk['content']}")
            
        
except Exception as e:
    print(f"‚ùå Erreur RerankerService: {e}")


In [6]:
# Test du GenerationService
print("=== Test GenerationService ===")

try:
    generation_service = GenerationService(llm_provider="ollama", model_name="llama3.2")
    print("‚úÖ GenerationService initialis√© (Ollama)")
    
    # Test g√©n√©ration simple
    query = "Qu'est-ce qu'un bus PMR ?"
    answer = generation_service.generate_answer(
        query=query,
        context="",
        conversation_context=""
    )
    
    print(f"‚úÖ R√©ponse g√©n√©r√©e pour: '{query}'")
    print(f"üìù R√©ponse: {answer[:300]}{'...' if len(answer) > 300 else ''}")
    
except Exception as e:
    print(f"‚ùå Erreur GenerationService: {e}")


=== Test GenerationService ===
‚úÖ GenerationService initialis√© (Ollama)
‚úÖ R√©ponse g√©n√©r√©e pour: 'Qu'est-ce qu'un bus PMR ?'
üìù R√©ponse: Bonjour !

Un bus PMR est un v√©hicule con√ßu pour les personnes handicap√©es, en particulier celles qui souffrent de troubles du mouvement ou de la coordination.

PMR signifie "Personnes Handicap√©es Mobilit√© R√©duite". Les bus PMR sont √©quip√©s de si√®ges adapt√©s et de syst√®mes d'accessibilit√© sp√©ciaux p...


In [None]:
# Test du ValidationService
print("=== Test ValidationService ===")

try:
    validation_service = ValidationService(llm_provider="mistral", model_name="mistral-large-latest")
    print("‚úÖ ValidationService initialis√©")
    
    # Cr√©er des chunks de test
    test_chunks = {
        "text": [
            {
                "content": "La r√©glementation R107 concerne les v√©hicules de cat√©gorie M2 et M3.",
                "metadata": {"document_id": "R107", "page_no": 1}
            },
            {
                "content": "Le temps qu'il fait aujourd'hui est ensoleill√©.",
                "metadata": {"document_id": "weather", "page_no": 1}
            }
        ],
        "images": [],
        "tables": []
    }
    
    query = "r√©glementation R107 bus"
    validated_chunks = validation_service.validate_chunks(query, test_chunks)
    
    print(f"‚úÖ Validation effectu√©e pour: '{query}'")
    print(f"Chunks texte avant: {len(test_chunks['text'])}")
    print(f"Chunks texte apr√®s: {len(validated_chunks['text'])}")
    
    if validated_chunks['text']:
        print("\nüìÑ Chunks valid√©s:")
        for i, chunk in enumerate(validated_chunks['text']):
            content = chunk.get('content', '')[:100]
            print(f"  {i+1}. {content}...")
    
except Exception as e:
    print(f"‚ùå Erreur ValidationService: {e}")


=== Test ValidationService ===
‚úÖ ValidationService initialis√©
‚úÖ Validation effectu√©e pour: 'r√©glementation R107 bus'
Chunks texte avant: 2
Chunks texte apr√®s: 1

üìÑ Chunks valid√©s:
  1. La r√©glementation R107 concerne les v√©hicules de cat√©gorie M2 et M3....


In [None]:
# Test du MemoryService
print("=== Test MemoryService ===")

try:
    # Utiliser le client du generation_service pour la coh√©rence
    memory_service = MemoryService(
        session_id="test_session",
        llm_client=generation_service.raw_client if 'generation_service' in locals() else None,
        model_name="llama3.2"
    )
    print("‚úÖ MemoryService initialis√©")
    
    # Ajouter des tours de conversation
    memory_service.add_turn(
        "Qu'est-ce que la R107 ?",
        "La R107 est une r√©glementation automobile concernant les v√©hicules de transport en commun.",
        metadata={"sources_count": 2}
    )
    
    memory_service.add_turn(
        "Quelles sont les exigences PMR ?",
        "Les exigences PMR incluent l'accessibilit√© pour les personnes √† mobilit√© r√©duite.",
        metadata={"sources_count": 1}
    )
    
    print("‚úÖ Tours de conversation ajout√©s")
    
    # R√©cup√©rer le contexte
    context = memory_service.get_context("Autres d√©tails sur la R107 ?")
    print(f"‚úÖ Contexte r√©cup√©r√© ({len(context)} caract√®res)")
    print(f"\nüí≠ Contexte:\n{context[:500]}..." if len(context) > 500 else f"\nüí≠ Contexte:\n{context}")
    
    # Statistiques
    stats = memory_service.stats()
    print(f"\nüìä Stats: {stats}")
    
except Exception as e:
    print(f"‚ùå Erreur MemoryService: {e}")


In [None]:
# Test du ContextBuilderService
print("=== Test ContextBuilderService ===")

try:
    context_builder = ContextBuilderService()
    print("‚úÖ ContextBuilderService initialis√©")
    
    # Cr√©er des chunks multimodaux de test
    test_chunks = {
        "text": [
            {"content": "R√©glementation R107: v√©hicules de cat√©gorie M2 et M3."},
            {"documents": "Les bus PMR doivent respecter des normes d'accessibilit√©."}
        ],
        "tables": [
            {"content": "Tableau des dimensions minimales: Largeur 80cm, Hauteur 190cm"}
        ],
        "images": [
            {"description": "Sch√©ma d'un emplacement PMR dans un bus avec rampe d'acc√®s."}
        ]
    }
    
    context = context_builder.build_context(test_chunks)
    print(f"‚úÖ Contexte construit ({len(context)} caract√®res)")
    print(f"\nüìã Contexte:\n{context}")
    
except Exception as e:
    print(f"‚ùå Erreur ContextBuilderService: {e}")


In [None]:

import os, textwrap
query = "Organic skincare products for sensitive skin"
documents = [
    "Bio-Hautpflege f√ºr empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell f√ºr empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und sch√ºtzen unsere Produkte Ihre Haut auf nat√ºrliche Weise. Verabschieden Sie sich von Hautirritationen und genie√üen Sie einen strahlenden Teint.",
    "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
    "New makeup trends focus on bold colors and innovative techniques: Step into the world of cutting-edge beauty with this seasons makeup trends. Bold, vibrant colors and groundbreaking techniques are redefining the art of makeup. From neon eyeliners to holographic highlighters, unleash your creativity and make a statement with every look.",
    
]
top_k = 3
print("Testing Jina RerankerService‚Ä¶")
print(f"Using API key from env: {'JINA_API_KEY' in os.environ}")
reranker = RerankerService()
ranked = reranker.rerank(query, documents, top_k=top_k)
print(ranked)
for i, (doc, score) in enumerate(ranked, start=1):
    print(f"\nRank #{i} (score={score:.4f}):\n")
    print(textwrap.shorten(doc, width=120, placeholder="‚Ä¶")) 

In [3]:
# Test de l'orchestrateur modulaire complet
print("=== Test ModularOrchestrator ===")

try:
    # Initialiser l'orchestrateur
    orchestrator = ModularOrchestrator(
        llm_provider="mistral",
        model_name="mistral-medium",
        enable_verification=False  # D√©sactiver pour acc√©l√©rer les tests
    )
    print("‚úÖ ModularOrchestrator initialis√©")
    
    # Test 1: Question g√©n√©rale (pas de RAG)
    print("\n--- Test 1: Question g√©n√©rale ---")
    query1 = "Bonjour, comment allez-vous ?"
    result1 = orchestrator.process_query(
        query1,
        use_images=False,
        use_tables=False,
        top_k=3
    )
    
    print(f"Query: {query1}")
    print(f"Analysis: {result1['analysis']}")
    print(f"Answer: {result1['answer'][:200]}...")
    print(f"Sources: {len(result1['sources'])}")
    
except Exception as e:
    print(f"‚ùå Erreur Test 1: {e}")


=== Test ModularOrchestrator ===
‚úÖ ModularOrchestrator initialis√©

--- Test 1: Question g√©n√©rale ---
Query: Bonjour, comment allez-vous ?
Analysis: {'needs_rag': False, 'query_type': 'general', 'confidence': 0.97, 'context_hint': 'Salutation', 'contains_url': False, 'urls': []}
Answer: Bonjour ! Je vais tr√®s bien, merci. Et vous, comment allez-vous aujourd'hui ? üòä...
Sources: 0


In [4]:
try:
    # Test 2: Question r√©glementaire (avec RAG)
    print("\n--- Test 2: Question r√©glementaire ---")
    query2 = "Quelles sont les exigences de la r√©glementation R107 pour les bus PMR ?"
    result2 = orchestrator.process_query(
        query2,
        use_images=True,
        use_tables=True,
        top_k=15
    )
    
    print(f"Query: {query2}")
    print(f"Analysis: {result2['analysis']}")
    print(f"Answer: {result2['answer'][:1000]}...")
    print(f"Sources: {len(result2['sources'])}")
    print(f"Images: {len(result2['images'])}")
    print(f"Tables: {len(result2['tables'])}")
    
except Exception as e:
    print(f"‚ùå Erreur Test 2: {e}")



--- Test 2: Question r√©glementaire ---
Query: Quelles sont les exigences de la r√©glementation R107 pour les bus PMR ?
Analysis: {'needs_rag': True, 'query_type': 'regulation', 'confidence': 0.85, 'context_hint': 'Question identifi√©e comme relevant des r√©glementations automobiles', 'contains_url': False, 'urls': []}
Answer: La r√©glementation R107 (ou UN R107) concerne principalement l'homologation des v√©hicules des cat√©gories M2 et M3 (bus et autocars) en ce qui concerne leur construction g√©n√©rale. Voici les exigences cl√©s pour les bus PMR (Personnes √† Mobilit√© R√©duite) selon cette r√©glementation :

### 1. **Accessibilit√© et Am√©nagements PMR**
- **Acc√®s facilit√©** : Les bus doivent √™tre √©quip√©s de dispositifs permettant l'acc√®s des personnes √† mobilit√© r√©duite, tels que des rampes, des ascenseurs ou des plateformes √©l√©vatrices.
- **Espace d√©di√©** : Un espace r√©serv√© aux fauteuils roulants doit √™tre pr√©vu, avec des syst√®mes de fixation s√©curis√©s.
- **

In [None]:
try:
    # Test 3: Question de suivi (avec contexte m√©moire)
    print("\n--- Test 3: Question de suivi ---")
    query3 = "Pouvez-vous me donner plus de d√©tails sur ce sujet ?"
    result3 = orchestrator.process_query(
        query3,
        use_conversation_context=True,
        top_k=2
    )
    
    print(f"Query: {query3}")
    print(f"Analysis: {result3['analysis']}")
    print(f"Answer: {result3['answer'][:200]}...")
    
except Exception as e:
    print(f"‚ùå Erreur Test 3: {e}")


In [None]:
# Test de performance
import time

print("=== Test de Performance ===")

if 'orchestrator' in locals():
    queries = [
        "Qu'est-ce qu'un PMR ?",
        "R√©glementation R107 bus",
        "Exigences accessibilit√©"
    ]
    
    total_time = 0
    
    for i, query in enumerate(queries, 1):
        start_time = time.time()
        
        try:
            result = orchestrator.process_query(
                query,
                use_images=False,  # D√©sactiver pour la vitesse
                use_tables=False,
                top_k=2
            )
            
            elapsed = time.time() - start_time
            total_time += elapsed
            
            print(f"Query {i}: {elapsed:.2f}s - {query}")
            print(f"  ‚Üí RAG: {'‚úÖ' if result['analysis']['needs_rag'] else '‚ùå'}")
            print(f"  ‚Üí Sources: {len(result['sources'])}")
            
        except Exception as e:
            print(f"‚ùå Erreur Query {i}: {e}")
    
    print(f"\n‚è±Ô∏è Temps total: {total_time:.2f}s")
    print(f"‚è±Ô∏è Temps moyen: {total_time/len(queries):.2f}s")
else:
    print("‚ùå Orchestrateur non disponible pour les tests de performance")


In [None]:
# R√©sum√© final
print("=== R√©sum√© des Tests ===")
print("\n‚úÖ Services test√©s:")
print("  ‚Ä¢ RetrievalService - Recherche multi-sources")
print("  ‚Ä¢ GenerationService - G√©n√©ration LLM")
print("  ‚Ä¢ ValidationService - Filtrage des chunks")
print("  ‚Ä¢ MemoryService - M√©moire conversationnelle")
print("  ‚Ä¢ ContextBuilderService - Construction du contexte")
print("  ‚Ä¢ RerankerService - R√©ordonnancement (optionnel)")
print("  ‚Ä¢ ModularOrchestrator - Coordination")

print("\nüéØ Avantages de l'architecture modulaire:")
print("  ‚Ä¢ Services isol√©s et testables")
print("  ‚Ä¢ Injection de d√©pendances")
print("  ‚Ä¢ Orchestrateur <200 lignes")
print("  ‚Ä¢ Facilit√© de maintenance")

print("\nüìã Prochaines √©tapes:")
print("  ‚Ä¢ Installer d√©pendances reranker si besoin")
print("  ‚Ä¢ Ajuster les param√®tres selon vos besoins")
print("  ‚Ä¢ Int√©grer dans votre application")
print("  ‚Ä¢ Ajouter tests unitaires")

print("\nüöÄ Architecture modulaire op√©rationnelle !")
