# Architecture 2: RAG Standard (Retrieval-Augmented Generation)

Cette architecture impl√©mente un syst√®me RAG qui s√©pare la capacit√© de raisonnement (LLM) de la base de connaissances factuelles (ChromaDB).

## Caract√©ristiques principales:
- **Base vectorielle**: ChromaDB
- **Embedding**: paraphrase-multilingual-mpnet-base-v2 (768 dimensions)
- **Chunking**: 512 tokens max, 50 tokens overlap
- **LLM**: Llama 3.2 3B (peut √™tre utilis√© sans fine-tuning ou avec)
- **Sources**: FAQ, proc√©dures, documentation op√©rateurs, conversations historiques

<a href="https://colab.research.google.com/github/AmedBah/memoire/blob/main/notebooks/architecture_2/02_architecture_2_rag_standard.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## üöÄ Configuration pour Google Colab

**Note**: Cette section est sp√©cifique √† Google Colab. Si vous ex√©cutez ce notebook localement, vous pouvez ignorer ces cellules.

In [None]:
# V√©rifier le type de runtime
import os
import sys

# D√©tecter si on est sur Colab
IS_COLAB = 'google.colab' in sys.modules

if IS_COLAB:
    print("‚úì Ex√©cution sur Google Colab")
    
    # V√©rifier le type de GPU
    import torch
    if torch.cuda.is_available():
        gpu_name = torch.cuda.get_device_name(0)
        print(f"‚úì GPU d√©tect√©: {gpu_name}")
        print(f"‚úì M√©moire GPU: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")
        
        # Recommandations selon le GPU
        if 'T4' in gpu_name:
            print("\n‚ö†Ô∏è  GPU T4 d√©tect√© (16 GB): Convient pour ce notebook mais les temps d'entra√Ænement seront plus longs")
        elif 'V100' in gpu_name or 'A100' in gpu_name:
            print(f"\n‚úì {gpu_name}: Parfait pour ce notebook!")
    else:
        print("\n‚ùå ATTENTION: Aucun GPU d√©tect√©!")
        print("   Pour activer le GPU: Runtime > Change runtime type > GPU")
        print("   Pour Colab Pro: Choisir 'High-RAM' ou 'Premium GPU'")
else:
    print("‚úì Ex√©cution locale")
    import torch
    if torch.cuda.is_available():
        print(f"‚úì GPU disponible: {torch.cuda.get_device_name(0)}")
    else:
        print("‚ö†Ô∏è  Aucun GPU d√©tect√© - l'entra√Ænement sera tr√®s lent")

In [None]:
# Monter Google Drive (uniquement sur Colab)
if IS_COLAB:
    from google.colab import drive
    drive.mount('/content/drive')
    
    # D√©finir le chemin vers les donn√©es
    # OPTION 1: Donn√©es dans Google Drive
    # DATA_DIR = '/content/drive/MyDrive/memoire/data'
    
    # OPTION 2: Cloner le repo et utiliser les donn√©es locales
    print("\nüì• Clonage du repository...")
    !git clone https://github.com/AmedBah/memoire.git /content/memoire
    DATA_DIR = '/content/memoire/data'
    
    print(f"\n‚úì R√©pertoire de donn√©es: {DATA_DIR}")
    
    # V√©rifier que les donn√©es sont pr√©sentes
    if os.path.exists(DATA_DIR):
        print("‚úì Donn√©es trouv√©es!")
        !ls -lh {DATA_DIR}
    else:
        print(f"‚ùå ERREUR: R√©pertoire {DATA_DIR} non trouv√©!")
        print("   Veuillez soit:")
        print("   1. Copier le dossier 'data' dans votre Google Drive")
        print("   2. Ou le repository sera clon√© automatiquement")
else:
    # Ex√©cution locale
    DATA_DIR = '../../data'
    print(f"‚úì R√©pertoire de donn√©es local: {DATA_DIR}")

In [None]:
# Fonction helper pour obtenir les chemins de donn√©es
def get_data_path(relative_path):
    """Obtenir le chemin absolu d'un fichier de donn√©es"""
    return os.path.join(DATA_DIR, relative_path)

# Exemples de chemins
print("Chemins de donn√©es configur√©s:")
print(f"  Conversations: {get_data_path('conversations/conversation_1000_finetune.jsonl')}")
print(f"  FAQs: {get_data_path('faqs/faq_easytransfert.json')}")
print(f"  Op√©rateurs: {get_data_path('operators/operators_info.json')}")
print(f"  Proc√©dures: {get_data_path('procedures/procedures_resolution.json')}")
print(f"  Expressions: {get_data_path('expressions/expressions_ivoiriennes.json')}")
print(f"  Documents: {get_data_path('documents/doc.txt.txt')}")

## 1. Installation et Configuration

In [None]:
# Installation des d√©pendances
!pip install -q chromadb sentence-transformers langchain langchain-community transformers torch

import os
import json
import chromadb
from chromadb.config import Settings
from sentence_transformers import SentenceTransformer
from langchain.text_splitter import RecursiveCharacterTextSplitter
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import numpy as np
from typing import List, Dict, Tuple
import time

print(f"GPU disponible: {torch.cuda.is_available()}")

## 2. Configuration ChromaDB et Mod√®le d'Embedding

In [None]:
# Initialiser ChromaDB
chroma_client = chromadb.PersistentClient(path="./chromadb_easytransfert")

# Charger le mod√®le d'embedding multilingue
embedding_model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-mpnet-base-v2')

print(f"Dimension des embeddings: {embedding_model.get_sentence_embedding_dimension()}")
print(f"Performance estim√©e: ~2000 phrases/seconde sur CPU")

# Cr√©er ou r√©cup√©rer la collection
collection = chroma_client.get_or_create_collection(
    name="easytransfert_knowledge_base",
    metadata={"description": "Base de connaissances EasyTransfert pour RAG"}
)

print(f"Collection cr√©√©e/r√©cup√©r√©e: {collection.name}")
print(f"Nombre de documents existants: {collection.count()}")

## 3. Pr√©paration des Donn√©es et Chunking

Strat√©gie de chunking adaptative:
- Taille maximale: 512 tokens (~400 mots fran√ßais)
- Chevauchement: 50 tokens (10%)
- S√©parateurs hi√©rarchiques: double saut de ligne, point, virgule
- M√©tadonn√©es enrichies: cat√©gorie, op√©rateur, mots-cl√©s, date

In [None]:
# Configuration du text splitter
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=512,
    chunk_overlap=50,
    length_function=len,
    separators=["\n\n", "\n", ". ", ", ", " ", ""]
)

def create_chunks_with_metadata(documents: List[Dict]) -> Tuple[List[str], List[Dict], List[str]]:
    """
    Cr√©e des chunks avec m√©tadonn√©es enrichies
    
    Args:
        documents: Liste de documents avec contenu et m√©tadonn√©es
    
    Returns:
        Tuple de (chunks, metadatas, ids)
    """
    all_chunks = []
    all_metadatas = []
    all_ids = []
    
    for doc_idx, doc in enumerate(documents):
        # D√©couper le texte
        chunks = text_splitter.split_text(doc["content"])
        
        for chunk_idx, chunk in enumerate(chunks):
            all_chunks.append(chunk)
            
            # Cr√©er les m√©tadonn√©es
            metadata = {
                "category": doc.get("category", "unknown"),
                "operator": doc.get("operator", "Tous"),
                "source": doc.get("source", "internal"),
                "chunk_index": chunk_idx,
                "total_chunks": len(chunks),
            }
            
            # Ajouter les mots-cl√©s si disponibles
            if "keywords" in doc:
                metadata["keywords"] = ",".join(doc["keywords"])
            
            all_metadatas.append(metadata)
            all_ids.append(f"doc_{doc_idx}_chunk_{chunk_idx}")
    
    return all_chunks, all_metadatas, all_ids

print("Fonction de chunking d√©finie.")

## 4. Cr√©ation de la Base de Connaissances

Sources de donn√©es:
1. FAQ EasyTransfert
2. Proc√©dures op√©rationnelles
3. Documentation des op√©rateurs
4. Conversations historiques r√©ussies

In [None]:
# Exemples de documents de connaissances
knowledge_base_documents = [
    # FAQ
    {
        "content": """EasyTransfert permet de transf√©rer de l'argent entre diff√©rents op√©rateurs mobiles en C√¥te d'Ivoire. 
        Les op√©rateurs support√©s sont: MTN Mobile Money, Orange Money, Moov Money, Wave et Tr√©sor Money. 
        Pour effectuer un transfert, ouvrez l'application, s√©lectionnez l'op√©rateur d'envoi et de r√©ception, 
        entrez le num√©ro du destinataire et le montant, puis confirmez la transaction.""",
        "category": "faq",
        "operator": "Tous",
        "source": "FAQ officielle",
        "keywords": ["transfert", "op√©rateurs", "fonctionnement"]
    },
    {
        "content": """Les frais de transaction EasyTransfert varient selon le montant et les op√©rateurs concern√©s.
        En g√©n√©ral, les frais sont de 1% √† 2% du montant transf√©r√©, avec un minimum de 25 FCFA et un maximum de 500 FCFA.
        Les transferts entre certains op√©rateurs peuvent b√©n√©ficier de tarifs promotionnels.""",
        "category": "faq",
        "operator": "Tous",
        "source": "FAQ officielle",
        "keywords": ["frais", "tarifs", "co√ªt"]
    },
    
    # Proc√©dures
    {
        "content": """Proc√©dure de r√©solution pour transaction non aboutie:
        1. Demander √† l'utilisateur l'identifiant EasyTransfert (commence par EFB.)
        2. Demander l'identifiant de l'op√©rateur d'envoi (format varie selon op√©rateur)
        3. V√©rifier le statut de la transaction dans le syst√®me
        4. Si la transaction est bloqu√©e, initier un remboursement
        5. Si le probl√®me persiste, escalader vers le service technique
        Contact service client: 2522018730 (WhatsApp 24h/24)""",
        "category": "procedure",
        "operator": "Tous",
        "source": "Manuel de proc√©dures",
        "keywords": ["transaction √©chou√©e", "remboursement", "r√©solution"]
    },
    
    # Documentation op√©rateurs
    {
        "content": """Format des identifiants de transaction par op√©rateur:
        - EasyTransfert: EFB.XXXXXXXXX (commence toujours par EFB.)
        - MTN Mobile Money: S√©rie de chiffres uniquement, g√©n√©ralement 10 chiffres
        - Orange Money (envoi): MP suivi de 10 chiffres (ex: MP1234567890)
        - Moov Money (envoi): MRCH ou CF suivi de caract√®res alphanum√©riques
        - Wave: Format variable, souvent commence par T suivi de chiffres
        - Tr√©sor Money: Format variable selon la transaction""",
        "category": "operator_info",
        "operator": "Tous",
        "source": "Documentation technique",
        "keywords": ["identifiants", "formats", "r√©f√©rence transaction"]
    },
    {
        "content": """Limites de transaction par op√©rateur:
        - MTN: Minimum 100 FCFA, Maximum 2 000 000 FCFA par transaction
        - Orange: Minimum 100 FCFA, Maximum 1 500 000 FCFA par transaction
        - Moov: Minimum 100 FCFA, Maximum 1 000 000 FCFA par transaction
        - Wave: Minimum 100 FCFA, Maximum 5 000 000 FCFA par transaction
        - Tr√©sor Money: Minimum 100 FCFA, Maximum 1 000 000 FCFA par transaction""",
        "category": "operator_info",
        "operator": "Tous",
        "source": "Documentation technique",
        "keywords": ["limites", "montants", "maximum", "minimum"]
    },
    
    # Probl√®mes courants
    {
        "content": """Mot de passe oubli√© - Proc√©dure de r√©initialisation:
        1. Ouvrir l'application EasyTransfert
        2. Cliquer sur "Mot de passe oubli√©" sur l'√©cran de connexion
        3. Entrer votre num√©ro de t√©l√©phone enregistr√©
        4. Vous recevrez un code de v√©rification par SMS
        5. Entrer le code re√ßu
        6. Cr√©er un nouveau mot de passe (minimum 8 caract√®res)
        Si vous ne recevez pas le SMS, contactez le 2522018730""",
        "category": "procedure",
        "operator": "Tous",
        "source": "Guide utilisateur",
        "keywords": ["mot de passe", "r√©initialisation", "connexion"]
    },
]

print(f"Nombre de documents √† indexer: {len(knowledge_base_documents)}")

# Cr√©er les chunks
chunks, metadatas, ids = create_chunks_with_metadata(knowledge_base_documents)

print(f"Nombre de chunks cr√©√©s: {len(chunks)}")
print(f"\nExemple de chunk:")
print(f"Contenu: {chunks[0][:200]}...")
print(f"M√©tadonn√©es: {metadatas[0]}")

## 5. Vectorisation et Indexation dans ChromaDB

In [None]:
# G√©n√©rer les embeddings
print("G√©n√©ration des embeddings...")
start_time = time.time()

embeddings = embedding_model.encode(chunks, show_progress_bar=True, convert_to_numpy=True)

embedding_time = time.time() - start_time
print(f"Temps de vectorisation: {embedding_time:.2f}s")
print(f"Performance: {len(chunks) / embedding_time:.1f} chunks/seconde")

# Ajouter √† la collection ChromaDB
if collection.count() == 0:  # √âviter les doublons
    collection.add(
        embeddings=embeddings.tolist(),
        documents=chunks,
        metadatas=metadatas,
        ids=ids
    )
    print(f"\n{len(chunks)} chunks index√©s dans ChromaDB")
else:
    print(f"\nCollection existe d√©j√† avec {collection.count()} documents")

print(f"Base de connaissances pr√™te!")

## 6. Fonction de R√©cup√©ration (Retrieval)

Phase de r√©cup√©ration (~150-200ms):
- Vectorisation de la question
- Recherche de similarit√© cosinus
- S√©lection des top-k chunks (d√©faut: 3)
- Filtrage par score (> 0.5)

In [None]:
def retrieve_context(query: str, top_k: int = 3, min_score: float = 0.5) -> List[Dict]:
    """
    R√©cup√®re les chunks les plus pertinents pour une requ√™te
    
    Args:
        query: Question de l'utilisateur
        top_k: Nombre de chunks √† retourner
        min_score: Score minimum de pertinence (similarit√© cosinus)
    
    Returns:
        Liste de dictionnaires contenant chunks, scores et m√©tadonn√©es
    """
    # Vectoriser la requ√™te
    query_embedding = embedding_model.encode([query])[0]
    
    # Recherche dans ChromaDB
    results = collection.query(
        query_embeddings=[query_embedding.tolist()],
        n_results=top_k,
    )
    
    # Formater les r√©sultats
    retrieved_docs = []
    
    for i in range(len(results['documents'][0])):
        # Calculer le score de similarit√© (distance cosinus -> similarit√©)
        distance = results['distances'][0][i]
        similarity = 1 - distance  # ChromaDB retourne la distance, on veut la similarit√©
        
        if similarity >= min_score:
            retrieved_docs.append({
                "content": results['documents'][0][i],
                "metadata": results['metadatas'][0][i],
                "score": similarity,
                "id": results['ids'][0][i]
            })
    
    return retrieved_docs

# Test de r√©cup√©ration
test_query = "Comment faire un transfert de MTN vers Orange ?"
print(f"Requ√™te de test: {test_query}\n")

start_time = time.time()
retrieved = retrieve_context(test_query, top_k=3)
retrieval_time = time.time() - start_time

print(f"Temps de r√©cup√©ration: {retrieval_time * 1000:.0f}ms\n")
print(f"Nombre de documents r√©cup√©r√©s: {len(retrieved)}\n")

for i, doc in enumerate(retrieved, 1):
    print(f"Document {i} (score: {doc['score']:.3f})")
    print(f"Cat√©gorie: {doc['metadata']['category']}")
    print(f"Contenu: {doc['content'][:200]}...\n")

## 7. Chargement du LLM pour la G√©n√©ration

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

# Configuration pour quantification 4-bit
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quant=True,
)

# Charger le mod√®le Llama 3.2 3B
model_name = "meta-llama/Llama-3.2-3B-Instruct"
# Ou utiliser le mod√®le fine-tun√© de l'Architecture 1 si disponible
# model_name = "./models/architecture1_lora"

print(f"Chargement du mod√®le {model_name}...")

tokenizer = AutoTokenizer.from_pretrained(model_name)
llm_model = AutoModelForCausalLM.from_pretrained(
    model_name,
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True,
)

print("Mod√®le charg√© avec succ√®s!")

## 8. Prompt RAG Augment√©

Format structur√© avec:
- Section contexte r√©cup√©r√© (documents + m√©tadonn√©es)
- Instructions strictes contre hallucinations
- Comportements attendus (empathie, citations)

In [None]:
def build_rag_prompt(query: str, retrieved_docs: List[Dict]) -> str:
    """
    Construit un prompt RAG structur√© avec contexte et instructions
    """
    
    system_prompt = """Tu es un assistant intelligent du service client EasyTransfert.

R√àGLES IMPORTANTES:
- R√©ponds UNIQUEMENT en te basant sur le contexte fourni ci-dessous
- Ne JAMAIS inventer d'informations
- Si l'information n'est pas dans le contexte, dis "Je n'ai pas cette information, contactez le 2522018730"
- Cite les sources quand c'est pertinent
- Utilise un ton chaleureux avec des √©mojis appropri√©s ü§óüòä
- Mentionne r√©guli√®rement EasyTransfert
"""
    
    # Construire le contexte r√©cup√©r√©
    context_section = "CONTEXTE R√âCUP√âR√â:\n\n"
    
    for i, doc in enumerate(retrieved_docs, 1):
        context_section += f"Document {i} (Pertinence: {doc['score']:.2f})\n"
        context_section += f"Source: {doc['metadata'].get('source', 'interne')}\n"
        context_section += f"Cat√©gorie: {doc['metadata']['category']}\n"
        context_section += f"Contenu: {doc['content']}\n\n"
    
    # Construire le prompt complet au format Llama 3
    prompt = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>

{system_prompt}<|eot_id|><|start_header_id|>user<|end_header_id|>

{context_section}
QUESTION: {query}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

"""
    
    return prompt

# Test
test_prompt = build_rag_prompt(test_query, retrieved)
print("Exemple de prompt RAG:")
print("=" * 80)
print(test_prompt[:1000] + "...")
print("=" * 80)

## 9. Pipeline RAG Complet

Int√©gration R√©cup√©ration + G√©n√©ration

In [None]:
def rag_chat(query: str, top_k: int = 3, min_score: float = 0.5) -> Dict:
    """
    Pipeline RAG complet: R√©cup√©ration + G√©n√©ration
    
    Returns:
        Dict avec response, sources, et m√©triques de performance
    """
    # Phase 1: R√©cup√©ration
    retrieval_start = time.time()
    retrieved_docs = retrieve_context(query, top_k, min_score)
    retrieval_time = time.time() - retrieval_start
    
    if not retrieved_docs:
        return {
            "response": "Je n'ai pas trouv√© d'information pertinente dans ma base de connaissances. Contactez le service client EasyTransfert au 2522018730 pour une assistance personnalis√©e ü§ó",
            "sources": [],
            "retrieval_time_ms": retrieval_time * 1000,
            "generation_time_ms": 0,
            "total_time_ms": retrieval_time * 1000
        }
    
    # Construire le prompt
    prompt = build_rag_prompt(query, retrieved_docs)
    
    # Phase 2: G√©n√©ration
    generation_start = time.time()
    
    inputs = tokenizer([prompt], return_tensors="pt").to(llm_model.device)
    
    outputs = llm_model.generate(
        **inputs,
        max_new_tokens=512,
        temperature=0.7,
        top_p=0.9,
        repetition_penalty=1.1,
        do_sample=True,
        pad_token_id=tokenizer.eos_token_id,
    )
    
    response = tokenizer.decode(outputs[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True)
    
    generation_time = time.time() - generation_start
    
    # Extraire les sources
    sources = [
        {
            "category": doc["metadata"]["category"],
            "source": doc["metadata"].get("source", "interne"),
            "score": doc["score"]
        }
        for doc in retrieved_docs
    ]
    
    return {
        "response": response.strip(),
        "sources": sources,
        "retrieval_time_ms": retrieval_time * 1000,
        "generation_time_ms": generation_time * 1000,
        "total_time_ms": (retrieval_time + generation_time) * 1000,
        "num_retrieved_docs": len(retrieved_docs)
    }

print("Pipeline RAG d√©fini.")

## 10. Tests et √âvaluation

In [None]:
# Tests
test_queries = [
    "Comment faire un transfert entre op√©rateurs ?",
    "Quels sont les frais de transaction ?",
    "Mon transfert n'est pas arriv√©, que faire ?",
    "J'ai oubli√© mon mot de passe",
    "Quel est le format de l'identifiant Orange ?",
    "Quelle est la limite de transfert pour Wave ?"
]

print("=" * 80)
print("TESTS DU SYST√àME RAG")
print("=" * 80)

for i, query in enumerate(test_queries, 1):
    print(f"\nTest {i}: {query}")
    print("-" * 80)
    
    result = rag_chat(query)
    
    print(f"R√©ponse: {result['response']}")
    print(f"\nPerformance:")
    print(f"  - R√©cup√©ration: {result['retrieval_time_ms']:.0f}ms")
    print(f"  - G√©n√©ration: {result['generation_time_ms']:.0f}ms")
    print(f"  - Total: {result['total_time_ms']:.0f}ms")
    print(f"  - Documents r√©cup√©r√©s: {result['num_retrieved_docs']}")
    print(f"\nSources utilis√©es:")
    for src in result['sources']:
        print(f"  - {src['category']} (score: {src['score']:.2f})")
    print("=" * 80)

## 11. M√©triques de Performance

In [None]:
import numpy as np

# Collecter les m√©triques
metrics = {
    "retrieval_times": [],
    "generation_times": [],
    "total_times": [],
    "num_docs_retrieved": []
}

for query in test_queries:
    result = rag_chat(query)
    metrics["retrieval_times"].append(result["retrieval_time_ms"])
    metrics["generation_times"].append(result["generation_time_ms"])
    metrics["total_times"].append(result["total_time_ms"])
    metrics["num_docs_retrieved"].append(result["num_retrieved_docs"])

print("\nM√âTRIQUES DE PERFORMANCE - ARCHITECTURE 2 (RAG)")
print("=" * 80)
print(f"R√©cup√©ration:")
print(f"  - Moyenne: {np.mean(metrics['retrieval_times']):.0f}ms")
print(f"  - Min/Max: {np.min(metrics['retrieval_times']):.0f}ms / {np.max(metrics['retrieval_times']):.0f}ms")
print(f"\nG√©n√©ration:")
print(f"  - Moyenne: {np.mean(metrics['generation_times']):.0f}ms")
print(f"  - Min/Max: {np.min(metrics['generation_times']):.0f}ms / {np.max(metrics['generation_times']):.0f}ms")
print(f"\nTemps total:")
print(f"  - Moyenne: {np.mean(metrics['total_times']):.0f}ms")
print(f"  - √âcart-type: {np.std(metrics['total_times']):.0f}ms")
print(f"\nDocuments r√©cup√©r√©s:")
print(f"  - Moyenne: {np.mean(metrics['num_docs_retrieved']):.1f}")
print("=" * 80)

## 12. Avantages et Limites de l'Architecture 2

### Avantages:
- ‚úÖ **V√©racit√©**: R√©ponses ancr√©es dans sources v√©rifiables
- ‚úÖ **Tra√ßabilit√©**: Citations des sources utilis√©es
- ‚úÖ **Actualisation**: Ajout de documents sans r√©entra√Ænement
- ‚úÖ **R√©duction hallucinations**: Contexte factuel fourni au LLM
- ‚úÖ **Transparence**: Scores de pertinence et m√©tadonn√©es

### Limites:
- ‚ùå **Latence**: ~2-3s (r√©cup√©ration + g√©n√©ration)
- ‚ùå **Complexit√©**: Pipeline multi-composants
- ‚ùå **D√©pendances**: ChromaDB + LLM + embedding model
- ‚ùå **Requ√™tes complexes**: Pas de raisonnement multi-√©tapes
- ‚ùå **Donn√©es temps r√©el**: Pas d'acc√®s aux bases transactionnelles