# Systeme de RAG open source complete

In [9]:
"""
Syst√®me RAG 100% Open Source
Embeddings: sentence-transformers
VectorDB: ChromaDB
LLM: Mistral via Ollama (ou Groq)
"""

import os
from typing import List, Dict
from sentence_transformers import SentenceTransformer
import chromadb
from chromadb.config import Settings
import requests
import json

class RAGSystem:
    def __init__(self, use_local_llm=True):
        """
        Initialise le syst√®me RAG
        
        Args:
            use_local_llm: True pour Ollama local, False pour API Groq
        """
        print("üöÄ Initialisation du syst√®me RAG...")
        
        # 1. Mod√®le d'embeddings (multilingue, l√©ger)
        print("üìä Chargement du mod√®le d'embeddings...")
        self.embedding_model = SentenceTransformer(
            'sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2'
        )
        
        # 2. Base de donn√©es vectorielle ChromaDB
        print("üíæ Initialisation de ChromaDB...")
        self.chroma_client = chromadb.Client(Settings(
            anonymized_telemetry=False,
            allow_reset=True
        ))
        
        # Cr√©er ou r√©cup√©rer une collection
        self.collection = self.chroma_client.get_or_create_collection(
            name="documents",
            metadata={"hnsw:space": "cosine"}  # Similarit√© cosinus
        )
        
        # 3. Configuration du LLM
        self.use_local_llm = use_local_llm
        if use_local_llm:
            self.llm_url = "http://localhost:11434/api/generate"
            self.llm_model = "mistral"
            print("ü§ñ LLM: Mistral (Ollama local)")
        else:
            # Pour utiliser Groq, d√©finir GROQ_API_KEY dans .env
            self.groq_api_key = os.getenv("GROQ_API_KEY", "")
            self.llm_model = "llama3-8b-8192"
            print("ü§ñ LLM: Groq API")
        
        print("‚úÖ Syst√®me RAG initialis√© avec succ√®s!\n")
    
    def add_documents(self, documents: List[str], metadatas: List[Dict] = None):
        """
        Ajoute des documents √† la base vectorielle
        
        Args:
            documents: Liste de textes √† indexer
            metadatas: M√©tadonn√©es optionnelles pour chaque document
        """
        print(f"üìù Ajout de {len(documents)} documents...")
        
        # G√©n√©rer les embeddings
        embeddings = self.embedding_model.encode(
            documents,
            show_progress_bar=True,
            convert_to_numpy=True
        )
        
        # Cr√©er des IDs uniques
        ids = [f"doc_{i}" for i in range(len(documents))]
        
        # Pr√©parer les m√©tadonn√©es si non fournies
        if metadatas is None:
            metadatas = [{"source": f"document_{i}"} for i in range(len(documents))]
        
        # Ajouter √† ChromaDB
        self.collection.add(
            embeddings=embeddings.tolist(),
            documents=documents,
            metadatas=metadatas,
            ids=ids
        )
        
        print(f"‚úÖ {len(documents)} documents ajout√©s avec succ√®s!\n")
    
    def search_similar(self, query: str, n_results: int = 3) -> Dict:
        """
        Recherche les documents les plus similaires √† la requ√™te
        
        Args:
            query: Question de l'utilisateur
            n_results: Nombre de documents √† retourner
            
        Returns:
            Dictionnaire contenant documents, distances et m√©tadonn√©es
        """
        # G√©n√©rer l'embedding de la requ√™te
        query_embedding = self.embedding_model.encode(
            [query],
            convert_to_numpy=True
        )
        
        # Recherche dans ChromaDB
        results = self.collection.query(
            query_embeddings=query_embedding.tolist(),
            n_results=n_results
        )
        
        return results
    
    def generate_answer_local(self, query: str, context: str) -> str:
        """
        G√©n√®re une r√©ponse avec Ollama (local)
        """
        prompt = f"""Tu es un assistant IA qui r√©pond aux questions en te basant sur le contexte fourni.

Contexte:
{context}

Question: {query}

Instructions:
- R√©ponds uniquement en te basant sur le contexte fourni
- Si la r√©ponse n'est pas dans le contexte, dis-le clairement
- Sois pr√©cis et concis
- Cite les sources si possible

R√©ponse:"""

        payload = {
            "model": self.llm_model,
            "prompt": prompt,
            "stream": False,
            "options": {
                "temperature": 0.3,
                "num_predict": 512
            }
        }
        
        try:
            response = requests.post(self.llm_url, json=payload, timeout=60)
            response.raise_for_status()
            return response.json()["response"]
        except Exception as e:
            return f"‚ùå Erreur lors de la g√©n√©ration: {str(e)}"
    
    def generate_answer_groq(self, query: str, context: str) -> str:
        """
        G√©n√®re une r√©ponse avec Groq API
        """
        if not self.groq_api_key:
            return "‚ùå GROQ_API_KEY non d√©finie. Cr√©ez un fichier .env avec votre cl√© API."
        
        url = "https://api.groq.com/openai/v1/chat/completions"
        headers = {
            "Authorization": f"Bearer {self.groq_api_key}",
            "Content-Type": "application/json"
        }
        
        payload = {
            "model": self.llm_model,
            "messages": [
                {
                    "role": "system",
                    "content": "Tu es un assistant qui r√©pond aux questions en te basant uniquement sur le contexte fourni."
                },
                {
                    "role": "user",
                    "content": f"Contexte:\n{context}\n\nQuestion: {query}"
                }
            ],
            "temperature": 0.3,
            "max_tokens": 512
        }
        
        try:
            response = requests.post(url, headers=headers, json=payload, timeout=30)
            response.raise_for_status()
            return response.json()["choices"][0]["message"]["content"]
        except Exception as e:
            return f"‚ùå Erreur Groq: {str(e)}"
    
    def query(self, question: str, n_results: int = 3) -> Dict:
        """
        Pipeline RAG complet: Question ‚Üí Recherche ‚Üí G√©n√©ration
        
        Args:
            question: Question de l'utilisateur
            n_results: Nombre de documents √† utiliser comme contexte
            
        Returns:
            Dictionnaire avec la r√©ponse et les sources
        """
        print(f"‚ùì Question: {question}\n")
        
        # 1. Recherche vectorielle
        print("üîç Recherche des documents pertinents...")
        search_results = self.search_similar(question, n_results)
        
        if not search_results['documents'][0]:
            return {
                "answer": "Aucun document pertinent trouv√© dans la base.",
                "sources": []
            }
        
        # 2. Pr√©parer le contexte
        documents = search_results['documents'][0]
        metadatas = search_results['metadatas'][0]
        distances = search_results['distances'][0]
        
        context = "\n\n---\n\n".join([
            f"[Document {i+1}] (Similarit√©: {1-dist:.2%})\n{doc}"
            for i, (doc, dist) in enumerate(zip(documents, distances))
        ])
        
        print(f"üìö {len(documents)} documents trouv√©s\n")
        
        # 3. G√©n√©ration de la r√©ponse
        print("ü§ñ G√©n√©ration de la r√©ponse...")
        if self.use_local_llm:
            answer = self.generate_answer_local(question, context)
        else:
            answer = self.generate_answer_groq(question, context)
        
        # 4. Pr√©parer les sources
        sources = [
            {
                "content": doc[:200] + "..." if len(doc) > 200 else doc,
                "metadata": meta,
                "similarity": f"{(1-dist)*100:.1f}%"
            }
            for doc, meta, dist in zip(documents, metadatas, distances)
        ]
        
        return {
            "answer": answer,
            "sources": sources
        }
    
    def reset_database(self):
        """R√©initialise la base de donn√©es vectorielle"""
        self.chroma_client.reset()
        self.collection = self.chroma_client.get_or_create_collection(
            name="documents",
            metadata={"hnsw:space": "cosine"}
        )
        print("üóëÔ∏è Base de donn√©es r√©initialis√©e")


# ============================================================================
# EXEMPLE D'UTILISATION
# ============================================================================

if __name__ == "__main__":
    # Initialiser le syst√®me RAG
    # use_local_llm=True pour Ollama, False pour Groq
    rag = RAGSystem(use_local_llm=True)
    
    # Documents exemples (remplacez par vos propres donn√©es)
    documents = [
        """L'intelligence artificielle (IA) est l'ensemble des th√©ories et des techniques 
        mises en ≈ìuvre en vue de r√©aliser des machines capables de simuler l'intelligence humaine. 
        Elle regroupe des domaines comme l'apprentissage automatique, le traitement du langage 
        naturel et la vision par ordinateur.""",
        
        """Le RAG (Retrieval-Augmented Generation) est une technique qui combine la recherche 
        d'informations et la g√©n√©ration de texte. Il permet aux mod√®les de langage d'acc√©der 
        √† des bases de connaissances externes pour fournir des r√©ponses plus pr√©cises et √† jour.""",
        
        """ChromaDB est une base de donn√©es vectorielle open source optimis√©e pour les embeddings. 
        Elle permet de stocker et rechercher des vecteurs de haute dimension de mani√®re efficace, 
        ce qui la rend id√©ale pour les applications d'IA comme le RAG.""",
        
        """Mistral est un mod√®le de langage open source d√©velopp√© par Mistral AI en France. 
        Il offre d'excellentes performances en fran√ßais et peut √™tre ex√©cut√© localement via 
        des outils comme Ollama, sans n√©cessiter de connexion internet."""
    ]
    
    metadatas = [
        {"source": "wikipedia", "topic": "IA"},
        {"source": "documentation", "topic": "RAG"},
        {"source": "documentation", "topic": "ChromaDB"},
        {"source": "blog", "topic": "Mistral"}
    ]
    
    # Ajouter les documents
    rag.add_documents(documents, metadatas)
    
    # Poser des questions
    print("="*60)
    print("D√âMONSTRATION DU SYST√àME RAG")
    print("="*60 + "\n")
    
    questions = [
        "Qu'est-ce que le RAG ?",
        "Pourquoi utiliser ChromaDB ?",
        "Quelles sont les capacit√©s de Mistral ?"
    ]
    
    for i, question in enumerate(questions, 1):
        print(f"\n{'='*60}")
        print(f"QUESTION {i}")
        print('='*60)
        
        result = rag.query(question, n_results=2)
        
        print(f"\nüí° R√âPONSE:\n{result['answer']}\n")
        
        print("üìñ SOURCES UTILIS√âES:")
        for j, source in enumerate(result['sources'], 1):
            print(f"\n  [{j}] Similarit√©: {source['similarity']}")
            print(f"      Sujet: {source['metadata']['topic']}")
            print(f"      Extrait: {source['content'][:100]}...")
        
        print("\n" + "="*60)

üöÄ Initialisation du syst√®me RAG...
üìä Chargement du mod√®le d'embeddings...
üíæ Initialisation de ChromaDB...
ü§ñ LLM: Mistral (Ollama local)
‚úÖ Syst√®me RAG initialis√© avec succ√®s!

üìù Ajout de 4 documents...


Batches:   0%|          | 0/1 [00:00<?, ?it/s]

‚úÖ 4 documents ajout√©s avec succ√®s!

D√âMONSTRATION DU SYST√àME RAG


QUESTION 1
‚ùì Question: Qu'est-ce que le RAG ?

üîç Recherche des documents pertinents...
üìö 2 documents trouv√©s

ü§ñ G√©n√©ration de la r√©ponse...

üí° R√âPONSE:
‚ùå Erreur lors de la g√©n√©ration: 404 Client Error: Not Found for url: http://localhost:11434/api/generate

üìñ SOURCES UTILIS√âES:

  [1] Similarit√©: 45.6%
      Sujet: RAG
      Extrait: Le RAG (Retrieval-Augmented Generation) est une technique qui combine la recherche 
        d'inform...

  [2] Similarit√©: 19.5%
      Sujet: ChromaDB
      Extrait: ChromaDB est une base de donn√©es vectorielle open source optimis√©e pour les embeddings. 
        Ell...


QUESTION 2
‚ùì Question: Pourquoi utiliser ChromaDB ?

üîç Recherche des documents pertinents...
üìö 2 documents trouv√©s

ü§ñ G√©n√©ration de la r√©ponse...

üí° R√âPONSE:
‚ùå Erreur lors de la g√©n√©ration: 404 Client Error: Not Found for url: http://localhost:11434/api/generate

