# üéì AI4Industry - Module 3 & 4 : RAG Vectoriel
## Mensaflow ¬© 2025 - Formation CNAM

**Objectifs :**
- ‚úÖ Comprendre le fonctionnement d'un RAG simple
- ‚úÖ Tester avec les fake datas GreenPower Solutions
- ‚úÖ Interface Gradio pour import de documents
- ‚úÖ Chatbot conversationnel

---

## üì¶ Installation des d√©pendances

In [None]:
%%capture
# Installation Ollama
!sudo apt-get install -y zstd
!curl -fsSL https://ollama.com/install.sh | sh

# Installation des packages Python avec versions compatibles
!pip install -q langchain==0.3.20 langchain-community==0.3.20 langchain-core==0.3.40
!pip install -q qdrant-client==1.7.0
!pip install -q sentence-transformers
!pip install -q langchain-ollama
!pip install -q gradio
!pip install -q pypdf
!pip install -q python-docx

print("‚úÖ Toutes les d√©pendances install√©es !")

## üöÄ D√©marrage du serveur Ollama

In [None]:
import os
import subprocess
import time

# D√©marrer Ollama en arri√®re-plan
print("üîÑ D√©marrage du serveur Ollama...")
subprocess.Popen(["ollama", "serve"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
time.sleep(5)

# T√©l√©charger Mistral 7B
print("üì• T√©l√©chargement de Mistral 7B (peut prendre 2-3 minutes)...")
!ollama pull mistral
print("‚úÖ Mistral pr√™t !")

## üß† Configuration du syst√®me RAG

In [None]:
from langchain_ollama import OllamaLLM
from langchain_community.embeddings import HuggingFaceEmbeddings
from qdrant_client import QdrantClient
from qdrant_client.models import Distance, VectorParams
from langchain_community.vectorstores import Qdrant

# 1. Initialiser le LLM
print("ü§ñ Initialisation de Mistral...")
llm = OllamaLLM(
    model="mistral",
    base_url="http://localhost:11434",
    temperature=0.7
)

# 2. Initialiser les embeddings
print("üìä Chargement du mod√®le d'embeddings...")
embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2",
    model_kwargs={'device': 'cpu'}
)

# 3. Initialiser Qdrant
print("üóÑÔ∏è Initialisation de Qdrant...")
qdrant_client = QdrantClient(location=":memory:")
collection_name = "greenpower_docs"

# Cr√©er la collection
qdrant_client.create_collection(
    collection_name=collection_name,
    vectors_config=VectorParams(size=384, distance=Distance.COSINE)
)

# 4. Cr√©er le vectorstore
vectorstore = Qdrant(
    client=qdrant_client,
    collection_name=collection_name,
    embeddings=embeddings
)

print("‚úÖ Syst√®me RAG initialis√© !")

## üìÑ Fonctions de traitement de documents

In [None]:
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.schema import Document
from PyPDF2 import PdfReader
import docx
import io

# Text splitter pour chunking
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50,
    separators=["\n\n", "\n", ". ", " ", ""]
)

def process_pdf(file):
    """Extraire texte d'un PDF"""
    try:
        pdf_reader = PdfReader(io.BytesIO(file))
        text = ""
        for page in pdf_reader.pages:
            text += page.extract_text() + "\n"
        return text
    except Exception as e:
        return f"Erreur PDF: {str(e)}"

def process_docx(file):
    """Extraire texte d'un DOCX"""
    try:
        doc = docx.Document(io.BytesIO(file))
        text = "\n".join([para.text for para in doc.paragraphs])
        return text
    except Exception as e:
        return f"Erreur DOCX: {str(e)}"

def process_txt(file):
    """Extraire texte d'un TXT"""
    try:
        text = file.decode('utf-8')
        return text
    except Exception as e:
        return f"Erreur TXT: {str(e)}"

def add_documents_to_vectorstore(files, progress=None):
    """Ajouter des documents au vectorstore"""
    if not files:
        return "‚ö†Ô∏è Aucun fichier s√©lectionn√©"
    
    all_documents = []
    status_messages = []
    
    for i, file in enumerate(files):
        try:
            filename = file.name if hasattr(file, 'name') else f"file_{i}"
            
            # Lire le contenu du fichier
            file_content = file.read() if hasattr(file, 'read') else file
            
            # Extraire le texte selon le type
            if filename.endswith('.pdf'):
                text = process_pdf(file_content)
            elif filename.endswith('.docx'):
                text = process_docx(file_content)
            elif filename.endswith('.txt'):
                text = process_txt(file_content)
            else:
                status_messages.append(f"‚ö†Ô∏è {filename}: Format non support√©")
                continue
            
            if text.startswith("Erreur"):
                status_messages.append(f"‚ùå {filename}: {text}")
                continue
            
            # Cr√©er un document
            doc = Document(
                page_content=text,
                metadata={"source": filename}
            )
            
            # D√©couper en chunks
            chunks = text_splitter.split_documents([doc])
            all_documents.extend(chunks)
            
            status_messages.append(f"‚úÖ {filename}: {len(chunks)} chunks cr√©√©s")
            
            if progress:
                progress((i + 1) / len(files))
                
        except Exception as e:
            status_messages.append(f"‚ùå {filename}: {str(e)}")
    
    # Ajouter tous les documents au vectorstore
    if all_documents:
        try:
            vectorstore.add_documents(all_documents)
            status_messages.append(f"\nüéâ Total: {len(all_documents)} chunks index√©s dans Qdrant")
        except Exception as e:
            status_messages.append(f"\n‚ùå Erreur d'indexation: {str(e)}")
    
    return "\n".join(status_messages)

print("‚úÖ Fonctions de traitement de documents pr√™tes")

## üí¨ Fonction de Chat avec RAG

In [None]:
def chat_with_rag(message, history):
    """Fonction de chat avec contexte RAG"""
    if not message.strip():
        return "‚ö†Ô∏è Veuillez entrer une question"
    
    try:
        # 1. Rechercher les documents pertinents
        relevant_docs = vectorstore.similarity_search(message, k=3)
        
        if not relevant_docs:
            return "‚ö†Ô∏è Aucun document n'a √©t√© index√©. Veuillez d'abord importer des documents."
        
        # 2. Construire le contexte
        context = "\n\n".join([f"Document {i+1} ({doc.metadata.get('source', 'N/A')}):\n{doc.page_content}" 
                                for i, doc in enumerate(relevant_docs)])
        
        # 3. Construire le prompt
        prompt = f"""Tu es un assistant IA sp√©cialis√© dans les produits GreenPower Solutions.

Contexte des documents:
{context}

Question de l'utilisateur: {message}

Instructions:
- R√©ponds uniquement en te basant sur le contexte fourni
- Si l'information n'est pas dans le contexte, dis-le clairement
- Sois pr√©cis et concis
- Cite la source si pertinent

R√©ponse:"""
        
        # 4. Obtenir la r√©ponse du LLM
        response = llm.invoke(prompt)
        
        return response
        
    except Exception as e:
        return f"‚ùå Erreur: {str(e)}"

print("‚úÖ Fonction de chat pr√™te")

## üé® Interface Gradio

In [None]:
import gradio as gr

# CSS personnalis√©
custom_css = """
.gradio-container {
    font-family: 'Arial', sans-serif;
}
.header {
    text-align: center;
    padding: 20px;
    background: linear-gradient(135deg, #667eea 0%, #764ba2 100%);
    color: white;
    border-radius: 10px;
    margin-bottom: 20px;
}
"""

# Cr√©er l'interface
with gr.Blocks(css=custom_css, theme=gr.themes.Soft()) as demo:
    
    # Header
    gr.HTML("""
    <div class="header">
        <h1>üéì AI4Industry - RAG Vectoriel</h1>
        <h3>Mensaflow ¬© 2025 - Formation CNAM</h3>
        <p>Module 3 & 4 : Chatbot avec RAG + GreenPower Solutions</p>
    </div>
    """)
    
    with gr.Row():
        # Colonne gauche : Import de documents
        with gr.Column(scale=1):
            gr.Markdown("## üìÇ Import de Documents")
            gr.Markdown("""
            **Formats support√©s:**
            - üìÑ PDF (.pdf)
            - üìù Texte (.txt)
            - üìÉ Word (.docx)
            """)
            
            file_input = gr.File(
                label="S√©lectionnez vos documents",
                file_count="multiple",
                file_types=[".pdf", ".txt", ".docx"]
            )
            
            upload_btn = gr.Button("üì§ Indexer les documents", variant="primary")
            upload_status = gr.Textbox(
                label="Status d'indexation",
                lines=10,
                interactive=False
            )
            
            gr.Markdown("""
            ---
            ### üìä Statistiques
            """)
            
            stats_btn = gr.Button("üîç Afficher statistiques")
            stats_output = gr.Textbox(
                label="Statistiques Qdrant",
                lines=5,
                interactive=False
            )
        
        # Colonne droite : Chat
        with gr.Column(scale=2):
            gr.Markdown("## üí¨ Chat avec RAG")
            gr.Markdown("""
            Posez vos questions sur les documents GreenPower Solutions index√©s.
            Le syst√®me utilisera le RAG pour trouver les informations pertinentes.
            """)
            
            chatbot = gr.Chatbot(
                height=500,
                label="Assistant GreenPower",
                avatar_images=(None, "ü§ñ")
            )
            
            msg = gr.Textbox(
                label="Votre question",
                placeholder="Ex: Quels sont les produits GreenPower disponibles ?",
                lines=2
            )
            
            with gr.Row():
                submit_btn = gr.Button("üöÄ Envoyer", variant="primary")
                clear_btn = gr.Button("üóëÔ∏è Effacer", variant="secondary")
            
            gr.Markdown("""
            ---
            ### üí° Questions sugg√©r√©es:
            - Quels sont les produits disponibles ?
            - Quelle est la capacit√© batterie du PG-M01 ?
            - Quel syst√®me convient pour un festival de 3 jours ?
            - Combien co√ªte le PG-P01 ?
            """)
    
    # Footer
    gr.HTML("""
    <div style="text-align: center; padding: 20px; color: #666;">
        <p><strong>Stack Technique:</strong> Mistral 7B (Ollama) + Qdrant + LangChain + Gradio</p>
        <p>D√©velopp√© par Mensaflow pour AI4Industry CNAM 2025</p>
    </div>
    """)
    
    # √âv√©nements
    def get_stats():
        try:
            collection_info = qdrant_client.get_collection(collection_name)
            return f"""üìä Statistiques Qdrant:
            
üì¶ Collection: {collection_name}
üìù Nombre de vectors: {collection_info.vectors_count}
üìè Dimension: 384
üìê Distance: Cosine
‚úÖ Status: Op√©rationnel
"""
        except Exception as e:
            return f"‚ùå Erreur: {str(e)}"
    
    # Lier les √©v√©nements
    upload_btn.click(
        fn=add_documents_to_vectorstore,
        inputs=[file_input],
        outputs=[upload_status]
    )
    
    stats_btn.click(
        fn=get_stats,
        outputs=[stats_output]
    )
    
    msg.submit(
        fn=chat_with_rag,
        inputs=[msg, chatbot],
        outputs=[chatbot]
    ).then(
        lambda: "",
        outputs=[msg]
    )
    
    submit_btn.click(
        fn=chat_with_rag,
        inputs=[msg, chatbot],
        outputs=[chatbot]
    ).then(
        lambda: "",
        outputs=[msg]
    )
    
    clear_btn.click(lambda: None, None, chatbot, queue=False)

# Lancer l'interface
print("üöÄ Lancement de l'interface Gradio...")
demo.launch(share=True, debug=True)

---
## üìö Instructions pour les √©tudiants

### √âtape 1 : Importer les documents GreenPower
1. T√©l√©chargez les fake datas GreenPower depuis le dossier partag√©
2. Dans la colonne de gauche, cliquez sur "S√©lectionnez vos documents"
3. S√©lectionnez plusieurs fichiers (PDF, TXT, DOCX)
4. Cliquez sur "üì§ Indexer les documents"
5. Attendez le message de confirmation

### √âtape 2 : Tester le RAG
1. Dans la zone de chat, posez une question sur GreenPower
2. Observez comment le syst√®me :
   - Recherche les documents pertinents
   - Construit le contexte
   - G√©n√®re une r√©ponse avec Mistral

### √âtape 3 : Analyser les performances
1. Cliquez sur "üîç Afficher statistiques"
2. Notez le nombre de chunks index√©s
3. Testez diff√©rentes questions et observez la qualit√© des r√©ponses

### Questions √† explorer :
- Le RAG trouve-t-il toujours les bonnes informations ?
- Que se passe-t-il si on pose une question hors contexte ?
- Comment am√©liorer la qualit√© du chunking ?
- Quelles sont les limites du RAG vectoriel simple ?

---
## üéØ Objectifs p√©dagogiques atteints

‚úÖ Comprendre l'architecture d'un RAG  
‚úÖ Ma√Ætriser le chunking de documents  
‚úÖ Utiliser une base vectorielle (Qdrant)  
‚úÖ Int√©grer un LLM local (Ollama + Mistral)  
‚úÖ Cr√©er une interface utilisateur (Gradio)  

**Prochaine √©tape :** Module 5 - GraphRAG pour d√©passer les limites du RAG vectoriel !

---
**Mensaflow ¬© 2025 - Formation AI4Industry CNAM**