In [None]:
# üì¶ Installation des d√©pendances
!pip install -q ollama langchain-ollama langchain langchain-community beautifulsoup4 langgraph chromadb requests

# üîÑ Installation et d√©marrage d'Ollama sur Colab
import subprocess
import time
import os
import requests
from IPython.display import clear_output

print("üîß Installation d'Ollama...")
!curl -fsSL https://ollama.com/install.sh | sh

# D√©marrer Ollama en arri√®re-plan
print("üöÄ D√©marrage d'Ollama...")
process = subprocess.Popen(
    ["ollama", "serve"],
    stdout=subprocess.PIPE,
    stderr=subprocess.PIPE,
    env={**os.environ, "OLLAMA_HOST": "0.0.0.0:11434"}
)
time.sleep(10)  # Plus de temps pour Colab

# V√©rification du service
try:
    response = requests.get("http://localhost:11434/api/version", timeout=5)
    print("‚úÖ Ollama d√©marr√© avec succ√®s")
except:
    print("‚ö†Ô∏è Ollama pourrait encore d√©marrer...")
    time.sleep(5)

# ‚¨áÔ∏è T√©l√©chargement du mod√®le
print("üì• T√©l√©chargement du mod√®le...")
!ollama pull llama3.2

clear_output(wait=True)
print("‚úÖ Installation termin√©e !")

‚úÖ Installation termin√©e !


In [None]:
# ==================== IMPORTS ET CONFIGURATION ====================
from typing import List, TypedDict, Optional
from langchain_core.documents import Document
from langchain_community.vectorstores import Chroma
from langchain_ollama import OllamaEmbeddings, ChatOllama
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langgraph.graph import StateGraph, END
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
import logging

# Configuration
MODEL_NAME = "llama3.2"
llm = ChatOllama(model=MODEL_NAME, temperature=0.3, base_url="http://localhost:11434")
embedding = OllamaEmbeddings(model=MODEL_NAME, base_url="http://localhost:11434")

# ==================== √âTAT DE L'AGENT ====================
class AgentState(TypedDict):
    question: str
    documents: List[Document]
    rewritten_question: Optional[str]
    is_relevant: bool
    attempts: int
    max_attempts: int
    final_answer: str

# ==================== BASE DE CONNAISSANCES SIMPLE ====================
class SimpleKnowledgeBase:
    """Base de connaissances simple pour √©viter les probl√®mes de scraping"""

    def __init__(self):
        self.documents = self._create_documents()
        self.vectorstore = None
        self._setup_vectorstore()

    def _create_documents(self) -> List[Document]:
        """Cr√©e des documents de base sur l'IA"""
        knowledge = [
            {
                "content": """L'intelligence artificielle (IA) est une technologie qui permet aux machines de simuler l'intelligence humaine. Elle inclut l'apprentissage automatique, le traitement du langage naturel, la vision par ordinateur et la robotique. L'IA peut √™tre faible (sp√©cialis√©e dans une t√¢che) ou forte (intelligence g√©n√©rale). Les applications incluent les assistants virtuels, les voitures autonomes, la reconnaissance vocale et les syst√®mes de recommandation.""",
                "source": "base_ia",
                "title": "Introduction √† l'IA"
            },
            {
                "content": """L'apprentissage automatique (machine learning) est une sous-discipline de l'IA qui permet aux syst√®mes d'apprendre automatiquement √† partir de donn√©es sans √™tre explicitement programm√©s. Il existe trois types principaux : supervis√© (avec √©tiquettes), non-supervis√© (sans √©tiquettes) et par renforcement (avec r√©compenses). Les algorithmes populaires incluent les r√©seaux de neurones, les arbres de d√©cision, et les SVM.""",
                "source": "base_ml",
                "title": "Machine Learning"
            },
            {
                "content": """Les r√©seaux de neurones artificiels s'inspirent du fonctionnement du cerveau humain. Ils sont compos√©s de couches de neurones interconnect√©s qui traitent l'information. L'apprentissage profond utilise des r√©seaux multicouches pour r√©soudre des probl√®mes complexes. Les architectures populaires incluent les r√©seaux convolutifs (CNN) pour les images et les r√©seaux r√©currents (RNN) pour les s√©quences.""",
                "source": "base_nn",
                "title": "R√©seaux de Neurones"
            },
            {
                "content": """L'IA est pr√©sente dans notre quotidien : assistants vocaux (Siri, Alexa), recommandations Netflix, GPS avec optimisation d'itin√©raires, filtrage des emails, traduction automatique, reconnaissance faciale sur les photos, chatbots du service client, et algorithmes des r√©seaux sociaux. Ces applications facilitent nos t√¢ches quotidiennes et am√©liorent notre exp√©rience utilisateur.""",
                "source": "base_applications",
                "title": "IA au quotidien"
            }
        ]

        docs = []
        for item in knowledge:
            doc = Document(
                page_content=item["content"],
                metadata={"source": item["source"], "title": item["title"]}
            )
            docs.append(doc)
        return docs

    def _setup_vectorstore(self):
        """Configuration de la base vectorielle"""
        try:
            print("üîß Configuration de la base vectorielle...")

            # Diviser en chunks plus petits
            text_splitter = RecursiveCharacterTextSplitter(
                chunk_size=400,
                chunk_overlap=50,
                length_function=len
            )

            splits = text_splitter.split_documents(self.documents)
            print(f"üìÑ {len(splits)} chunks cr√©√©s")

            # Cr√©er la base vectorielle
            self.vectorstore = Chroma.from_documents(
                documents=splits,
                embedding=embedding,
                collection_name="simple_ia_kb"
            )
            print("‚úÖ Base vectorielle pr√™te")

        except Exception as e:
            print(f"‚ùå Erreur vectorielle: {e}")
            self.vectorstore = None

    def search(self, query: str, k: int = 2) -> List[Document]:
        """Recherche dans la base"""
        if not self.vectorstore or not query.strip():
            return []

        try:
            retriever = self.vectorstore.as_retriever(search_kwargs={"k": k})
            return retriever.invoke(query)
        except Exception as e:
            print(f"‚ö†Ô∏è Erreur de recherche: {e}")
            return []

# ==================== INITIALISATION ====================
print("üîß Initialisation de la base de connaissances...")
knowledge_base = SimpleKnowledgeBase()

# ==================== FONCTIONS DE L'AGENT ====================
def retrieve_documents(state: AgentState) -> dict:
    """R√©cup√®re les documents pertinents"""
    question = state.get("rewritten_question") or state["question"]
    documents = knowledge_base.search(question)
    print(f"üìö {len(documents)} documents trouv√©s")
    return {"documents": documents}

def evaluate_relevance(state: AgentState) -> dict:
    """√âvalue la pertinence des documents"""
    docs = state["documents"]

    if not docs:
        return {"is_relevant": False}

    # Simple heuristique : si on a des documents, ils sont probablement pertinents
    return {"is_relevant": len(docs) > 0}

def rewrite_question(state: AgentState) -> dict:
    """Reformule la question"""
    try:
        original = state["question"]

        prompt = ChatPromptTemplate.from_messages([
            ("system", "Reformule cette question sur l'intelligence artificielle pour am√©liorer la recherche. Garde le sens original mais rends-la plus pr√©cise."),
            ("human", f"Question: {original}")
        ])

        chain = prompt | llm | StrOutputParser()
        rewritten = chain.invoke({})

        return {
            "rewritten_question": rewritten.strip(),
            "attempts": state["attempts"] + 1
        }
    except Exception as e:
        print(f"‚ö†Ô∏è Erreur reformulation: {e}")
        return {
            "rewritten_question": state["question"],
            "attempts": state["attempts"] + 1
        }

def generate_answer(state: AgentState) -> dict:
    """G√©n√®re la r√©ponse finale"""
    try:
        question = state.get("rewritten_question") or state["question"]
        docs = state["documents"]

        if not docs:
            return {"final_answer": "ü§î Je n'ai pas trouv√© d'informations sp√©cifiques sur ce sujet dans ma base de connaissances."}

        # Pr√©parer le contexte
        context_parts = []
        for i, doc in enumerate(docs[:2], 1):  # Limiter √† 2 documents
            content = doc.page_content[:300]  # Limiter la longueur
            context_parts.append(f"Source {i}: {content}")

        context = "\n\n".join(context_parts)

        prompt = ChatPromptTemplate.from_messages([
            ("system", """Tu es un expert en intelligence artificielle. R√©ponds de mani√®re claire, concise et p√©dagogique en fran√ßais.
            Utilise les informations fournies et structure ta r√©ponse avec des exemples concrets quand c'est possible."""),
            ("human", f"Question: {question}\n\nInformations disponibles:\n{context}\n\nR√©ponds en fran√ßais:")
        ])

        chain = prompt | llm | StrOutputParser()
        answer = chain.invoke({})

        return {"final_answer": f"ü§ñ {answer.strip()}"}

    except Exception as e:
        print(f"‚ö†Ô∏è Erreur g√©n√©ration: {e}")
        return {"final_answer": f"‚ùå Erreur lors de la g√©n√©ration de la r√©ponse: {str(e)}"}

def should_continue(state: AgentState) -> str:
    """D√©cide de la suite du workflow"""
    if state["is_relevant"] or state["attempts"] >= state["max_attempts"]:
        return "generate"
    return "rewrite"

# ==================== CR√âATION DU WORKFLOW ====================
print("üîó Configuration du workflow...")

workflow = StateGraph(AgentState)
workflow.add_node("retrieve", retrieve_documents)
workflow.add_node("evaluate", evaluate_relevance)
workflow.add_node("rewrite", rewrite_question)
workflow.add_node("generate", generate_answer)

workflow.set_entry_point("retrieve")
workflow.add_edge("retrieve", "evaluate")
workflow.add_conditional_edges(
    "evaluate",
    should_continue,
    {"rewrite": "rewrite", "generate": "generate"}
)
workflow.add_edge("rewrite", "retrieve")
workflow.add_edge("generate", END)

agent = workflow.compile()
print("‚úÖ Agent RAG pr√™t !")

# ==================== FONCTIONS DE TEST ====================
def tester_agent():
    """Test automatique simplifi√©"""
    print("\nüß™ **TEST DE L'AGENT**")
    print("=" * 50)

    questions = [
        "Qu'est-ce que l'intelligence artificielle ?",
        "Explique-moi le machine learning",
        "Comment fonctionnent les r√©seaux de neurones ?",
        "Donne des exemples d'IA au quotidien"
    ]

    for i, question in enumerate(questions, 1):
        print(f"\n--- Test {i}/{len(questions)} ---")
        print(f"‚ùì {question}")

        try:
            state = {
                "question": question,
                "documents": [],
                "rewritten_question": None,
                "is_relevant": False,
                "attempts": 0,
                "max_attempts": 2,
                "final_answer": ""
            }

            result = agent.invoke(state)
            print(f"\n{result['final_answer']}\n")

        except Exception as e:
            print(f"‚ùå Erreur: {e}")

def mode_interactif():
    """Mode conversation interactive"""
    print("\nüí¨ **MODE INTERACTIF**")
    print("Tapez 'quit' pour arr√™ter")
    print("=" * 40)

    while True:
        try:
            question = input("\n‚ùì Votre question: ").strip()

            if question.lower() in ['quit', 'exit', 'stop', 'q']:
                print("üëã Au revoir !")
                break

            if not question:
                continue

            print("üîÑ R√©flexion...")

            state = {
                "question": question,
                "documents": [],
                "rewritten_question": None,
                "is_relevant": False,
                "attempts": 0,
                "max_attempts": 2,
                "final_answer": ""
            }

            result = agent.invoke(state)
            print(f"\n{result['final_answer']}\n")

        except KeyboardInterrupt:
            print("\nüëã Au revoir !")
            break
        except Exception as e:
            print(f"‚ùå Erreur: {e}")


üîß Initialisation de la base de connaissances...
üîß Configuration de la base vectorielle...
üìÑ 6 chunks cr√©√©s
‚úÖ Base vectorielle pr√™te
üîó Configuration du workflow...
‚úÖ Agent RAG pr√™t !


In [None]:
# ==================== LANCEMENT ====================
print("\nüéØ **CHOISISSEZ VOTRE MODE:**")
print("1. Test automatique: tester_agent()")
print("2. Mode interactif: mode_interactif()")
print("\nüìù **Exemple d'utilisation:**")
print("tester_agent()  # Lance les tests")
print("# ou")
print("mode_interactif()  # Lance le mode conversation")

# Lancer le test automatique par d√©faut
tester_agent()


üéØ **CHOISISSEZ VOTRE MODE:**
1. Test automatique: tester_agent()
2. Mode interactif: mode_interactif()

üìù **Exemple d'utilisation:**
tester_agent()  # Lance les tests
# ou
mode_interactif()  # Lance le mode conversation

üß™ **TEST DE L'AGENT**

--- Test 1/4 ---
‚ùì Qu'est-ce que l'intelligence artificielle ?
üìö 2 documents trouv√©s

ü§ñ L'intelligence artificielle (IA) est une branche de l'informatique qui concerne le d√©veloppement d'algorithmes et de syst√®mes capables d'effectuer des t√¢ches qui, √† l'origine, n√©cessitaient un intelligence humaine. L'IA utilise les techniques de l'apprentissage automatique, du traitement du langage naturel, de la reconnaissance visuelle et d'autres domaines pour r√©soudre des probl√®mes complexes.

En fonction des informations disponibles, il est clair que l'intelligence artificielle est pr√©sente dans notre quotidien sous diff√©rentes formes. Voici quelques exemples concrets :

*   **Assistants virtuels** : comme Siri, Alexa ou Google 