# Prendre en main LangChain pas √† pas

Objectif de ce notebook :  
- Comprendre les **briques de base** de LangChain (LLM, prompt, chain).  
- Visualiser un **sch√©ma simple** de pipeline.  
- Construire un mini **pipeline de question/r√©ponse**, puis un mini **pipeline RAG simplifi√©**.

> Remarque : ce notebook utilise un **LLM local** (Ollama ou LM Studio) configur√© via le fichier `.env`.

## Les briques de base de LangChain

On va manipuler 3 briques principales :

1. **LLM** : le mod√®le de langage (par ex. `gpt-4o-mini`)  
2. **Prompt** : la mani√®re dont on parle au mod√®le (system + user + variables)  
3. **Chain** : l‚Äôassemblage **d√©claratif** des √©tapes (pipeline de traitement)

On peut imaginer ce sch√©ma tr√®s simple :

```text
              +---------------------------+
User input -> |   PromptTemplate          | -> texte format√©
              +---------------------------+
                           |
                           v
                     +-----------+
                     |   LLM     | -> r√©ponse brute du mod√®le
                     +-----------+
                           |
                           v
                   +------------------+
                   | Output Parser    | -> string / JSON / etc.
                   +------------------+
```  
LangChain permet de **d√©crire ce pipeline en Python**, plut√¥t que de tout reprogrammer √† la main.

## üîß Installation (√† faire une fois dans votre environnement)

D√©commentez et ex√©cutez la cellule ci-dessous si besoin.

In [10]:
!pip install -U langchain-core langchain-ollama python-dotenv
# Pour LM Studio (API compatible OpenAI):
!pip install -U langchain-openai python-dotenv
# Optionnel : outils suppl√©mentaires
# !pip install -U langchain-text-splitters



## ‚öôÔ∏è Initialisation du LLM

On cr√©e un objet LLM local qui sera la brique "mod√®le de langage" c√¥t√© LangChain.
Vous pouvez utiliser soit **Ollama** soit **LM Studio** en modifiant le fichier `.env`.

In [11]:
import os
from dotenv import load_dotenv

# Charger les variables d'environnement depuis le fichier .env
load_dotenv()

# Configuration du LLM local
llm_type = os.getenv("LOCAL_LLM_TYPE", "ollama")

if llm_type == "ollama":
    from langchain_ollama import ChatOllama
    
    ollama_base_url = os.getenv("OLLAMA_BASE_URL", "http://localhost:11434")
    ollama_model = os.getenv("OLLAMA_MODEL", "llama3.2:latest")
    
    model = ChatOllama(
        model=ollama_model,
        base_url=ollama_base_url,
        temperature=0.2,
    )
    print(f"Utilisation d'Ollama avec le mod√®le {ollama_model}")
    
elif llm_type == "lmstudio":
    from langchain_openai import ChatOpenAI
    
    lmstudio_base_url = os.getenv("LMSTUDIO_BASE_URL", "http://localhost:1234/v1")
    lmstudio_model = os.getenv("LMSTUDIO_MODEL", "local-model")
    
    model = ChatOpenAI(
        model=lmstudio_model,
        base_url=lmstudio_base_url,
        api_key="not-needed",  # LM Studio ne n√©cessite pas de cl√© API
        temperature=0.2,
    )
    print(f"Utilisation de LM Studio avec le mod√®le {lmstudio_model}")
    
else:
    raise ValueError(f"LOCAL_LLM_TYPE non reconnu: {llm_type}. Utilisez 'ollama' ou 'lmstudio'.")

model

Utilisation de LM Studio avec le mod√®le mistralai/devstral-small-2-2512


ChatOpenAI(profile={}, client=<openai.resources.chat.completions.completions.Completions object at 0x11139dc60>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x11139e140>, root_client=<openai.OpenAI object at 0x11139de10>, root_async_client=<openai.AsyncOpenAI object at 0x11139e020>, model_name='mistralai/devstral-small-2-2512', temperature=0.2, model_kwargs={}, openai_api_key=SecretStr('**********'), openai_api_base='http://localhost:1234/v1')

## 1Ô∏è‚É£ Premier appel au LLM via LangChain

On commence par l‚Äôusage le plus simple : on envoie une liste de messages au mod√®le.

In [12]:
from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage(content="Tu es un assistant p√©dagogique, clair et concis."),
    HumanMessage(content="Explique en deux phrases ce qu'est un mod√®le de langage."),
]

response = model.invoke(messages)
print(response.content)

Un mod√®le de langage est un algorithme d'intelligence artificielle entra√Æn√© sur d'√©normes quantit√©s de texte pour comprendre et g√©n√©rer du langage humain. Il utilise des techniques comme le *deep learning* (r√©seaux de neurones) pour pr√©dire et produire des phrases coh√©rentes en fonction du contexte donn√©.


## 2Ô∏è‚É£ S√©parer le **prompt** et le **mod√®le**

Plut√¥t que de construire les messages √† la main, on d√©crit un **template de conversation**.

On utilise `ChatPromptTemplate` pour d√©finir :
- le r√¥le syst√®me (persona),
- le message utilisateur avec une **variable `{question}`**.

In [13]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", f"Tu es un assistant IA qui vulgarise pour un public de d√©veloppeurs curieux."),
        ("human", "Question : {question}"),
    ]
)


# LCEL: LangChain Expression Language
chain = prompt | model 

answer = chain.invoke({"question": "Quelle est la diff√©rence entre un LLM et LangChain ?"})
print(answer)



content='Ah, excellente question ! Je vais te l\'expliquer simplement avec des analogies et des concepts que tu connais d√©j√† en tant que d√©veloppeur.\n\n### **1. LLM (Large Language Model) : Le "Cerveau"**\nUn LLM, c\'est comme un mod√®le de langage pr√©-entra√Æn√© (ex: GPT-3, GPT-4, Llama) qui a appris √† comprendre et g√©n√©rer du texte en analysant des milliards de donn√©es. C\'est un peu comme une **bo√Æte noire** qui prend du texte en entr√©e et produit du texte en sortie.\n\n- **Exemple concret** :\n  Si tu lui donnes la prompt `"√âcris un code Python pour calculer la factorielle d\'un nombre"`, il va te r√©pondre avec une fonction comme `def factorial(n): ...`.\n\n- **Limites** :\n  - Il ne sait pas faire grand-chose *seul* : pas d\'acc√®s √† des bases de donn√©es, pas de m√©moire entre les requ√™tes (sauf avec des techniques comme le *few-shot learning*), et pas de logique complexe sans guidage.\n\n---\n\n### **2. LangChain : Le "Framework" pour Super-Pouvoirs**\nLangChain, 

In [14]:
parser = StrOutputParser()

parser.invoke(answer)

'Ah, excellente question ! Je vais te l\'expliquer simplement avec des analogies et des concepts que tu connais d√©j√† en tant que d√©veloppeur.\n\n### **1. LLM (Large Language Model) : Le "Cerveau"**\nUn LLM, c\'est comme un mod√®le de langage pr√©-entra√Æn√© (ex: GPT-3, GPT-4, Llama) qui a appris √† comprendre et g√©n√©rer du texte en analysant des milliards de donn√©es. C\'est un peu comme une **bo√Æte noire** qui prend du texte en entr√©e et produit du texte en sortie.\n\n- **Exemple concret** :\n  Si tu lui donnes la prompt `"√âcris un code Python pour calculer la factorielle d\'un nombre"`, il va te r√©pondre avec une fonction comme `def factorial(n): ...`.\n\n- **Limites** :\n  - Il ne sait pas faire grand-chose *seul* : pas d\'acc√®s √† des bases de donn√©es, pas de m√©moire entre les requ√™tes (sauf avec des techniques comme le *few-shot learning*), et pas de logique complexe sans guidage.\n\n---\n\n### **2. LangChain : Le "Framework" pour Super-Pouvoirs**\nLangChain, c\'est u

üëâ Ici, on vient d‚Äôinstancier le **sch√©ma pr√©c√©dent** :

```text
variables -> PromptTemplate -> LLM -> OutputParser -> string
```

LangChain g√®re pour nous :
- la cr√©ation des messages,
- l‚Äôappel mod√®le,
- la conversion de la r√©ponse en `str`.

## 3Ô∏è‚É£ Ajouter un peu de "contexte" (mini-RAG sans base vectorielle)

On simule ici un RAG **tr√®s simplifi√©** :  
- un mini "corpus" en m√©moire,  
- une fonction de r√©cup√©ration na√Øve (recherche par mots-cl√©s),  
- un prompt qui combine **question + contexte**.

L‚Äôobjectif est juste de montrer la **brique "retrieval"** dans le pipeline.

In [15]:
# Mini "base de connaissances" en m√©moire
DOCUMENTS = [
    {
        "title": "Agents d√©terministes",
        "content": "Un agent d√©terministe suit un sc√©nario fixe, sans appel √† un mod√®le de langage √† chaque √©tape."
    },
    {
        "title": "Agents IA (LLM)",
        "content": "Un agent IA utilise un mod√®le de langage pour d√©cider dynamiquement des actions √† chaque √©tape."
    },
    {
        "title": "LangChain",
        "content": "LangChain est un framework qui aide √† structurer les appels aux LLM et √† int√©grer des donn√©es, des outils et de la m√©moire."
    },
]

def simple_retriever(query: str, k: int = 2) -> str:
    """
    Tr√®s simple :
    - calcule un score bas√© sur le nombre de tokens communs
    - renvoie les k meilleurs documents concat√©n√©s
    """
    tokens = set(query.lower().split())
    scored = []
    for doc in DOCUMENTS:
        score = len(tokens.intersection(set(doc["content"].lower().split())))
        scored.append((score, doc))
    scored.sort(key=lambda x: x[0], reverse=True)
    top_docs = [doc["content"] for score, doc in scored[:k] if score > 0]
    if not top_docs:
        return "Aucun document pertinent trouv√© dans la base locale."
    return "\n\n---\n\n".join(top_docs)

print(simple_retriever("Quelle diff√©rence entre agent IA et agent d√©terministe ?"))

Un agent d√©terministe suit un sc√©nario fixe, sans appel √† un mod√®le de langage √† chaque √©tape.

---

Un agent IA utilise un mod√®le de langage pour d√©cider dynamiquement des actions √† chaque √©tape.


### üîó Cha√Æne RAG simplifi√©e 

On utilise `RunnableLambda` et `RunnablePassthrough` pour construire un pipeline :

```text
question
  ‚îú‚îÄ‚îÄ> (pass-through) ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
  ‚îî‚îÄ‚îÄ> retriever(question) -> contexte‚î§
                                      v
                           Prompt(question + contexte)
                                    |
                                    v
                                 LLM
                                    |
                                    v
                              OutputParser
```

In [16]:
from langchain_core.runnables import RunnableLambda, RunnablePassthrough

# √âtape 1 : pr√©parer le "retriever" comme Runnable
retriever_runnable = RunnableLambda(lambda q: simple_retriever(q))

# √âtape 2 : d√©finir le prompt qui int√®gre question + contexte
rag_prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "Tu es un assistant qui r√©pond en t'appuyant STRICTEMENT sur le contexte fourni.\n"
            "Si une information n'est pas dans le contexte, dis-le explicitement."
        ),
        (
            "human",
            "Contexte :\n{context}\n\n"
            "Question utilisateur : {question}"
        ),
    ]
)

rag_chain = (
    {
        "question": RunnablePassthrough(),
        "context": retriever_runnable,
    }
    | rag_prompt
    | model
    | StrOutputParser()
)

question = "Explique la diff√©rence entre un agent d√©terministe et un agent IA."
print(rag_chain.invoke(question))

Dans le contexte fourni, un **agent d√©terministe** suit un sc√©nario fixe sans appel √† un mod√®le de langage (LLM) √† chaque √©tape. Cela signifie que ses actions sont pr√©programm√©es et ne d√©pendent pas d'une intelligence artificielle pour prendre des d√©cisions en temps r√©el.

En revanche, un **agent IA** (ou agent bas√© sur LLM) utilise un mod√®le de langage pour g√©n√©rer des r√©ponses ou des actions dynamiques en fonction du contexte, des donn√©es d'entr√©e et √©ventuellement de la m√©moire. LangChain, par exemple, est un framework qui facilite l'int√©gration de ces agents IA en structurant les appels aux LLM et en ajoutant des outils ou des donn√©es pour enrichir leurs capacit√©s.

Si vous souhaitez une comparaison plus d√©taill√©e, il faudrait pr√©ciser le contexte des agents IA (par exemple, leur architecture ou leur utilisation dans LangChain).


## ‚úÖ R√©cap
 
Briques pr√©sent√©es dans ce notebook :
  - mod√®le de langage (`ChatOpenAI`),
  - prompts (`ChatPromptTemplate`),
  - pipeline (`chain = prompt | model | parser`),
  - retrieval/RAG (m√™me tr√®s simplifi√©).

Pour la suite nous allons aborder :  
- l‚Äôorchestration **multi-√©tapes** avec LangGraph,  
- puis le **pattern d‚Äôagent** plus avanc√© dans le dernier notebook.