# Challenge IA G√©n√©rative : Construire un moteur de recommandation avec LangChain

### D√©finition du probl√®me :

#### Le probl√®me √† r√©soudre

‚ÄúComment recommander des films ou s√©ries pertinents quand l‚Äôutilisateur ne conna√Æt pas les titres, mais seulement le type d‚Äôhistoire qu‚Äôil cherche ?‚Äù

Un utilisateur ne tape pas :

"Naruto"

Il tape plut√¥t :

"anime d‚Äôaction avec des animaux"

Ce type de requ√™te est :

* vague

* subjective

* bas√©e sur le sens, pas sur des mots-cl√©s exacts

üéØ L'objectif du notebook est de cr√©er un syst√®me capable de :

* comprendre le sens d‚Äôune requ√™te

* parcourir une base d‚Äôanimes

* retourner les animes les plus proches s√©mantiquement

### Ce qu'il faut faire : Pr√©parer la mati√®re premi√®re (les donn√©es)

Avant LangChain, il y a la donn√©e brute.

üîπ Source de donn√©es

Nous utilisons un fichier CSV contenant :

* le nom de l‚Äôanime

* son synopsis

* ses genres

Mais ces informations sont dispers√©es sur plusieurs colonnes.

üëâ Or, un mod√®le de langage comprend mieux :

* un texte continu

* structur√© comme un paragraphe

### Pr√©sentation de Langchain

LangChain n‚Äôest PAS un mod√®le de langage. C‚Äôest un framework d‚Äôorchestration pour applications IA.

Il sert √† connecter :

* des LLM (OpenAI, Hugging Face, etc.)

* des sources de donn√©es (FAISS, Chroma, SQL‚Ä¶)

* des cha√Ænes de raisonnement

* des outils

### Les briques fondamentales de LangChain

| Brique                   | R√¥le principal       | Description simple                                               | Exemples                                      |
| ------------------------ | -------------------- | ---------------------------------------------------------------- | --------------------------------------------- |
| **LLM (Language Model)** | G√©n√©rer du texte     | Mod√®le de langage qui comprend une entr√©e et produit une r√©ponse | OpenAI (ChatGPT), Hugging Face, Ollama, Azure |
| **Embeddings**           | Comprendre le sens   | Transforme le texte en vecteurs num√©riques pour comparer le sens | Hugging Face Embeddings, OpenAI Embeddings    |
| **Vector Stores**        | Stocker & rechercher | Stocke les vecteurs et permet la recherche par similarit√©        | FAISS, Chroma, Pinecone                       |
| **Chains (cha√Ænes)**     | Orchestration        | Encha√Æne plusieurs √©tapes (prompt, recherche, g√©n√©ration)        | `LLMChain`, `RetrievalQA`                     |
| **Agents** *(avanc√©)*    | D√©cision autonome    | Le LLM choisit dynamiquement des actions, outils ou API          | Agents LangChain, Tool Calling                |


#### Exemple concret pour chaque brique LangChain

On part d‚Äôun cas r√©el :
üé¨ Recommander un film d‚Äôanimation d‚Äôaction

1Ô∏è‚É£ LLM (Language Model) üëâ G√©n√®re la r√©ponse finale


```` python
prompt = "Recommande un film d'animation d'action"
llm(prompt)
````

R√¥le : √©crire une r√©ponse compr√©hensible pour l‚Äôhumain.



2Ô∏è‚É£ Embeddings üëâ Comprendre le sens de la requ√™te

```` python
embeddings.embed_query("film d'animation action")
````

R√¥le : transformer du texte en nombres comparables.



3Ô∏è‚É£ Vector Store (FAISS / Chroma) üëâ Retrouver les documents pertinents
```` python
docsearch.similarity_search("film d'animation action", k=2)
````

R√¥le : trouver les genres ou descriptions les plus proches.



4Ô∏è‚É£ Chains (RetrievalQA) üëâ Encha√Æner recherche + g√©n√©ration
```` python
qa = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=docsearch.as_retriever()
)

qa.invoke("Recommande un film d'animation d'action")
````
R√¥le : automatiser le pipeline complet.



5Ô∏è‚É£ Agents (avanc√©) üëâ D√©cider quoi faire
```` python
agent.run("Trouve un film d'action et explique pourquoi")
````

R√¥le : le mod√®le choisit s‚Äôil doit chercher, calculer, appeler une API.

### En r√©sum√©

LLM ‚Üí ‚ÄúJe parle‚Äù

Embeddings ‚Üí ‚ÄúJe comprends le sens‚Äù

Vector Store ‚Üí ‚ÄúJe retrouve l‚Äôinfo‚Äù

Chains ‚Üí ‚ÄúJ‚Äôencha√Æne les √©tapes‚Äù

Agents ‚Üí ‚ÄúJe d√©cide quoi faire‚Äù

## Installations

In [1]:
!python -m venv genai_env
!genai_env\Scripts\activate    # Windows

!pip install langchain langchain-community langchain-openai chromadb openai tiktoken --quiet


Error: Command '['/content/genai_env/bin/python3', '-m', 'ensurepip', '--upgrade', '--default-pip']' returned non-zero exit status 1.
/bin/bash: line 1: genai_envScriptsactivate: command not found


In [2]:
import langchain
print(langchain.__version__)

1.2.0


In [3]:
!pip install --upgrade langchain
!pip install --upgrade langchain_experimental




**Loading Libraries**

In [4]:
# Quel module permet la manipulation et l'analyse des donn√©es ? Indiquez le nom correct du module.
import pandas as pd

# Quel est le nom du module qu'on utilise souvent pour g√©rer des fonctionnalit√©s li√©es aux tokens mais qui semble ici √™tre une erreur de frappe ?
import tiktoken as tiktoken

# Quel module de la biblioth√®que standard Python est utilis√© pour interagir avec le syst√®me d'exploitation ?
import os as os

# Comment importez-vous la classe 'RetrievalQA' depuis le module 'langchain.chains' ?
# aujourd‚Äôhui RetrievalQA est remplac√© par une cha√Æne RAG explicite, construite avec :
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnablePassthrough

# Comment importez-vous 'TextLoader' depuis 'langchain.document_loaders' ?
# from langchain.document_loaders import TextLoader

# Quelle classe 'CharacterTextSplitter' doit √™tre import√©e depuis 'langchain.text_splitter' ?
#from langchain.schema import Document

# D'o√π importez-vous 'Chroma' dans le module 'langchain.vectorstores' ?
from langchain_community.vectorstores import Chroma

# Comment importez-vous 'CSVLoader' depuis 'langchain.document_loaders.csv_loader' ?
# from langchain.document_loaders.text import TextLoader



In [5]:
import sys
print(sys.executable)


/usr/bin/python3


**Data Preprocessing**

### Objectif : Fusion des informations textuelles

In [7]:
# Chargez un fichier CSV dans un DataFrame. Remplacez les parties manquantes pour compl√©ter le chemin du fichier.
anime = pd.read_csv('anime_with_synopsis.csv')

# Affichez les premi√®res lignes du DataFrame. Compl√©tez le code pour afficher les cinq premi√®res lignes.
anime.head()

Unnamed: 0,MAL_ID,Name,Score,Genres,sypnopsis
0,1,Cowboy Bebop,8.78,"Action, Adventure, Comedy, Drama, Sci-Fi, Space","In the year 2071, humanity has colonized sever..."
1,5,Cowboy Bebop: Tengoku no Tobira,8.39,"Action, Drama, Mystery, Sci-Fi, Space","other day, another bounty‚Äîsuch is the life of ..."
2,6,Trigun,8.24,"Action, Sci-Fi, Adventure, Comedy, Drama, Shounen","Vash the Stampede is the man with a $$60,000,0..."
3,7,Witch Hunter Robin,7.27,"Action, Mystery, Police, Supernatural, Drama, ...",ches are individuals with special powers like ...
4,8,Bouken Ou Beet,6.98,"Adventure, Fantasy, Shounen, Supernatural",It is the dark century and the people are suff...


In [8]:
# Combinez plusieurs colonnes dans une seule en utilisant une fonction lambda pour formater la cha√Æne de caract√®res. Remplissez les parties manquantes.
anime['combined_info'] = anime.apply(lambda row: f"Title: {row['Name']}. Overview: {row['sypnopsis']} Genres: {row['Genres']}", axis=1)

# Affichez le premier √©l√©ment de la nouvelle colonne cr√©√©e. Compl√©tez les parties manquantes.
anime['combined_info'][0]

'Title: Cowboy Bebop. Overview: In the year 2071, humanity has colonized several of the planets and moons of the solar system leaving the now uninhabitable surface of planet Earth behind. The Inter Solar System Police attempts to keep peace in the galaxy, aided in part by outlaw bounty hunters, referred to as "Cowboys." The ragtag team aboard the spaceship Bebop are two such individuals. Mellow and carefree Spike Spiegel is balanced by his boisterous, pragmatic partner Jet Black as the pair makes a living chasing bounties and collecting rewards. Thrown off course by the addition of new members that they meet in their travels‚ÄîEin, a genetically engineered, highly intelligent Welsh Corgi; femme fatale Faye Valentine, an enigmatic trickster with memory loss; and the strange computer whiz kid Edward Wong‚Äîthe crew embarks on thrilling adventures that unravel each member\'s dark and mysterious past little by little. Well-balanced with high density action and light-hearted comedy, Cowboy 

Nous transformons chaque ligne du CSV en une mini-description compl√®te.
Cette description sera l‚Äôunit√© de base comprise par le mod√®le s√©mantique.

#### Sauvegarde du nouveau jeu de donn√©es

LangChain ne travaille pas directement sur des DataFrames pandas

Il attend des fichiers ou des documents textuels

In [9]:
#Save processed dataset - combined_info for Langchain
anime[['combined_info']].to_csv('anime_updated.csv', index=False)

In [10]:
# Chargez ce nouveau fichier CSV dans un DataFrame. Remplacez les parties manquantes pour sp√©cifier le chemin correct du fichier.
pd.read_csv('anime_updated.csv')

Unnamed: 0,combined_info
0,Title: Cowboy Bebop. Overview: In the year 207...
1,Title: Cowboy Bebop: Tengoku no Tobira. Overvi...
2,Title: Trigun. Overview: Vash the Stampede is ...
3,Title: Witch Hunter Robin. Overview: ches are ...
4,Title: Bouken Ou Beet. Overview: It is the dar...
...,...
16209,Title: Daomu Biji Zhi Qinling Shen Shu. Overvi...
16210,Title: Mieruko-chan. Overview: ko is a typical...
16211,Title: Higurashi no Naku Koro ni Sotsu. Overvi...
16212,Title: Yama no Susume: Next Summit. Overview: ...


**Data Loader and Vector store using Langchain**

### Chargement et pr√©paration des donn√©es : Transformer les donn√©es en Documents LangChain

Chaque ligne du CSV devient un Document.

Un Document contient :

* page_content ‚Üí le texte

* metadata ‚Üí des informations contextuelles

C‚Äôest cette abstraction qui permet ensuite la recherche, la tra√ßabilit√© et l‚Äôexplicabilit√©

In [19]:
from langchain_community.document_loaders import CSVLoader

# Chargez des donn√©es √† partir d'un fichier CSV en utilisant 'CSVLoader'.
loader = CSVLoader(file_path="anime_updated.csv")
data = loader.load()



### Chargement des documents avec LangChain

In [16]:
!pip install langchain-community




In [17]:
import langchain
import langchain_community
print("LangChain OK")

LangChain OK


#### D√©couper pour mieux comprendre (Text Splitting):

Les mod√®les d‚Äôembeddings ont des limites :

* en taille

* en pr√©cision sur les longs textes

Solution : d√©couper intelligemment

In [18]:
from langchain_text_splitters import RecursiveCharacterTextSplitter



In [47]:
# Configurez un transformateur de texte pour diviser les documents en morceaux.
text_splitter = RecursiveCharacterTextSplitter(chunk_size= 1000, chunk_overlap= 200)
texts = text_splitter.split_documents(data)

D√©coupage r√©cursif : On d√©coupe chaque description en morceaux de texte qui :

* se chevauchent l√©g√®rement

* gardent le contexte narratif

Cela am√©liore la qualit√© des embeddings et donc des recommandations.

In [25]:
pip install -U langchain langchain-community langchain-core sentence-transformers faiss-cpu




#### Donner du sens aux textes (Embeddings)

√Ä ce stade, nous avons :

* du texte propre

* bien structur√©

* d√©coup√©

Mais l‚Äôordinateur ne comprend toujours pas le sens.

Il faut transformer le texte en vecteurs num√©riques.

In [None]:
from langchain_community.embeddings import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2"
)

Ce mod√®le transforme chaque morceau de texte en un vecteur.
Deux textes proches en signification auront des vecteurs proches dans l‚Äôespace.

Exemple conceptuel :

‚Äúanime d‚Äôaction avec des animaux‚Äù

‚Äúaventures de cr√©atures combattantes‚Äù

--> vecteurs tr√®s proches

### M√©moriser le sens : Base vectorielle (FAISS)

* Stocker les vecteurs
* Permettre la recherche s√©mantique

#### Cr√©ation de la base vectorielle

In [None]:
from langchain_community.vectorstores import FAISS

docsearch = FAISS.from_documents(texts, embeddings)

# FAISS agit comme une m√©moire s√©mantique.
# Il ne stocke pas des mots, mais des id√©es math√©matiques.

### Interroger le syst√®me (la requ√™te utilisateur)

### Recherche s√©mantique (le c≈ìur du RAG)

1. La requ√™te est transform√©e en vecteur

2. FAISS compare ce vecteur aux documents

3. Il retourne les plus proches s√©mantiquement

In [33]:
# D√©finissez une requ√™te pour rechercher un anime d'action.
query = "anime d'action avec science-fiction"

# Utilisez l'instance 'qa' pour obtenir une r√©ponse √† votre requ√™te.
result = rag_chain.invoke(query)
result


# La requ√™te est trait√©e exactement comme les documents : transform√©e en vecteur et compar√©e √† tous les autres vecteurs

"Tu es un expert en anime.\nUtilise uniquement les genres suivants pour r√©pondre :\n\n[Document(id='6a867e89-8947-4dd4-8c25-f026a56f34c6', metadata={}, page_content='Action, Sci-Fi, Psychological, Drama')]\n\nQuestion : anime d'action avec science-fiction\nR√©ponse :"

In [26]:
from langchain_core.documents import Document

docs = [
    Document(page_content="Action, Sci-Fi, Psychological, Drama"),
    Document(page_content="Action, Adventure, Comedy, Shounen"),
    Document(page_content="Comedy, Romance, School, Shounen"),
]

# Recherche de similarit√©
# Le syst√®me ne cherche pas des mots identiques. Il cherche des proximit√© de sens.

results = docsearch.similarity_search(
    "film d'animation action science-fiction",
    k=1
)

# Affichage des r√©sultats
print(results[0].page_content)


  embeddings = HuggingFaceEmbeddings(
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


Action, Sci-Fi, Psychological, Drama


#### Donner une voix au syst√®me (LLM local)

Jusqu‚Äôici, notre syst√®me sait :

* chercher des documents

* comparer des significations

* retrouver des animes pertinents

‚ùå Mais il ne sait pas encore formuler une r√©ponse humaine.

Nous avons besoin d‚Äôun mod√®le de g√©n√©ration de texte.

In [50]:
from langchain_huggingface import HuggingFacePipeline   # HuggingFacePipeline : adaptateur LangChain ‚Üí transforme un mod√®le HF en LLM compatible LangChain
from transformers import pipeline    # transformers.pipeline : interface simple pour charger un mod√®le NLP



LangChain ne g√©n√®re pas de texte, il orchestre des mod√®les qui savent le faire.

Pourquoi FLAN-T5 ?

* entra√Æn√© pour suivre des instructions

* tr√®s adapt√© au RAG

* fonctionne localement

In [49]:
# Cr√©ation du pipeline de g√©n√©ration :
hf_pipeline = pipeline(
    "text-generation",    # text-generation : t√¢che NLP
    model="google/flan-t5-base",    # google/flan-t5-base : mod√®le instruction-tuned
    max_new_tokens=256,     # max_new_tokens=256 : longueur max de la r√©ponse
    temperature=0.7    # temperature=0.7 : cr√©ativit√© contr√¥l√©e
)

# Conversion en LLM LangChain
llm = HuggingFacePipeline(pipeline=hf_pipeline)

Device set to use cpu
The model 'T5ForConditionalGeneration' is not supported for text-generation. Supported models are ['PeftModelForCausalLM', 'ApertusForCausalLM', 'ArceeForCausalLM', 'AriaTextForCausalLM', 'BambaForCausalLM', 'BartForCausalLM', 'BertLMHeadModel', 'BertGenerationDecoder', 'BigBirdForCausalLM', 'BigBirdPegasusForCausalLM', 'BioGptForCausalLM', 'BitNetForCausalLM', 'BlenderbotForCausalLM', 'BlenderbotSmallForCausalLM', 'BloomForCausalLM', 'BltForCausalLM', 'CamembertForCausalLM', 'LlamaForCausalLM', 'CodeGenForCausalLM', 'CohereForCausalLM', 'Cohere2ForCausalLM', 'CpmAntForCausalLM', 'CTRLLMHeadModel', 'Data2VecTextForCausalLM', 'DbrxForCausalLM', 'DeepseekV2ForCausalLM', 'DeepseekV3ForCausalLM', 'DiffLlamaForCausalLM', 'DogeForCausalLM', 'Dots1ForCausalLM', 'ElectraForCausalLM', 'Emu3ForCausalLM', 'ErnieForCausalLM', 'Ernie4_5ForCausalLM', 'Ernie4_5_MoeForCausalLM', 'Exaone4ForCausalLM', 'FalconForCausalLM', 'FalconH1ForCausalLM', 'FalconMambaForCausalLM', 'FlexOlmoF

√Ä partir de maintenant, LangChain peut parler.
Ce LLM sera la voix finale de notre moteur de recommandation.

### Recherche s√©mantique simple (sans g√©n√©ration)

Avant de g√©n√©rer une r√©ponse, v√©rifions que la recherche fonctionne.

In [51]:
# D√©finissez une requ√™te de recherche pour trouver un film d'animation d'action.
query = "film d'animation action aventure science-fiction"

Cette requ√™te n‚Äôest pas un titre, exprime une intention et repose sur le sens

#### Recherche de similarit√©


In [27]:
# Effectuez une recherche de similarit√© dans la base de donn√©es 'docsearch' pour trouver le document le plus pertinent.
docs = docsearch.similarity_search(query, k=1)   # k signifie le nombre de r√©sultats retourn√©s (k=1 ‚Üí le document le plus pertinent, k=10 ‚Üí les 10 meilleurs r√©sultats)
docs


[Document(id='6a867e89-8947-4dd4-8c25-f026a56f34c6', metadata={}, page_content='Action, Sci-Fi, Psychological, Drama')]

* similarity_search(...). Cette m√©thode transforme la requ√™te en vecteur, compare ce vecteur √† ceux des documents stock√©s et calcule une distance

* (cosine similarity, euclidienne, etc.). Il retourne ensuite les documents les plus proches s√©mantiquement


### Inspection du r√©sultat

Nous v√©rifions ici que la base vectorielle comprend bien la requ√™te,
avant m√™me d‚Äôimpliquer un mod√®le g√©n√©ratif.

In [28]:
docs[0].page_content


'Action, Sci-Fi, Psychological, Drama'

### Du retrieval √† la recommandation (QA Retrieval)

Nous voulons maintenant poser une question, r√©cup√©rer des documents et g√©n√©rer une r√©ponse

C‚Äôest le principe du RAG.

#### Installation des d√©pendances

LangChain est modulaire : chaque brique est install√©e s√©par√©ment.

In [29]:
pip install -U langchain-huggingface transformers sentence-transformers




Pourquoi RetrievalQA est abandonn√© :
* bo√Æte noire

* difficile √† d√©bugger

* rigide

#### Pourquoi LangChain a supprim√© RetrievalQA ?

| Ancien               | Nouveau            |
| -------------------- | ------------------ |
| `RetrievalQA`        | LCEL               |
| classes magiques     | cha√Ænes explicites |
| difficile √† debugger | transparent        |
| rigide               | composable         |


#### Nouvelle approche (LCEL)

LangChain moderne = cha√Ænes explicites
LCEL = LangChain Expression Language
üëâ Tout est visible, composable, explicable.

In [None]:
# Depuis LangChain 1.x (2024‚Äì2025) : RetrievalQA est D√âPR√âCI√â, langchain.chains n‚Äôexiste plus comme avant
# LangChain a bascul√© vers : Runnable, LCEL (LangChain Expression Language)
# On oublie RetrievalQA, on fait un RAG moderne avec LCEL, 100 % compatible avec Hugging Face
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnablePassthrough


### Le prompt (le cerveau du RAG)

üß† Pourquoi un prompt ?

Le LLM ne sait pas quoi faire sans instructions et peut halluciner sans contrainte

Le prompt :

* d√©finit son r√¥le

* limite ses sources

* structure la r√©ponse

In [52]:
prompt = PromptTemplate.from_template(
    """Tu es un expert en anime.
Utilise uniquement les genres suivants pour r√©pondre :

{context}

Question : {question}
R√©ponse :"""
)

### Le retriever : le moteur de recherche s√©mantique

Le retriever est une interface standard fournie par LangChain.
Son r√¥le est d‚Äôencapsuler la recherche vectorielle et de la rendre r√©utilisable dans diff√©rents pipelines.

Le retriever :

* re√ßoit une requ√™te en langage naturel,

* transforme cette requ√™te en vecteur,

* compare ce vecteur aux vecteurs stock√©s dans la base,

* retourne les documents les plus proches s√©mantiquement.

Ainsi, le retriever agit comme un pont entre la question utilisateur et les donn√©es.

In [53]:
retriever = docsearch.as_retriever(search_kwargs={"k": 1})
# L‚Äôargument k=1 indique que l‚Äôon souhaite r√©cup√©rer un seul document, c‚Äôest-√†-dire celui qui est jug√© le plus pertinent par la recherche vectorielle.

#### Construction du RAG avec LCEL (LangChain Expression Language).
La cha√Æne RAG est construite √† l‚Äôaide de LCEL (LangChain Expression Language).
Cette approche rend le pipeline explicite, lisible et facile √† comprendre.


Dans notre cas, le prompt contient deux emplacements dynamiques :

* {context} : les documents r√©cup√©r√©s par la recherche s√©mantique

* {question} : la question originale de l‚Äôutilisateur

In [32]:
rag_chain = (
    {
        "context": retriever,    # La question est envoy√©e au retriever : La question sert √† effectuer une recherche s√©mantique.
      # Les documents r√©cup√©r√©s deviennent la valeur de {context}.
        "question": RunnablePassthrough()  # La question originale est conserv√©e sans modification.
      # Elle devient la valeur de {question}.
    }
    | prompt
    | llm
)




"Tu es un expert en anime.\nUtilise uniquement les genres suivants pour r√©pondre :\n\n[Document(id='6a867e89-8947-4dd4-8c25-f026a56f34c6', metadata={}, page_content='Action, Sci-Fi, Psychological, Drama')]\n\nQuestion : anime d'action avec de la science-fiction\nR√©ponse :"

Le fonctionnement se d√©roule en plusieurs √©tapes successives :

**1. Arriv√©e de la question**

La cha√Æne re√ßoit une entr√©e unique :
la question formul√©e par l‚Äôutilisateur en langage naturel.

In [54]:
response = rag_chain.invoke("anime d'action avec de la science-fiction")
response

"You are a movie recommender system that help users to find anime that match their preferences. \nUse the following pieces of context to answer the question at the end. \nFor each question, take into account the context and the personal information provided by the user.\nIf you don't know the answer, just say that you don't know, don't try to make up an answer.\n\nAction, Sci-Fi, Psychological, Drama\n\nAction, Adventure, Comedy, Shounen\n\nComedy, Romance, School, Shounen\nThis is what we know about the user, and you can use this information to better tune your research:\nAge: 25\nGender: male\nQuestion: anime d'action avec de la science-fiction\nYour response:"

Ici, la cha√Æne re√ßoit une seule valeur en entr√©e *("anime d'action avec de la science-fiction")*

**2. Duplication logique de l‚Äôentr√©e**

LangChain ex√©cute automatiquement :

In [35]:
# R√©cup√©rer les documents sources
source_docs = retriever.invoke(query)



'Action, Sci-Fi, Psychological, Drama'

Le r√©sultat est une liste de documents qui repr√©sente le contexte.

LangChain a construit implicitement le dictionnaire suivant :

```` python
{
    "context": [Document(...), Document(...)],
    "question": "anime d'action avec de la science-fiction"
}

````

les documents deviennent {context}

la question reste {question}

## **Prompt Engineering**

Remplissage du prompt

Le prompt est compl√©t√© automatiquement avec les valeurs obtenues √† l‚Äô√©tape pr√©c√©dente.


#### **Premier template : PromptTemplate LangChain (injection dynamique)**

On cr√©e un objet PromptTemplate qui permet de d√©clarer explicitement quelles variables seront inject√©es plus tard et permet √† LangChain de remplir le prompt automatiquement

Ce prompt garantit aussi que {context} et {question} existent bien

In [36]:
# Premier template (RAG ‚Äì contexte)

# D√©finir un mod√®le de prompt pour un syst√®me de recommandation de films
template = """You are a movie recommender system that help users to find anime that match their preferences.
Use the following pieces of context to answer the question at the end.
For each question, suggest three anime, with a short description of the plot and the reason why the user might like it.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

{context}

Question: {question}
Your response:"""

# Cr√©ez une instance de 'PromptTemplate'
PROMPT = PromptTemplate(
    template=template,
    input_variables=["context", "question"]
)



**Deuxi√®me Template** - Provinding additional user info in the context

Des informations utilisateur sont ajout√©es au prompt.
La construction du texte du prompt se fait √† l'aide de templates statiques.

In [37]:
# D√©finissez les diff√©rentes parties d'un mod√®le de prompt
template_prefix = """You are a movie recommender system that help users to find anime that match their preferences.
Use the following pieces of context to answer the question at the end.
For each question, take into account the context and the personal information provided by the user.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

{context}"""

# Informations utilisateur ajout√©es au prompt
user_info = """This is what we know about the user, and you can use this information to better tune your research:
Age: {age}
Gender: {gender}"""

# Fin du prompt (question / r√©ponse)
template_suffix = """Question: {question}
Your response:"""


# Formattez 'user_info' avec des informations sp√©cifiques sur l'utilisateur.
user_info = user_info.format(age=25, gender='male')
# √Ä ce stade : {age} et {gender} sont d√©j√† remplac√©s, ce texte devient statique pour la suite du RAG

# Combinez les trois parties du prompt pour former un prompt complet.
COMBINED_PROMPT = template_prefix + '\n' + user_info + '\n' + template_suffix
print(COMBINED_PROMPT)



You are a movie recommender system that help users to find anime that match their preferences. 
Use the following pieces of context to answer the question at the end. 
For each question, take into account the context and the personal information provided by the user.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

{context}
This is what we know about the user, and you can use this information to better tune your research:
Age: 25
Gender: male
Question: {question}
Your response:


Ce deuxi√®me template d√©finit le r√¥le du mod√®le (syst√®me de recommandation), impose des r√®gles (ne pas halluciner) et contient d√©j√† l‚Äôemplacement {context}.

### Remplissage automatique du prompt (au moment de l‚Äôex√©cution)

Ce remplissage se fait uniquement lors de l‚Äôex√©cution de la cha√Æne RAG.




In [40]:
from langchain_core.output_parsers import StrOutputParser

# PromptTemplate (prompt combin√©)
PROMPT = PromptTemplate(
    template=COMBINED_PROMPT,
    input_variables=["context", "question"]
)

# Fonction de formatage des documents
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

# Cr√©ation de la cha√Æne RAG moderne (LCEL)
rag_chain = (
    {
        "context": docsearch.as_retriever() | format_docs,
        "question": RunnablePassthrough(),
    }
    | PROMPT     # Cela signifie que LangChain appelle en interne : PROMPT.format(context=context,question=question)
    | llm
    | StrOutputParser()
)

# Requ√™te
query = "anime d'action avec des animaux"

# Ex√©cution
result = rag_chain.invoke(query)
print(result)




You are a movie recommender system that help users to find anime that match their preferences. 
Use the following pieces of context to answer the question at the end. 
For each question, take into account the context and the personal information provided by the user.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

Action, Adventure, Comedy, Shounen

Action, Sci-Fi, Psychological, Drama

Comedy, Romance, School, Shounen
This is what we know about the user, and you can use this information to better tune your research:
Age: 25
Gender: male
Question: anime d'action avec des animaux
Your response:


In [42]:
# Affichez le d√©tail du r√©sultats
retriever = docsearch.as_retriever()
source_docs = retriever.invoke(query)

source_docs[0]
source_docs[0].page_content


'Action, Adventure, Comedy, Shounen'

### R√©sum√© : Ce que contient exactement le prompt final

Le prompt final contient explicitement :

Le r√¥le du mod√®le
‚Üí syst√®me de recommandation d‚Äôanimes

Les contraintes de g√©n√©ration
‚Üí ne pas inventer de r√©ponse

Les informations autoris√©es
‚Üí uniquement les documents r√©cup√©r√©s (context)

Les informations utilisateur
‚Üí √¢ge, genre

La question utilisateur
‚Üí inject√©e telle quelle

La structure de sortie
‚Üí Your response:

### **R√©sum√©** :

Templates : d√©finissent la forme, les r√®gles et la structure du prompt

PromptTemplate : injecte automatiquement les donn√©es au runtime

LLM : g√©n√®re une r√©ponse √† partir du texte final uniquement

### 1. **Templates ‚Äî Texte brut du prompt (niveau humain)**

D√©finition

* Les templates sont du texte Python classique (str) utilis√© pour d√©finir √† l‚Äôavance la forme du prompt.

Ils servent √† :

* d√©finir le r√¥le du mod√®le

* fixer les r√®gles de r√©ponse

* organiser la structure

* pr√©voir des variables dynamiques ({context}, {question})

*Les templates sont des plans de prompt, pas des prompts ex√©cutables.*

A ce stade, {context} et {question} sont des placeholders

‚ùå aucun document n‚Äôest inject√©

‚ùå aucune question n‚Äôest connue

‚ùå le texte n‚Äôest pas utilisable par un LLM

### **2. PromptTemplate ‚Äî Moteur de remplissage (niveau LangChain)**
üìå Pourquoi PromptTemplate existe

Un LLM ne comprend que du texte final. LangChain a donc besoin d‚Äôun m√©canisme pour :

* savoir quelles variables remplacer

* injecter automatiquement les valeurs

* s√©curiser le format du prompt

* connecter le prompt √† une cha√Æne LCEL

C‚Äôest le r√¥le de PromptTemplate. PromptTemplate transforme un texte statique en objet ex√©cutable.

*C'est le pont entre le texte statique et les donn√©es dynamiques.*


### **3. Injection automatique dans LCEL (runtime)**

**1√®re √©tape : Calcul des variables**

* context ‚Üê documents r√©cup√©r√©s et format√©s

* question ‚Üê question utilisateur inchang√©e

**2√®me √©tape : Remplissage du prompt**

```` python
final_prompt = PROMPT.format(
    context=context,
    question=question
)
````
Un seul texte final, pr√™t pour le mod√®le.

*Le PromptTemplate est √©valu√© au moment de l‚Äôex√©cution, pas √† la d√©finition du code.*

### **4. LLM ‚Äî G√©n√©ration √† partir du prompt final**

```` python
| llm
````

üìå R√¥le du LLM

Le LLM (Flan-T5, GPT, etc.) :

re√ßoit uniquement le texte final

‚ùå ne conna√Æt ni LangChain

‚ùå ne conna√Æt ni les templates

‚ùå ne conna√Æt ni le retriever

**Ce que voit le LLM**

```` python
You are a movie recommender system...
[documents inject√©s]

Question: anime d'action avec de la science-fiction
Your response:
````
Ce que fait le LLM :

1. lit les instructions

2. respecte les contraintes

3. g√©n√®re du texte token par token

4. s‚Äôappuie uniquement sur le prompt fourni

### **Important (√† retenir) :**

**Erreurs fr√©quentes √† √©viter**

* Penser que le LLM ‚Äúvoit‚Äù {context}

* Penser que le LLM r√©cup√®re les documents lui-m√™me

* Oublier que le prompt est enti√®rement reconstruit √† chaque requ√™te

**R√®gle d‚Äôor**

Le LLM ne voit jamais LangChain.
Il ne voit qu‚Äôun texte final, produit par PromptTemplate.format().