# Assistant Culinaire avec LangChain et RAG

Ce notebook pr√©sente une impl√©mentation pas √† pas d'un assistant culinaire utilisant :
- **LangChain** : Framework pour d√©velopper des applications bas√©es sur les LLM
- **RAG (Retrieval Augmented Generation)** : Technique pour enrichir les r√©ponses du LLM avec des donn√©es externes
- **Chroma** : Base de donn√©es vectorielle pour stocker et rechercher des documents

Nous allons voir comment :
1. Configurer l'environnement et les mod√®les
2. Cr√©er une base de donn√©es vectorielle
3. Impl√©menter la cha√Æne de conversation RAG
4. Interagir avec l'assistant

## 1. Configuration de l'environnement et des mod√®les

Commen√ßons par importer les biblioth√®ques n√©cessaires et configurer nos mod√®les.

In [1]:
# Import des biblioth√®ques n√©cessaires
from langchain_community.vectorstores import Chroma  # Pour la base de donn√©es vectorielle
from langchain_openai import OpenAIEmbeddings     # Pour convertir le texte en vecteurs
from langchain_openai import ChatOpenAI              # LLM de Grok (alternative a GPT compatible avec ChatOpenAI)
from langchain.memory import ConversationBufferMemory  # Pour g√©rer l'historique des conversations
from langchain.chains import ConversationalRetrievalChain  # Pour combiner recherche et conversation
from langchain.prompts import PromptTemplate    # Pour structurer les prompts
from langchain.schema import Document  # Structure de donn√©es pour les documents
from dotenv import load_dotenv  # Pour g√©rer les variables d'environnement
import os
import pandas as pd  # Pour la manipulation des donn√©es
from typing import List  # Pour le typage des fonctions
import shutil  # Pour les op√©rations sur les fichiers

# Chargement des variables d'environnement
load_dotenv()

True

In [2]:
def get_embeddings():
    """Initialise le mod√®le d'embedding d'OpenAI."""
    if not os.getenv("OPENAI_API_KEY"):
        raise ValueError("OPENAI_API_KEY non trouv√©e dans les variables d'environnement")
    return OpenAIEmbeddings(
        model="text-embedding-3-small"  # Mod√®le plus l√©ger et √©conomique
    )

def get_llm():
    """Initialise le mod√®le de langage Grok."""
    if not os.getenv("XAI_API_KEY"):
        raise ValueError("XAI_API_KEY non trouv√©e dans les variables d'environnement")
    return ChatOpenAI(
        temperature=0.7,  # Contr√¥le la cr√©ativit√© des r√©ponses (0=conservateur, 1=cr√©atif)
        model_name="grok-2-1212",  # Mod√®le Grok
        api_key=os.getenv("XAI_API_KEY"),
        base_url="https://api.x.ai/v1"
    )

# Initialisation des mod√®les
embeddings = get_embeddings()
llm = get_llm()

print("‚úÖ Mod√®les initialis√©s avec succ√®s !")

‚úÖ Mod√®les initialis√©s avec succ√®s !


## 2. Cr√©ation de la base de donn√©es vectorielle si elle n'existe pas encore

Nous allons cr√©er notre base de donn√©es vectorielle Chroma qui va contenir nos recettes vectoris√©es.

In [None]:
"""
Script de g√©n√©ration de la base de donn√©es vectorielle pour l'assistant culinaire

Ce script transforme un fichier CSV contenant des recettes en une base de donn√©es vectorielle
utilisable par notre assistant culinaire. Il utilise plusieurs concepts cl√©s :

1. Embeddings : Conversion de texte en vecteurs num√©riques permettant de mesurer
   la similarit√© s√©mantique entre diff√©rents textes.
   
2. Vectorstore : Base de donn√©es sp√©cialis√©e qui stocke ces vecteurs et permet
   de faire des recherches par similarit√©.
   
3. RAG (Retrieval Augmented Generation) : Technique qui permet d'enrichir les r√©ponses
   d'un LLM avec des donn√©es externes (ici, notre base de recettes).
"""

# Chargement des variables d'environnement (cl√©s API)
load_dotenv()

def create_documents_from_csv(csv_path: str) -> List[Document]:
    """
    Cr√©e une liste de documents √† partir d'un fichier CSV de recettes.
    
    Cette fonction:
    1. Lit le fichier CSV contenant les recettes
    2. Pour chaque recette, cr√©e un document structur√© avec:
       - Le contenu (texte de la recette)
       - Les m√©tadonn√©es (temps de cuisson, nombre de personnes, etc.)
    
    Args:
        csv_path (str): Chemin vers le fichier CSV des recettes
        
    Returns:
        List[Document]: Liste des documents structur√©s pr√™ts √† √™tre vectoris√©s
    """
    # Lecture du fichier CSV
    df = pd.read_csv(csv_path)
    documents = []
    
    # Traitement de chaque ligne du CSV
    for _, row in df.iterrows():
        # Combinaison des champs textuels pour cr√©er le contenu
        content = f"Recipe: {row['name']}\n\nDescription: {row['Description']}\n\nIngredients: {row['ingredients_name']}"
        
        # Cr√©ation des m√©tadonn√©es associ√©es
        metadata = {
            'cooking_time': row['Cooking time'],
            'covers_count': row['Covers count'],
            'url': row['URL'] if 'URL' in row else '',
            'source': 'recipe_database'
        }
        
        # Cr√©ation du document structur√©
        doc = Document(
            page_content=content,
            metadata=metadata
        )
        documents.append(doc)
    
    return documents

def main():
    """
    Fonction principale qui g√®re la cr√©ation de la base de donn√©es vectorielle.
    
    Cette fonction:
    1. V√©rifie la pr√©sence de la cl√© API OpenAI
    2. Initialise le mod√®le d'embedding
    3. Cr√©e les documents √† partir du CSV
    4. G√©n√®re et sauvegarde la base de donn√©es vectorielle
    """
    # V√©rification de la cl√© API
    if not os.getenv("OPENAI_API_KEY"):
        raise ValueError("Cl√© API OpenAI non trouv√©e dans les variables d'environnement")
    
    # Si la base de donn√©e vectorielle existe d√©j√†, on l'efface pour la recr√©er de 0.
    if os.path.exists("./chroma_db_jupiternotebook"):
        shutil.rmtree("./chroma_db_jupiternotebook")
    
    # Initialisation du mod√®le d'embedding
    embeddings = OpenAIEmbeddings(
        model="text-embedding-3-small"  # Utilisation du mod√®le plus l√©ger et √©conomique
    )
    
    # Cr√©ation des documents √† partir du CSV
    documents = create_documents_from_csv("sample_recipes.csv")
    
    # Cr√©ation de la base de donn√©es vectorielle
    vectorstore = Chroma.from_documents(
        documents=documents,
        embedding=embeddings,
        persist_directory="./chroma_db_jupiternotebook"  # Dossier o√π sera sauvegard√©e la base
    )
    
    # Sauvegarde permanente de la base
    vectorstore.persist()
    print(f"Base de donn√©es vectorielle cr√©√©e avec {len(documents)} documents et sauvegard√©e dans ./chroma_db_jupiternotebook")

## 3. Chargement de la base de donn√©es vectorielle

Nous allons maintenant charger notre base de donn√©es vectorielle Chroma qui contient nos recettes vectoris√©es.

In [3]:
def get_vectorstore():
    """Charge la base de donn√©es vectorielle Chroma."""
    return Chroma(
        persist_directory="chroma_db",
        embedding_function=embeddings
    )

# Chargement de la base vectorielle
vectorstore = get_vectorstore()

# Test de recherche simple
results = vectorstore.similarity_search(
    "recette avec du poulet",
    k=2  # Nombre de r√©sultats √† retourner
)

print("‚úÖ Base de donn√©es vectorielle charg√©e !\n")
print("Test de recherche :")
for i, doc in enumerate(results, 1):
    print(f"\nR√©sultat {i}:")
    print(f"Contenu : {doc.page_content[:200]}...")
    print(f"M√©tadonn√©es : {doc.metadata}")

  return Chroma(


‚úÖ Base de donn√©es vectorielle charg√©e !

Test de recherche :

R√©sultat 1:
Contenu : Recipe: Poulet r√¥ti au miel & aux √©pices

Description: Une recette qui change du poulet du dimanche traditionnel !

Ingredients: Poulet (entier),Potimarron,Miel (liquide),Sauce soja sal√©e,Quatre-√©pice...
M√©tadonn√©es : {'cooking_time': 90.0, 'covers_count': 4, 'source': 'recipe_database', 'url': 'https://jow.fr/recipes/64ee070906a6533ddc4763d5'}

R√©sultat 2:
Contenu : Recipe: Poulet r√¥ti au miel & aux √©pices

Description: Une recette qui change du poulet du dimanche traditionnel !

Ingredients: Poulet (entier),Potimarron,Miel (liquide),Sauce soja sal√©e,Quatre-√©pice...
M√©tadonn√©es : {'cooking_time': 90.0, 'covers_count': 4, 'source': 'recipe_database', 'url': 'https://jow.fr/recipes/64ee070906a6533ddc4763d5'}


## 4. Configuration de la cha√Æne de conversation RAG

Maintenant, configurons notre cha√Æne de conversation qui combinera :
- La recherche dans notre base de donn√©es
- Le dialogue avec le LLM
- La m√©moire pour maintenir le contexte

In [4]:
def get_conversation_chain(vectorstore):
    """Configure la cha√Æne de conversation RAG."""
    # Initialisation de la m√©moire
    memory = ConversationBufferMemory(
        memory_key="chat_history",
        return_messages=True
    )
    
    # Cr√©ation du template de prompt
    template = """Tu es un assistant culinaire sympathique et comp√©tent. Utilise les √©l√©ments de contexte suivants pour 
    fournir des recommandations de recettes et des conseils de cuisine utiles. 
    
    Pour chaque recette, utilise ce format markdown:
    ### üçΩÔ∏è [Nom de la recette]
    **‚è±Ô∏è Temps de cuisson:** [temps]
    **üìä Difficult√©:** [niveau]
    
    #### ü•ò Ingr√©dients
    - [ingr√©dient 1]
    - [ingr√©dient 2]
    ...
    
    #### üìù Instructions
    [instructions d√©taill√©es]
    
    ---
    
    Pour les questions g√©n√©rales sur la cuisine, utilise du markdown avec des titres (##, ###), 
    des listes (- ou *), et du texte en gras (**) ou en italique (*) quand c'est appropri√©.
    R√©ponds toujours en fran√ßais.

    <contexte> 
    {context}
    </contexte>
    
    Historique de conversation: {chat_history}
    
    Humain: {question}
    
    Assistant: Je vais t'aider avec √ßa."""
    
    prompt = PromptTemplate(
        template=template,
        input_variables=["context", "chat_history", "question"]
    )
    
    # Configuration de la cha√Æne
    return ConversationalRetrievalChain.from_llm(
        llm=llm,
        retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
        memory=memory,
        combine_docs_chain_kwargs={"prompt": prompt}
    )

# Cr√©ation de la cha√Æne de conversation
conversation_chain = get_conversation_chain(vectorstore)
print("‚úÖ Cha√Æne de conversation configur√©e !")

‚úÖ Cha√Æne de conversation configur√©e !


  memory = ConversationBufferMemory(


## 5. Interaction avec l'assistant

Maintenant que tout est configur√©, nous pouvons interagir avec notre assistant culinaire !

In [5]:
def ask_assistant(question: str):
    """Pose une question √† l'assistant et affiche sa r√©ponse."""
    response = conversation_chain({"question": question})
    print(f"\nüë§ Vous: {question}")
    print(f"\nü§ñ Assistant: {response['answer']}")
    return response

# Test de l'assistant avec quelques questions
questions = [
    "Je voudrais une recette facile avec du poulet.",
    "Quels sont les ustensiles n√©cessaires pour cette recette ?",
    "As-tu une recette v√©g√©tarienne ?",
    "Combien de temps faut-il pour pr√©parer cette recette ?"
]

for question in questions:
    ask_assistant(question)
    print("\n" + "-"*80 + "\n")

  response = conversation_chain({"question": question})



üë§ Vous: Je voudrais une recette facile avec du poulet.

ü§ñ Assistant: ### üçΩÔ∏è One pan poulet & riz √† la tomate
**‚è±Ô∏è Temps de cuisson:** 45 minutes
**üìä Difficult√©:** Facile

#### ü•ò Ingr√©dients
- 4 pilons de poulet
- 1 tasse de riz
- 1 cuill√®re √† soupe de concentr√© de tomate
- 1 cube de bouillon de volaille
- 2 gousses d'ail
- 1 bouquet de persil frais



--------------------------------------------------------------------------------


üë§ Vous: Quels sont les ustensiles n√©cessaires pour cette recette ?

ü§ñ Assistant: Pour pr√©parer la recette "One pan poulet & riz √† la tomate", voici les ustensiles dont vous aurez besoin :

- Un plat allant au four (un grand plat √† gratin ou un plat √† paella est id√©al)
- Une planche √† d√©couper
- Un couteau de cuisine
- Une grande casserole (si vous souhaitez faire cuire le riz √† l'avance)
- Une cuill√®re en bois
- Un presse-ail (facultatif)

N'h√©sitez pas √† me poser d'autres questions si vous en avez ! üòä

---



## Conclusion

Ce notebook nous a permis de voir l'impl√©mentation compl√®te d'un assistant culinaire utilisant LangChain et RAG. Points cl√©s :

1. **Configuration des mod√®les**
   - Utilisation de Grok comme LLM
   - OpenAI pour les embeddings

2. **Base de donn√©es vectorielle**
   - Chroma pour stocker les recettes vectoris√©es
   - Recherche s√©mantique efficace

3. **Cha√Æne de conversation RAG**
   - Prompt template structur√©
   - M√©moire pour le contexte
   - Combinaison recherche et dialogue

4. **Interface utilisateur**
   - Formatage markdown pour les r√©ponses
   - Gestion de l'historique des conversations

Et bravo pour ce premier Chatbot vraiment intelligent =)
Pour aller plus loin, vous pouvez :
- Exp√©rimenter avec diff√©rents mod√®les
- Ajuster les param√®tres de recherche
- Personnaliser le prompt template
- Et pourquoi pas ajouter de nouvelles fonctionnalit√©s ?