## CulturaBot - cr√©ation d'un chatbot sur la culture g√©n√©rale bas√© sur RAG destin√© pour les ados/jeunes adultes

Le CulturaBot sera un chatbot qui utilisera les connaissances provenant du livre "La Culture g√©n√©rale pour les nuls" en version PDF pour r√©pondre aux questions de culture g√©n√©rale de mani√®re ludique et sans pr√©tention. Ce projet se basera sur un mod√®le LLM extistant qui sera "augment√©" ou enrichi des connaissances dudit livre.

ETAPE 3 : Cr√©ation du pipeline RAG

Le pr√©sent notebook a pour objectif d'utiliser la base de donn√©es vectorielles cr√©√©e pr√©c√©demment pour r√©cup√©rer des donn√©es pertinentes relatives √† la question pos√©e par l'utilisateur ("retriever") afin de les ajouter √† la question de l'utilisater ("augment"), les passer au LLM choisi et adapt√© √† la langue fran√ßaise afin de ce dernier g√©n√©re une r√©ponse ("generator".)

In [1]:
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.llms import HuggingFacePipeline
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

  from .autonotebook import tqdm as notebook_tqdm


In [3]:
# 1. Charger l'index FAISS
embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
)
db = FAISS.load_local(
    "../data/faiss_index",
    embeddings,
    allow_dangerous_deserialization=True # Permet la d√©s√©rialisation (√† utiliser avec pr√©caution)
)

In [5]:
# 2. Configurer TinyLlama pour le CPU
model_name = "../models/TinyLlama-1.1B-Chat-v1.0"  # Mod√®le optimis√© pour le CPU, sauvegard√© localement
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="cpu",  # Force l'utilisation du CPU
    load_in_8bit=False,  # D√©sactive pour le CPU (8bit est pour GPU)
    dtype="auto"
)

In [6]:
# 3. Pipeline optimis√© pour le CPU
pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=150,  # R√©duit pour le CPU
    temperature=0.7,
    top_p=0.9,
    repetition_penalty=1.1
)
llm = HuggingFacePipeline(pipeline=pipe)

Device set to use cpu
  llm = HuggingFacePipeline(pipeline=pipe)


In [10]:
# 4. Prompt optimis√©
template = """
Tu es un **prof de culture G ultra-cool** qui explique les trucs **comme √† des potes de 16 ans**.
**R√®gles absolues :**
1. R√©ponds en **3 phrases max** (court et percutant).
2. Utilise **des emojis** (üóº, üí•, üòÇ, etc.) pour illustrer.
3. Fais **des comparaisons modernes** (ex: "comme un story Instagram", "comme un TikTok viral").
4. √âvite **les termes compliqu√©s** (remplace par des mots simples).
5. Si tu ne sais pas, dis-le avec humour ("L√†, je s√®che‚Ä¶ comme un dev sans caf√© ! ‚òï").

**Contexte (extraits du livre) :**
{context}

**Question du user :**
{question}

**R√©ponse (style ado, max 3 phrases, avec emojis) :**
"""
prompt = PromptTemplate(input_variables=["context", "question"], template=template)

In [11]:
# 5. Cha√Æne RAG
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=db.as_retriever(search_kwargs={"k": 3}),
    chain_type_kwargs={"prompt": prompt}
)

In [None]:
6. # Test: poser une premi√®re question

question = "Pourquoi la Tour Eiffel a √©t√© construite ?"
response = qa_chain.invoke({"query": question})
print("ü§ñ R√©ponse :", response["result"])


ü§ñ R√©ponse : 
Tu es un **prof de culture G ultra-cool** qui explique les trucs **comme √† des potes de 16 ans**.
**R√®gles absolues :**
1. R√©ponds en **3 phrases max** (court et percutant).
2. Utilise **des emojis** (üóº, üí•, üòÇ, etc.) pour illustrer.
3. Fais **des comparaisons modernes** (ex: "comme un story Instagram", "comme un TikTok viral").
4. √âvite **les termes compliqu√©s** (remplace par des mots simples).
5. Si tu ne sais pas, dis-le avec humour ("L√†, je s√®che‚Ä¶ comme un dev sans caf√© ! ‚òï").

**Contexte (extraits du livre) :**
carr√©, sont √† Arras, √âvreux et Milan. En pays normand appara√Æt ledonjon, monumentale tour carr√©e qui domine le paysage et sert autant des intentions de d√©fense que dhabitation. Un des plus anciens exemples conserv√©s est la Tour de Londres, construite de 1070 √† 1090. CULTUREG.indb 245 091109 1009 DDeeuuxxii√®√®mmee ppaarrttiiee  PPlluuss bbeellllee llaa vviiee  aarrttss eett lliitttt√©√©rraattuurree En 1088, labb√© Hugues de Cluny 

In [None]:
# Fonction pour poser des questions et afficher les r√©sultats

def poser_question(question):
    response = qa_chain({"query": question})
    print("\nüîç **Question :**", question)
    print("\nüìÑ **Chunks s√©lectionn√©s :**")
    if "source_documents" in response:
        print("\nüìÑ **Chunks s√©lectionn√©s :**")
        for i, doc in enumerate(response["source_documents"]):
            print(f"   {i+1}. {doc.page_content[:100]}...")
    else:
        print("\nüìÑ Aucun chunk source trouv√©.")
    print("ü§ñ R√©ponse :", response["result"])
    return response


In [21]:
# Liste de questions √† tester
questions = [
    "Pourquoi la Tour Eiffel a √©t√© construite ?",
    "C'est quoi la photosynth√®se ?",
    "Qui √©tait Napol√©on ?",
    "Explique-moi la R√©volution fran√ßaise en 3 lignes.",
    "Pourquoi la mer est sal√©e ?"
]

# Pose toutes les questions
for q in questions:
    poser_question(q)
    print("\n" + "="*80 + "\n")



üîç **Question :** Pourquoi la Tour Eiffel a √©t√© construite ?

üìÑ **Chunks s√©lectionn√©s :**

üìÑ Aucun chunk source trouv√©.
ü§ñ R√©ponse : 
Tu es un **prof de culture G ultra-cool** qui explique les trucs **comme √† des potes de 16 ans**.
**R√®gles absolues :**
1. R√©ponds en **3 phrases max** (court et percutant).
2. Utilise **des emojis** (üóº, üí•, üòÇ, etc.) pour illustrer.
3. Fais **des comparaisons modernes** (ex: "comme un story Instagram", "comme un TikTok viral").
4. √âvite **les termes compliqu√©s** (remplace par des mots simples).
5. Si tu ne sais pas, dis-le avec humour ("L√†, je s√®che‚Ä¶ comme un dev sans caf√© ! ‚òï").

**Contexte (extraits du livre) :**
carr√©, sont √† Arras, √âvreux et Milan. En pays normand appara√Æt ledonjon, monumentale tour carr√©e qui domine le paysage et sert autant des intentions de d√©fense que dhabitation. Un des plus anciens exemples conserv√©s est la Tour de Londres, construite de 1070 √† 1090. CULTUREG.indb 245 091109 1009 DDe