In [1]:
!pip install pypdf
!pip install faiss-cpu
!pip install langchain
!pip install langgraph
!pip install langchain-core
!pip install langchain-community
!pip install langchain-openai
!pip install langchain-hub




Collecting pypdf
  Downloading pypdf-6.7.1-py3-none-any.whl.metadata (7.1 kB)
Downloading pypdf-6.7.1-py3-none-any.whl (331 kB)
[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/331.0 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m327.7/331.0 kB[0m [31m10.8 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m331.0/331.0 kB[0m [31m6.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pypdf
Successfully installed pypdf-6.7.1
Collecting faiss-cpu
  Downloading faiss_cpu-1.13.2-cp310-abi3-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (7.6 kB)
Downloading faiss_cpu-1.13.2-cp310-abi3-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl (23.8 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m23.8/23.8 MB[0m [31m68.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: faiss-cpu
Successfully installed faiss-cpu-1.13.

In [2]:
#Import des clés api OpenAI et Tavily
from google.colab import userdata
import os
openai_api_key = userdata.get('openai_api_key')
tavily_api_key = userdata.get('tavily_api_key')


if openai_api_key :
  os.environ['OPENAI_API_KEY'] = openai_api_key
  print("Cle openAi disponible")

else :
  print("Cle openAi non disponible veuillez la configurer dans votre environnement virtuel ou dans colab secrets")
  os.environ['OPENAI_API_KEY'] =""

if tavily_api_key :
  os.environ['TAVILY_API_KEY'] = tavily_api_key
  print("Cle Tavily disponible")
else :
  print("Cle Tavily non disponible veuillez la configurer dans votre environnement virtuel ou dans colab secrets")
  os.environ['TAVILY_API_KEY'] =""


Cle openAi disponible
Cle Tavily disponible


In [3]:
#Import pour le  chargement des données le decoupage et les embeddings

#Diviser les grands documents en chunks gérables

from langchain_text_splitters import RecursiveCharacterTextSplitter


#Charger les documents directement depuis des pasges web
from langchain_community.document_loaders import WebBaseLoader

#Modèle d'embeddings OpenAI pour la conversion texte --> vecteur

from langchain_openai import OpenAIEmbeddings



In [5]:
#Construire l'index à partir de PDFs
from langchain_community.document_loaders import PyPDFLoader
from langchain_community.vectorstores import FAISS


# Etape 1: definir les embeddings
embeddings = OpenAIEmbeddings()


# Etape 2: charger les documents pdf au lieu D'URl
fichiers_pdf=[
    'Corrective_Retrieval_Augm.pdf',
    'IA_et_Transformation digitale.pdf',
    'Tabular_list_of_deseases.pdf',
    'atos-retrieval-augmented-generation-ai-whitepaper.pdf'
]

doc = []
for fichier in fichiers_pdf:
  loader = PyPDFLoader(fichier)
  doc.extend(loader.load()) #pypdf retourne deja une liste de documents


print(f'{len(doc)} documents chargés depuis {len(fichiers_pdf)} fichiers pdf')


# Etape 3: Decoupage en chunk
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size =1200, #12000 caractères maximum par chunk
    chunk_overlap = 100 #pour eviter de couper des phrases importantes,on garde un chevauchement de 100 carateres entre les chunks
)

docs_split = text_splitter.split_documents(doc)
print(f'{len(docs_split)} chunks créés')



#Etape 4: Construction de la base de données vectorielle avec (FAISS)

vectorstore = FAISS.from_documents(
    documents=docs_split,
    embedding=embeddings
    )


#Etape 5: Création du retriever
retriever = vectorstore.as_retriever()

print("Retriever prêt")

2150 documents chargés depuis 4 fichiers pdf
5000 chunks créés
Retriever prêt


In [6]:
#Evaluateur de Recuperation (Retrieval grader)

from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from pydantic import BaseModel, Field



# Etape 1: definir le schema de sortie
class GradeDocuments(BaseModel):
  """score binaire pour verifier la pertinence des documents recuperer"""
  binary_score: str = Field(description="Les documents sont pertinents pour la question ? : 'yes' ou 'no'")


#Etape 2: Initialiser le LLM avec sortie structuree
'''On initialise le LLM avec une sortie structurée et la température à 0 pour garantir que la réponse
du LLM respecte à chaque fois la structure definitie initialement grace à pydantic '''


llm= ChatOpenAI(
    model ="gpt-4.1-nano-2025-04-14",
    temperature=0
)
structured_llm_grader =llm.with_structured_output(GradeDocuments)

# Etape 3: definir le prompt d'évaluation
system_msg="""
  Tu es un évaluateur qui évalue la pertinence d'un document récupéré par rapport à une question posée par un utilisateur.
 Si le document contient des mots clés ou une signification sémantique liés à la question, note le comme pertinent.
 Donne uniquement un score binaire: 'yes' ou 'no'
 """

grade_prompt = ChatPromptTemplate.from_messages([
     ("system", system_msg),
     ("human", "Document récupéré :\n\n{document}\n\nQuestion utilisateur :\n\n{question}")
 ])



# Etape 4: Construire la chaine d'évaluation
retrieval_grader= grade_prompt | structured_llm_grader


#Etape 5: tester l'évaluateur
question="QU'est ce que le RAG"
docs=retriever.invoke(question)


# On selectionne un chunk récupéré pour l'évaluation
doc_txt= doc[1].page_content


# exécuter l'évaluateur
result=retrieval_grader.invoke({"document": doc_txt, "question": question})
print("Resultat de l'évaluation:",result)

Resultat de l'évaluation: binary_score='yes'


  PydanticSerializationUnexpectedValue(Expected `none` - serialized value may not be as expected [field_name='parsed', input_value=GradeDocuments(binary_score='yes'), input_type=GradeDocuments])
  return self.__pydantic_serializer__.to_python(


In [8]:
#Generer la réponse finale

from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_openai import ChatOpenAI



#Étape 1: charger le template de Prompt RAG (remplacement de langchain.hub)

# rlm/rag-prompt est un prompt communautaire conçu pour les réponses de type RAG


system_prompt = """
You are an assistant for question-answering tasks.
Use the following pieces of retrieved context to answer the question.
If you don't know the answer, just say that you don't know.
Use three sentences maximum and keep the answer concise.
"""

prompt = ChatPromptTemplate.from_messages([
    ("system", system_prompt),
    ("human", "Question: {question}\nContext: {context}")
])

#ETape 2: Initialiser le LLM

llm= ChatOpenAI(
    model ="gpt-4.1-nano-2025-04-14",
    temperature=0.7   #pour que le LLM soit plus creatif
)

#Etape 3: Definir l'aide au formatage des documents

def format_docs(docs):
  """Il s'agit de joindre plusieurs documents en une seule chaine pour la variable de contexte."""
  return "\n\n".join(doc.page_content for doc in docs)


#Etape 4: Construire la chaine RAG

rag_chain=prompt | llm | StrOutputParser()


#Etape 5:Exécuter la génération en utilisant  le contenu des documents récupérés

context_text=format_docs(docs)


generation=rag_chain.invoke({
    "context": context_text,
    "question": question
})

print(generation)







Le RAG (Retrieval-Augmented Generation) est une technologie d'intelligence artificielle qui combine la recherche d'informations dans de vastes bases de données avec la génération de langage naturel. Elle permet d'extraire et de synthétiser des données pour produire des réponses précises, pertinentes et contextuelles. Utilisée dans divers secteurs, elle améliore la relation client, la recherche, la création de contenu, la recherche juridique, et la prise de décision en entreprise.


In [13]:
#Correcteur de question
"""
Il s'agit ici de reformuler la question de l'utilisateur pour qu'elle soit plus claire et ainsi permettre de récupérer
les documents pertinents plus efficacement.

"""
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser


#Etape 1: Initialiser le LLM
llm= ChatOpenAI(
    model ="gpt-4.1-nano-2025-04-14",
    temperature=0.7
)

#Etape 2 : definir le prompt
system_msg="""
Tu es un correcteur de questions qui reformule les questions de l'utilisateur en une version  amelioree pour une recherche
web.Examine la question et raisonne sur l'intention sémantique ou la signification sous-jacente
"""

rewrite_prompt= ChatPromptTemplate.from_messages([
    ("system", system_msg),
    ("human", "Voici la question initiale: \n\n{question} \n\nReformule et ameliore la question")
])

#Etape 3: Construction de la chaine de correction
question_rewriter= rewrite_prompt | llm | StrOutputParser()


#Etape 4: Tester le correcteur de question
question_amelioree=question_rewriter.invoke({"question": question})
print("Question amelioree:", question_amelioree)






Question amelioree: Quelle est la signification de l'acronyme RAG et à quoi fait-il référence ?


In [14]:
#Outils de recherche web Tavily
from langchain_community.tools.tavily_search import TavilySearchResults



#Etape 1 : Initialiser  la recherche Tavily
# K= nombre de résultats de recherche à retourner par requête

web_search_tool =TavilySearchResults(k=4)

print("Outils de recherche web Tavily initialisé")
#


Outils de recherche web Tavily initialisé


  web_search_tool =TavilySearchResults(k=4)


In [15]:
#Definition de l'etat du graphe
from typing import List
from typing_extensions import TypedDict

class GraphState(TypedDict):
  """
  Represente l'etat du graphe
  Attributs :
    question (str) : la question posée par l'utilisateur
    generation (str): la reponse finale générée par le LLM
    web_search (str): un indicateur  indiquand si une recherche web est necessaire
    documents(list[str]) : Liste des documents recuperés  ou generés pour la question
  """
  question: str
  generation: str
  web_search: str
  documents: List[str]

  print("Etat du graphe initialisé")


Etat du graphe initialisé


In [20]:
#Noeud de récupération (Retrieve Node)

from langchain_core.documents import Document

def retrieve(state):
  """
  Récupère les documents depuis le vectorstore en utilisant le retriever initialisé
  args:
    state (GraphState) : l'état actuel du graphe
  Returns:
    GraphState : l'état du graphe avec les documents récupérés
  """

  print("-------------Récupération---------------")

  #Etape 1: extraire la question
  question=state["question"]


  #Etape 2: recuperer les documents
  documents=retriever.invoke(question)
  print(f"{len(documents)} documents récupérés")


  #Etape 3: Mettre à jour l'état du graphe

  return{
      "question": question,
      "documents": documents
  }



In [22]:
#Noeud de génération(Generation Node)


def generate(state):
  """
  Génère une réponse à partir des documents récupérés et la question utilisateur

  args:
    state (GraphState) : l'état actuel du graphe contenant les documents et la question utilsateur

  Returns:
    GrapheState: l'état du graphe avec la réponse générée pour la sortie du LLM


  """
  print("-------------Génération---------------")

  #Etape 1 :extraire les entrées
  question=state['question']
  documents=state['documents']

  #Etape 2: formater les documents en texte brut
  def format_docs(documents):
    """Il s'agit de joindre plusieurs documents en une seule chaine"""
    return "\n\n".join(doc.page_content for doc in documents)

  context_text=format_docs(documents)
  #Etape 3: executer la chaine RAG
  generation=rag_chain.invoke({
      "context": context_text,
      "question": question
  })

  #Etape 4: retourner l'etat du graphe mis à jour
  return{
      **state,
      "generation": generation
  }
