## BASE DE DONNEES VECTORIELLE ET EMBEDING

## ETAPE 1 CHUNKING

In [1]:
from pypdf import PdfReader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_core.documents import Document

def load_and_split_pdf_simple(pdf_path: str):
    """
    Charge tout le PDF en un seul Document, puis le d√©coupe en chunks
    avec chunk_size=1000 et chunk_overlap=100 (en caract√®res).
    """
    # 1. Extraire tout le texte du PDF
    reader = PdfReader(pdf_path)
    full_text = ""
    for i, page in enumerate(reader.pages):
        text = page.extract_text() or ""
        full_text += text + f"\n\n[PAGE {i+1}]\n\n"  # Ajout de marqueur de page

    # 2. Cr√©er un seul Document
    doc = Document(page_content=full_text.strip().replace('. .',''), metadata={"source": pdf_path})

    # 3. D√©couper avec RecursiveCharacterTextSplitter (par d√©faut : len = caract√®res)
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000,
        chunk_overlap=100,
        separators=['.'],
        keep_separator=True  # Garde les s√©parateurs pour √©viter de couper au milieu d'une phrase
    )

    # 4. Splitter
    chunks = text_splitter.split_documents([doc])

    return chunks

# Utilisation
pdf_chunks = load_and_split_pdf_simple("embedding_course_by_koulou.pdf")




In [2]:
pdf_chunks

[Document(page_content='L‚ÄôINTELLIGENCE ARTIFICIELLE\nDes fondements th√©oriques aux bases de donn√©es vectorielles\nAuteur : KOULOU crepin\nD√©partement de Data Science\n8 janvier 2026\n\n[PAGE 1]\n\nR√©sum√©\nCe rapport pr√©sente une analyse approfondie de l‚Äô√©tat actuel de l‚ÄôIntelligence ArtiÔ¨Åcielle.\nNous explorerons d‚Äôabord les fondements math√©matiques de l‚Äôapprentissage automatique\n(Machine Learning) et des r√©seaux de neurones profonds (Deep Learning). Une attention\nparticuli√®re sera port√©e aux d√©veloppements r√©cents concernant les Grands Mod√®les de\nLangage (LLM) et l‚Äôinfrastructure critique qui les soutient, notamment les bases de don-\nn√©es vectorielles (FAISS, ChromaDB, Qdrant) et les m√©canismes de similarit√©. EnÔ¨Ån, nous\naborderons les d√©Ô¨Ås √©thiques et les perspectives d‚Äôavenir.\n\n[PAGE 2]\n\nTable des mati√®res\n1 Introduction 2\n1.1 Contexte Historique                . 2\n1.2 D√©Ô¨Ånitions et Typologie               2\n2 Fondements Math√©m


<img src="faiss chroma.jpg" alt="Logo Python" width="1800" height="600">


<div style="display: flex; gap: 20px;">

  <!-- Colonne 1 -->
  <div style="flex: 1; padding: 15px; border: 2px solid #e65100; border-radius: 10px; background-color: #fff0e0; box-shadow: 2px 2px 8px rgba(0,0,0,0.1); color:#212121;">
  
  ## 1. Introduction G√©n√©rale : Les Bases de Donn√©es Vectorielles

  **Qu'est-ce que c'est ?**  
  Une base de donn√©es vectorielle est un syst√®me optimis√© pour stocker et interroger des *vecteurs* (embeddings).

  **Pourquoi en avons-nous besoin ?**  
  Les bases traditionnelles (SQL, NoSQL) g√®rent bien les correspondances exactes, mais √©chouent sur la *similarit√©*.  

  Avec l‚Äôessor de l‚ÄôIA, les donn√©es complexes (texte, images, audio) sont transform√©es en vecteurs.  
  ‚ú® Des concepts proches se retrouvent math√©matiquement voisins dans un espace multidimensionnel.  

  üëâ Fonction principale : **Vector Search**.  
  Exemple : un vecteur "chat" renvoie les images les plus proches d‚Äôun chat, m√™me sans mot-cl√©.  

  C‚Äôest le c≈ìur des applications modernes comme le **RAG (Retrieval-Augmented Generation)**, qui permet aux LLM d‚Äôacc√©der √† vos documents.  

  </div>

  <!-- Colonne 2 -->
  <div style="flex: 1; padding: 15px; border: 2px solid #e65100; border-radius: 10px; background-color: #fff0e0; box-shadow: 2px 2px 8px rgba(0,0,0,0.1); color:#212121;">
  
  ## 2. FAISS et ChromaDB : Solutions orient√©es "D√©veloppement Local"

  **FAISS (Facebook AI Similarity Search)**  
  - Origine : Meta (Facebook AI Research).  
  - Nature : Biblioth√®que C++/Python, ultra performante.  
  - Forces :  
    - üöÄ Recherche sur milliards de vecteurs.  
    - ‚ö° Optimisation GPU.  
  - Faiblesses :  
    - Bas niveau, pas de stockage persistant.  
    - Risque de perte si non sauvegard√©.  

  **ChromaDB**  
  - Origine : Projet Open Source r√©cent.  
  - Nature : Base vectorielle simple et rapide.  
  - Forces :  
    - üéØ Installation facile (`pip install chromadb`).  
    - üîÑ Vectorisation int√©gr√©e.  
  - Faiblesses :  
    - Id√©al pour petits/moyens projets.  
    - Moins robuste pour t√©raoctets en production.  

  </div>

</div>


## FAISS

In [3]:
from langchain.vectorstores import FAISS
from langchain.embeddings import HuggingFaceEmbeddings

def build_faiss_index(chunks):
    """
    Construit un index FAISS √† partir de chunks d√©j√† pr√©par√©s.
    Utilise un mod√®le gratuit Hugging Face pour g√©n√©rer les embeddings.
    """
    # 1. Cr√©er les embeddings avec Hugging Face
    embeddings = HuggingFaceEmbeddings(
        model_name="sentence-transformers/all-MiniLM-L6-v2"  # mod√®le open-source ou openaiembeddings
    )

    # 2. Construire l‚Äôindex FAISS
    vectorstore = FAISS.from_documents(chunks, embeddings)

    return vectorstore



In [4]:
# Supposons que tu as d√©j√† tes chunks :
# chunks = text_splitter.split_documents(documents)

faiss_index = build_faiss_index(pdf_chunks)

# Faire une requ√™te
query = "Explique-moi la diff√©rence entre FAISS et ChromaDB"
results = faiss_index.similarity_search(query, k=10)

# Afficher les r√©sultats
for i, res in enumerate(results):
    print(f"--- R√©sultat {i+1} ---")
    print(res.page_content[:500], "...")


  from .autonotebook import tqdm as notebook_tqdm


--- R√©sultat 1 ---
.
8

[PAGE 10]

√âtat de l‚Äôart Rapport IA 2024
4.3.1 Comparatif Technique
‚Äî FAISS (Meta): Biblioth√®que bas niveau, optimis√©e pour la recherche par simila-
rit√© dense et le clustering. Utilise l‚Äôindexation IVF.
‚Äî ChromaDB : Solution open-source conviviale pour les d√©veloppeurs, id√©ale pour
les applications LLM l√©g√®res et le prototypage.
‚Äî Pinecone / Qdrant: Solutions g√©r√©es (SaaS) ou robustes (Rust) pour la produc-
tion √† grande √©chelle.
4.3.2 Exemple d‚Äôimpl√©mentation (Python)
Voici comment on ini ...
--- R√©sultat 2 ---
. Dans ce contexte, les r√©seaux de neurones profonds et les
bases de donn√©es vectorielles jouent un r√¥le crucial pour traiter des informations non
structur√©es. Ce paragraphe sert de remplissage pour simuler le volume de texte du rap-
port Ô¨Ånal, permettant d‚Äôappr√©cier la mise en page sans √™tre distrait par du latin. Les
avanc√©es technologiques r√©centes, notamment les architectures Transformers, ont ouvert
la voie au

<img src="reranking.jpg" alt="Logo Python" width="1800" height="600">


## Re-Ranking

<div style="display: flex; gap: 20px;">

  <!-- Colonne 1 -->
  <div style="flex: 1; padding: 15px; border: 2px solid #e65100; border-radius: 10px; background-color: #fff0e0; box-shadow: 2px 2px 8px rgba(0,0,0,0.1); color:#212121;">
  
  ## 1. Reranking : Concept et Pourquoi l‚Äôutiliser

  **Qu'est‚Äëce que le reranking ?**  
  Le *reranking* est une √©tape secondaire qui r√©ordonne une liste de r√©sultats initialement r√©cup√©r√©s (par ex. via FAISS) en utilisant un mod√®le plus fin ou une m√©thode diff√©rente pour mieux estimer la pertinence.

  **Pourquoi l‚Äôajouter ?**  
  - Les recherches vectorielles (FAISS, ChromaDB) fournissent un bon *pr√©croisement* bas√© sur la proximit√© dans l‚Äôespace des embeddings.  
  - Le reranking applique une √©valuation s√©mantique plus riche (mod√®les de rerank, cross-encoders) pour corriger les faux positifs et am√©liorer la pr√©cision en t√™te de liste.

  **Flux typique**  
  1. **Retrieval** : r√©cup√©rer top‚Äëk via FAISS (rapide).  
  2. **Rerank** : envoyer ces k documents + la requ√™te √† un mod√®le de reranking.  
  3. **R√©ordonnancement** : trier par score de rerank et retourner top‚Äën final.

  **Avantages**  
  - üîç Meilleure pr√©cision en t√™te de r√©sultats.  
  - ‚öñÔ∏è Moins de bruit : on r√©duit les documents proches mais non pertinents.  
  - üí° Compl√©mentarit√© : combine vitesse (FAISS) et finesse (reranker).

  **Limites**  
  - ‚è±Ô∏è Co√ªt et latence suppl√©mentaires (appel au mod√®le de rerank).  
  - üí∏ Co√ªt mon√©taire si le reranker est un service payant.  
  - üîÅ N√©cessite un bon pr√©traitement (nettoyage, d√©coupage) pour √™tre efficace.

  **Quand l‚Äôutiliser ?**  
  - Quand la qualit√© des 3‚Äì5 premiers r√©sultats est critique (chatbot, RAG, FAQ).  
  - Quand la base contient beaucoup de documents proches s√©mantiquement mais peu pertinents.

  </div>

  <!-- Colonne 2 -->
  <div style="flex: 1; padding: 15px; border: 2px solid #e65100; border-radius: 10px; background-color: #fff0e0; box-shadow: 2px 2px 8px rgba(0,0,0,0.1); color:#212121;">
  
  ## 2. Cohere et Reranking : Mise en ≈ìuvre pratique

  **Pourquoi Cohere pour le rerank ?**  
  Cohere propose des mod√®les d√©di√©s au *reranking* (cross‚Äëencoder style) qui comparent directement la requ√™te et chaque document pour produire un score de pertinence fin.

  **Pattern d‚Äôint√©gration**  
  - **√âtape 1** : FAISS ‚Üí `similarity_search(query, k=K)`  
  - **√âtape 2** : Extraire `page_content` des K r√©sultats.  
  - **√âtape 3** : Appel Cohere Rerank avec `query` + `documents`.  
  - **√âtape 4** : R√©ordonner les objets FAISS selon `relevance_score` renvoy√© par Cohere.

  **Bonnes pratiques**  
  - **Choisir le mod√®le** : `rerank-multilingual` si documents en fran√ßais; `rerank-english` pour l‚Äôanglais.  
  - **Limiter K** : 10‚Äì50 selon latence/co√ªt.  
  - **Fallback** : pr√©voir un retour aux r√©sultats FAISS si l‚ÄôAPI √©choue.  
  - **Conserver m√©tadonn√©es** : renvoyer l‚Äôobjet FAISS original pour garder source, offset, page, etc.  
  - **Batching** : grouper les appels si possible pour r√©duire latence et co√ªt.

  **Exemples d‚Äôam√©liorations observables**  
  - Augmentation de la pr√©cision @1 et @3.  
  - R√©duction des hallucinations dans les r√©ponses RAG.  
  - Meilleure coh√©rence des extraits utilis√©s pour la g√©n√©ration.

  **Risques et mitigations**  
  - **Latence** ‚Üí mettre en cache les reranks fr√©quents.  
  - **Co√ªt** ‚Üí n‚Äôutiliser le rerank que pour les requ√™tes critiques.  
  - **Biais** ‚Üí tester le reranker sur jeux de requ√™tes repr√©sentatifs.

  **Astuce rapide**  
  Combine un score FAISS (similitude) et le score Cohere (rerank) via une pond√©ration pour tirer parti des deux signaux avant le tri final.

  </div>

</div>

In [None]:
# === Configuration globale ===
# Remplace par ta cl√© API Cohere
COHERE_API_KEY = "votre cle cohere"  # ‚ö†Ô∏è √Ä remplacer ou √† charger depuis .env / config


In [6]:
import cohere
from typing import List, Dict, Any, Optional


# Initialiser le client Cohere
co = cohere.Client(COHERE_API_KEY)

def rerank_with_cohere(
    query: str,
    faiss_results: List[Any],
    top_n: int = 5,
    model: str = "rerank-multilingual-v2.0"
) -> List[Dict[str, Any]]:
    """
    Rerank les r√©sultats FAISS avec l'API Cohere Rerank.
    """
    if not faiss_results:
        return []

    documents = []
    for i, res in enumerate(faiss_results):
        text = getattr(res, "page_content", None) or getattr(res, "content", None) or str(res)
        documents.append(text)

    try:
        response = co.rerank(
            model=model,
            query=query,
            documents=documents,
            top_n=min(top_n, len(documents))
        )
    except Exception as e:
        print(f"[‚ö†Ô∏è Warning] Cohere rerank failed: {e}")
        return [
            {"doc": faiss_results[i], "original_index": i, "score": None}
            for i in range(min(top_n, len(faiss_results)))
        ]

    results_list = getattr(response, "results", None) or response

    reranked = []
    for item in results_list:
        idx = getattr(item, "index", None)
        score = getattr(item, "relevance_score", None) or getattr(item, "score", None)

        if idx is None or idx >= len(faiss_results):
            continue

        reranked.append({
            "doc": faiss_results[idx],
            "original_index": idx,
            "score": float(score) if score is not None else None
        })

    return reranked

In [7]:

# === Exemple d'utilisation ===
# ‚ö†Ô∏è Assure-toi que `faiss_index` est d√©fini avant cet appel
# Exemple fictif :
# from some_module import faiss_index

query = "Explique-moi la diff√©rence entre FAISS et ChromaDB"
faiss_results = faiss_index.similarity_search(query, k=10)

reranked_results = rerank_with_cohere(query, faiss_results, top_n=5)

print(len(reranked_results), "r√©sultats apr√®s reranking avec Cohere :")

5 r√©sultats apr√®s reranking avec Cohere :


In [8]:
reranked_results

[{'doc': Document(page_content='.\n8\n\n[PAGE 10]\n\n√âtat de l‚Äôart Rapport IA 2024\n4.3.1 Comparatif Technique\n‚Äî FAISS (Meta): Biblioth√®que bas niveau, optimis√©e pour la recherche par simila-\nrit√© dense et le clustering. Utilise l‚Äôindexation IVF.\n‚Äî ChromaDB : Solution open-source conviviale pour les d√©veloppeurs, id√©ale pour\nles applications LLM l√©g√®res et le prototypage.\n‚Äî Pinecone / Qdrant: Solutions g√©r√©es (SaaS) ou robustes (Rust) pour la produc-\ntion √† grande √©chelle.\n4.3.2 Exemple d‚Äôimpl√©mentation (Python)\nVoici comment on initialise une recherche simple avec la librairie ChromaDB :\n1 import chromadb\n2\n3 # Initialisation du client (en m√© moire pour l‚Äô exemple )\n4 client = chromadb . Client ()\n5 collection = client . create_collection (" mon_dataset_ia ")\n6\n7 # Ajout de documents ( texte brut + m√© tadonn √©es)\n8 collection', metadata={'source': 'embedding_course_by_koulou.pdf'}),
  'original_index': 0,
  'score': None},
 {'doc': Documen

In [10]:


print("\n=== R√©sultats Rerank√©s ===\n")
for i, res in enumerate(reranked_results, 1):
    score_str = f"{res['score']:.4f}" if res['score'] is not None else "N/A"
    print(f"--- R√©sultat {i} --- (Score: {score_str})")
    content = getattr(res["doc"], "page_content", "") or getattr(res["doc"], "content", "")
    print(content[:500], "...")


=== R√©sultats Rerank√©s ===

--- R√©sultat 1 --- (Score: N/A)
.
8

[PAGE 10]

√âtat de l‚Äôart Rapport IA 2024
4.3.1 Comparatif Technique
‚Äî FAISS (Meta): Biblioth√®que bas niveau, optimis√©e pour la recherche par simila-
rit√© dense et le clustering. Utilise l‚Äôindexation IVF.
‚Äî ChromaDB : Solution open-source conviviale pour les d√©veloppeurs, id√©ale pour
les applications LLM l√©g√®res et le prototypage.
‚Äî Pinecone / Qdrant: Solutions g√©r√©es (SaaS) ou robustes (Rust) pour la produc-
tion √† grande √©chelle.
4.3.2 Exemple d‚Äôimpl√©mentation (Python)
Voici comment on ini ...
--- R√©sultat 2 --- (Score: N/A)
. Dans ce contexte, les r√©seaux de neurones profonds et les
bases de donn√©es vectorielles jouent un r√¥le crucial pour traiter des informations non
structur√©es. Ce paragraphe sert de remplissage pour simuler le volume de texte du rap-
port Ô¨Ånal, permettant d‚Äôappr√©cier la mise en page sans √™tre distrait par du latin. Les
avanc√©es technologiques r√©centes, notamm

## petit prompt engeneering

In [None]:
import openai
from openai import OpenAI

from typing import List, Dict, Any, Optional

# === Configuration OpenAI ===
OPENAI_API_KEY = "votre cle api_openai"  
# ‚ö†Ô∏è √Ä remplacer ou charger depuis .env
openai.api_key = OPENAI_API_KEY

# Optionnel : si tu veux utiliser un mod√®le diff√©rent
GPT_MODEL = "gpt-4o-mini"  # ou "gpt-3.5-turbo", "gpt-4-turbo", etc.
client = OpenAI(api_key=OPENAI_API_KEY)  # ‚úÖ Client instanc


In [28]:


def generate_answer_with_gpt(
    query: str,
    reranked_results: List[Dict[str, Any]],
    system_prompt: Optional[str] = None,
    max_tokens: int = 500,
    temperature: float = 0.3
) -> str:
    """
    G√©n√®re une r√©ponse synth√©tique √† partir des r√©sultats rerank√©s, en utilisant GPT (OpenAI v1+).
    """
    if not reranked_results:
        return "Aucun r√©sultat disponible pour r√©pondre √† votre question."

    context_parts = []
    for i, item in enumerate(reranked_results, 1):
        doc = item["doc"]
        content = getattr(doc, "page_content", "") or getattr(doc, "content", "")
        score = item.get("score")
        original_idx = item.get("original_index", "??")

        score_str = f"{score:.4f}" if score is not None else "N/A"
        context_parts.append(
            f"[Document {i} (Orig. idx: {original_idx}) - Score: {score_str}]\n{content.strip()}"
        )

    context = "\n\n".join(context_parts)

    if system_prompt is None:
        system_prompt = (
            "Tu es un assistant intelligent qui r√©pond aux questions en t'appuyant "
            "sur des extraits de documents fournis. Sois clair, concis, et pr√©cis. "
            "Si tu ne trouves pas d'information pertinente, dis-le honn√™tement."
        )

    user_prompt = f"""
Question : {query}

Contexte (documents pertinents) :
{context}

R√©ponds de mani√®re compl√®te, structur√©e, et adapt√©e √† la question.
"""

    try:
        completion = client.chat.completions.create(  # ‚úÖ Nouvelle syntaxe OpenAI v1+
            model=GPT_MODEL,
            messages=[
                {"role": "system", "content": system_prompt},
                {"role": "user", "content": user_prompt}
            ],
            max_tokens=max_tokens,
            temperature=temperature,
            n=1
        )

        answer = completion.choices[0].message.content.strip()
        return answer

    except Exception as e:
        print(f"[‚ö†Ô∏è Error] √âchec de g√©n√©ration avec GPT : {e}")
        return "D√©sol√©, je n'ai pas pu g√©n√©rer de r√©ponse pour le moment."
    
    
# Supposons que tu as d√©j√† ex√©cut√© le reranking
query = "Explique-moi la diff√©rence entre FAISS et ChromaDB"
faiss_results = faiss_index.similarity_search(query, k=10)
reranked = rerank_with_cohere(query, faiss_results, top_n=5)
reranked    



[{'doc': Document(page_content='.\n8\n\n[PAGE 10]\n\n√âtat de l‚Äôart Rapport IA 2024\n4.3.1 Comparatif Technique\n‚Äî FAISS (Meta): Biblioth√®que bas niveau, optimis√©e pour la recherche par simila-\nrit√© dense et le clustering. Utilise l‚Äôindexation IVF.\n‚Äî ChromaDB : Solution open-source conviviale pour les d√©veloppeurs, id√©ale pour\nles applications LLM l√©g√®res et le prototypage.\n‚Äî Pinecone / Qdrant: Solutions g√©r√©es (SaaS) ou robustes (Rust) pour la produc-\ntion √† grande √©chelle.\n4.3.2 Exemple d‚Äôimpl√©mentation (Python)\nVoici comment on initialise une recherche simple avec la librairie ChromaDB :\n1 import chromadb\n2\n3 # Initialisation du client (en m√© moire pour l‚Äô exemple )\n4 client = chromadb . Client ()\n5 collection = client . create_collection (" mon_dataset_ia ")\n6\n7 # Ajout de documents ( texte brut + m√© tadonn √©es)\n8 collection', metadata={'source': 'embedding_course_by_koulou.pdf'}),
  'original_index': 0,
  'score': None},
 {'doc': Documen

In [29]:



# G√©n√©rer la r√©ponse finale avec GPT
final_answer = generate_answer_with_gpt(query, reranked)

print("\n=== R√©ponse finale g√©n√©r√©e par GPT ===\n")
print(final_answer)



=== R√©ponse finale g√©n√©r√©e par GPT ===

FAISS (Facebook AI Similarity Search) et ChromaDB sont deux outils utilis√©s pour la recherche et la gestion de donn√©es vectorielles, mais ils diff√®rent dans leur conception et leur utilisation.

### FAISS
- **D√©veloppeur** : Meta (anciennement Facebook).
- **Type** : Biblioth√®que de bas niveau.
- **Fonctionnalit√©** : Optimis√©e pour la recherche par similarit√© dense et le clustering.
- **Indexation** : Utilise des techniques avanc√©es comme l'indexation IVF (Inverted File).
- **Utilisation** : Plus adapt√©e pour des applications n√©cessitant une performance √©lev√©e dans la recherche de similarit√© sur de grands ensembles de donn√©es.

### ChromaDB
- **Type** : Solution open-source.
- **Convivialit√©** : Con√ßue pour √™tre facile √† utiliser, particuli√®rement pour les d√©veloppeurs.
- **Applications** : Id√©ale pour des applications l√©g√®res de mod√®les de langage (LLM) et pour le prototypage.
- **Fonctionnalit√©** : Permet l'ajout 

## FULL process avec Langchain

<img src="prompt_engeneering.jpeg" alt="Logo Python" width="1800" height="2800">


In [34]:


from typing import List, Dict, Any, Optional
from pypdf import PdfReader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_core.documents import Document
from langchain.vectorstores import FAISS
from langchain.embeddings import HuggingFaceEmbeddings
import cohere
from openai import OpenAI


class RAGWithCohereRerank:
    """
    Classe pour ex√©cuter un pipeline RAG complet avec reranking Cohere.
    
    Fonctionnalit√©s :
    - Chargement et chunking d'un PDF
    - Cr√©ation d'un index FAISS
    - Reranking des r√©sultats avec Cohere
    - G√©n√©ration de r√©ponse avec OpenAI GPT
    """

    def __init__(
        self,
        pdf_path: str,
        cohere_api_key: str,
        openai_api_key: str,
        model_name: str = "sentence-transformers/all-MiniLM-L6-v2",
        rerank_model: str = "rerank-multilingual-v3.0",
        gpt_model: str = "gpt-4o-mini"
    ):
        """
        Initialisation du pipeline RAG.
        """
        self.pdf_path = pdf_path
        self.cohere_api_key = cohere_api_key
        self.openai_api_key = openai_api_key
        self.model_name = model_name
        self.rerank_model = rerank_model
        self.gpt_model = gpt_model

        # Initialiser les clients
        self.cohere_client = cohere.Client(cohere_api_key)
        self.openai_client = OpenAI(api_key=openai_api_key)

        # Variables internes
        self.chunks = None
        self.faiss_index = None

        # üëá Charger et d√©couper le PDF
        self._load_and_split_pdf()
        # üëá Construire l'index FAISS
        self._build_index()




    def _load_and_split_pdf(self):
        """Charge et d√©coupe le PDF en chunks."""
        reader = PdfReader(self.pdf_path)
        full_text = ""
        for i, page in enumerate(reader.pages):
            text = page.extract_text() or ""
            full_text += text + f"\n\n[PAGE {i+1}]\n\n"

        doc = Document(
            page_content=full_text.strip().replace('. .', ''),
            metadata={"source": self.pdf_path}
        )

        text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=1000,
            chunk_overlap=100,
            separators=['.'],
            keep_separator=True
        )

        self.chunks = text_splitter.split_documents([doc])
        return self.chunks

    def _build_index(self):
        """Construit l'index FAISS √† partir des chunks."""
        embeddings = HuggingFaceEmbeddings(model_name=self.model_name)
        self.faiss_index = FAISS.from_documents(self.chunks, embeddings)
        print(f"[‚úÖ] Index FAISS construit avec {len(self.chunks)} chunks.")

    def _rerank_with_cohere(self, query: str, faiss_results: List[Any], top_n: int = 5) -> List[Dict[str, Any]]:
        """
        Rerank les r√©sultats FAISS avec Cohere.
        """
        if not faiss_results:
            return []

        documents = []
        for res in faiss_results:
            text = getattr(res, "page_content", None) or getattr(res, "content", None) or str(res)
            documents.append(text)

        try:
            response = self.cohere_client.rerank(
                model=self.rerank_model,
                query=query,
                documents=documents,
                top_n=min(top_n, len(documents))
            )
        except Exception as e:
            print(f"[‚ö†Ô∏è Warning] Cohere rerank failed: {e}")
            return [
                {"doc": faiss_results[i], "original_index": i, "score": None}
                for i in range(min(top_n, len(faiss_results)))
            ]

        results_list = getattr(response, "results", None) or response

        reranked = []
        for item in results_list:
            idx = getattr(item, "index", None)
            score = getattr(item, "relevance_score", None) or getattr(item, "score", None)

            if idx is None or idx >= len(faiss_results):
                continue

            reranked.append({
                "doc": faiss_results[idx],
                "original_index": idx,
                "score": float(score) if score is not None else None
            })

        return reranked

    def _generate_answer_with_gpt(self, query: str, reranked_results: List[Dict[str, Any]]) -> str:
        """
        G√©n√®re une r√©ponse avec GPT √† partir des r√©sultats rerank√©s.
        """
        if not reranked_results:
            return "Aucun r√©sultat disponible pour r√©pondre √† votre question."

        context_parts = []
        for i, item in enumerate(reranked_results, 1):
            doc = item["doc"]
            content = getattr(doc, "page_content", "") or getattr(doc, "content", "")
            score = item.get("score")
            original_idx = item.get("original_index", "??")

            score_str = f"{score:.4f}" if score is not None else "N/A"
            context_parts.append(
                f"[Document {i} (Orig. idx: {original_idx}) - Score: {score_str}]\n{content.strip()}"
            )

        context = "\n\n".join(context_parts)

        system_prompt = (
            "Tu es un assistant intelligent qui r√©pond aux questions en t'appuyant "
            "sur des extraits de documents fournis. Sois clair, concis, et pr√©cis. "
            "Si tu ne trouves pas d'information pertinente, dis-le honn√™tement."
        )

        user_prompt = f"""
Question : {query}

Contexte (documents pertinents) :
{context}

R√©ponds de mani√®re compl√®te, structur√©e, et adapt√©e √† la question.
"""

        try:
            completion = self.openai_client.chat.completions.create(
                model=self.gpt_model,
                messages=[
                    {"role": "system", "content": system_prompt},
                    {"role": "user", "content": user_prompt}
                ],
                max_tokens=500,
                temperature=0.3,
                n=1
            )

            answer = completion.choices[0].message.content.strip()
            return answer

        except Exception as e:
            print(f"[‚ö†Ô∏è Error] √âchec de g√©n√©ration avec GPT : {e}")
            return "D√©sol√©, je n'ai pas pu g√©n√©rer de r√©ponse pour le moment."

    def ask(self, query: str, k_retrieve: int = 10, k_rerank: int = 5) -> str:
        """
        R√©pond √† une question en utilisant le pipeline RAG complet.
        
        Args:
            query (str): La question utilisateur.
            k_retrieve (int): Nombre de r√©sultats √† r√©cup√©rer depuis FAISS.
            k_rerank (int): Nombre de r√©sultats √† reranker et retourner.

        Returns:
            str: R√©ponse g√©n√©r√©e par GPT.
        """
        print(f"[üîç] Recherche initiale avec FAISS (k={k_retrieve})...")
        faiss_results = self.faiss_index.similarity_search(query, k=k_retrieve)

        print(f"[üîÑ] Reranking avec Cohere (top {k_rerank})...")
        reranked = self._rerank_with_cohere(query, faiss_results, top_n=k_rerank)

        print(f"[ü§ñ] G√©n√©ration de r√©ponse avec {self.gpt_model}...")
        final_answer = self._generate_answer_with_gpt(query, reranked)

        return final_answer






In [35]:


PDF_PATH = "embedding_course_by_koulou.pdf"  # ou ton fichier PDF

# Instancier le pipeline
rag = RAGWithCohereRerank(
    pdf_path=PDF_PATH,
    cohere_api_key=COHERE_API_KEY,
    openai_api_key=OPENAI_API_KEY,
    rerank_model="rerank-multilingual-v3.0"  # ‚úÖ Mod√®le actuel
)



[‚úÖ] Index FAISS construit avec 24 chunks.


In [37]:
# Poser une question
question = "Explique-moi la diff√©rence entre FAISS et ChromaDB"
response = rag.ask(question, k_retrieve=10, k_rerank=5)
print("\n=== R√©ponse finale g√©n√©r√©e par le pipeline RAG ===\n")
print(response)

[üîç] Recherche initiale avec FAISS (k=10)...
[üîÑ] Reranking avec Cohere (top 5)...
[ü§ñ] G√©n√©ration de r√©ponse avec gpt-4o-mini...

=== R√©ponse finale g√©n√©r√©e par le pipeline RAG ===

FAISS (Facebook AI Similarity Search) et ChromaDB sont deux outils utilis√©s pour la recherche par similarit√©, mais ils diff√®rent par leur conception et leur utilisation.

### FAISS
- **Type** : Biblioth√®que bas niveau.
- **Optimisation** : Sp√©cifiquement con√ßue pour la recherche par similarit√© dense et le clustering.
- **Technologie** : Utilise des techniques d'indexation avanc√©es, comme l'indexation IVF (Inverted File).
- **Public cible** : Destin√©e aux d√©veloppeurs qui ont besoin d'une solution robuste et performante pour des applications n√©cessitant une recherche de haute performance sur de grands ensembles de donn√©es.

### ChromaDB
- **Type** : Solution open-source.
- **Convivialit√©** : Con√ßue pour √™tre facile √† utiliser, particuli√®rement adapt√©e aux d√©veloppeurs.
- **Ut