In [1]:
!ls ./pdfs

Allassane.pdf  Gbagbo.pdf  Houphouet.pdf


In [2]:
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.embeddings import OllamaEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.llms import Ollama
from langchain_community.document_loaders import PyPDFLoader, DirectoryLoader
import os

In [3]:
pdf_directory =  "./pdfs"
loader = DirectoryLoader(
    pdf_directory,
    glob="**/*.pdf",
    loader_cls=PyPDFLoader
)

documents = loader.load()

In [4]:
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=2500,        # Taille de caract√®re
    chunk_overlap=0,      # Chevauchement entre chunks
    length_function=len
)

chunks = text_splitter.split_documents(documents)

In [5]:
# afficher un chunk
chunks[0]

Document(metadata={'producer': 'Skia/PDF m144 Google Docs Renderer', 'creator': 'PyPDF', 'creationdate': '', 'title': 'Houphouet', 'source': 'pdfs/Houphouet.pdf', 'total_pages': 27, 'page': 0, 'page_label': '1'}, page_content="F√©lix  Houphou√´t-Boigny  est  un  homme  politique fran√ßais puis  homme  d'√âtat ivoirien,  n√©  Dia  Houphou√´t  le  18  octobre  1905  √†  N'Gokro (village  ayant  pr√©c√©d√©  Yamoussoukro)  selon  la  biographie  officielle  et  mort  le  7  d√©cembre  1993  √†  Yamoussoukro.  \nChef  traditionnel,  m√©decin,  planteur  et  dirigeant  syndical,  il  est  notamment  d√©put√©  fran√ßais (1945-1959),  membre  de  gouvernements  fran√ßais (1956-1961),  pr√©sident  de  l'Assembl√©e  nationale  ivoirienne (1953-1959),  maire  d'Abidjan (1956-1960),  Premier  ministre  ivoirien (1959-1960)  et  premier  pr√©sident  de  la  r√©publique  de  C√¥te  d'Ivoire (1960-1993).  ¬´  P√®re  ¬ª  de  l'ind√©pendance de  son  pays,  fr√©quemment  surnomm√©  ¬´  Le  Sage  ¬ª  ou

In [6]:
# nom
len(chunks)

109

**Avec 'Embeddinggemma' comme mod√®le d'Embedding**

In [7]:
embeddings_model =  "embeddinggemma"
embeddings = OllamaEmbeddings(model=embeddings_model)

  embeddings = OllamaEmbeddings(model=embeddings_model)


In [9]:
vector_store = FAISS.from_documents(chunks, embeddings)

In [10]:
# charger vector_store dans FAISS
save_path =  "faiss_index"
vector_store.save_local(save_path)

In [11]:
load_path =  save_path
embeddings = OllamaEmbeddings(model=embeddings_model)
vector_store = FAISS.load_local(load_path, embeddings, allow_dangerous_deserialization=True)

In [12]:
query = "Qui sont Allassane, Gbagbo et Houphouet ? "
print(f"\nüîç Question : {query}")


üîç Question : Qui sont Allassane, Gbagbo et Houphouet ? 


In [15]:
k = 10
# -------- RETRIEVAL : Recherche des documents pertinents --------
relevant_docs = vector_store.similarity_search(query, k=k)

In [16]:
relevant_docs

[Document(id='c8e3feb5-f987-4171-8bf1-ebf21f625cfc', metadata={'producer': 'Skia/PDF m144 Google Docs Renderer', 'creator': 'PyPDF', 'creationdate': '', 'title': 'Gbagbo', 'source': 'pdfs/Gbagbo.pdf', 'total_pages': 12, 'page': 1, 'page_label': '2'}, page_content="(grade  qui  pouvait  √™tre  attribu√©  √†  un  √©tudiant  n'ayant  pas  suivi  les  cours  de  DEA  \nindispensables\n \npour\n \nsoutenir\n \nune\n \nth√®se\n \nde\n \n¬´\n \ndocteur\n \nd'√âtat\n \n¬ª)\n \nen\n \nhistoire\n \nintitul√©e\n Les  Ressorts  socio-√©conomiques  de  la  politique  ivoirienne  :  1940-1960  √†  l'universit√©  Paris-Diderot\n[\n7\n]\n.  \nAscension  politique  \nOpposant  √†  Houphou√´t-Boigny  \nMembre  du  Syndicat  national  de  la  recherche  et  de  l'enseignement  sup√©rieur  (SYNARES),  ce  syndicaliste actif  dans  les  ann√©es  1970 est  emprisonn√©  √†  S√©gu√©la et  Bouak√© de  mars  1971 √†  janvier  1973.  Devenu  directeur  de  l'IHAAA  en  1980,  il  se  r√©v√®le  lors  des  manifes

In [17]:
context = "\n\n".join([doc.page_content for doc in relevant_docs])

In [18]:
llm_model = "mistral:latest"
# -------- GENERATION : G√©n√©ration de la r√©ponse --------
llm = Ollama(model=llm_model)

  llm = Ollama(model=llm_model)


### Avec Ollama

In [19]:
prompt = f"""
Tu es un assistant educatif, professeur, etc...
Utilise UNIQUEMENT les informations suivantes pour r√©pondre.
Si ce n'est pas dans le contexte, dis que ce n'est pas disponible.

CONTEXTE:
{context}

QUESTION:
{query}

R√©ponse :
"""

answer = llm.invoke(prompt)

In [20]:
answer

" Alassane Ouattara est un homme politique ivoirien qui a servi comme pr√©sident de la C√¥te d'Ivoire de 2011 √† 2020. Laurant Gbagbo est √©galement un homme politique ivoirien qui a √©t√© pr√©sident de la C√¥te d'Ivoire de 2000 √† 2011, avant d'√™tre remplac√© par Alassane Ouattara. F√©lix Houphou√´t-Boigny est un homme politique ivoirien qui fut le premier pr√©sident de la C√¥te d'Ivoire apr√®s son ind√©pendance en 1960 jusqu'√† sa mort en 1993. Il gouverna l'Afrique occidentale fran√ßaise (AOF) avant que celle-ci ne devienne la C√¥te d'Ivoire."

### Avec Azure DeepSeek

In [46]:
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

In [None]:
# Ton endpoint et ton mod√®le
endpoint = "https://models.github.ai/inference"
model = "deepseek/DeepSeek-V3-0324"

# Ton token GitHub
token = "**"

In [48]:
prompt = f"""
Tu es un assistant √©ducatif.
Utilise UNIQUEMENT les informations suivantes pour r√©pondre.
Si ce n'est pas dans le contexte, dis que ce n'est pas disponible.

CONTEXTE :
{context}

QUESTION :
{query}

R√©ponse :
"""

In [49]:
client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

# On envoie TON prompt comme UserMessage
response = client.complete(
    messages=[
        SystemMessage("Tu es un assistant RAG sp√©cialis√© en √©ducation."),
        UserMessage(prompt),
    ],
    temperature=0.8,
    top_p=0.1,
    max_tokens=2048,
    model=model
)

KeyboardInterrupt: 

In [78]:
response.choices[0].message.content

'D\'apr√®s le contexte fourni, le pr√©nom "Dia" donn√© √† Houphou√´t signifie dans sa langue "proph√®te" ou "magicien". Le nom "Houphou√´t" provient quant √† lui du baoul√© "ufu…õ" et il s\'agit d\'un nom expiatoire donn√© aux enfants n√©s dans des circonstances particuli√®res (par exemple, aux abords d\'un village ou apr√®s plusieurs d√©c√®s successifs d\'enfants dans la famille). \n\nAinsi, "Dia Houphou√´t" peut √™tre interpr√©t√© comme "le proph√®te/magicien Houphou√´t". Plus tard, il a ajout√© "Boigny" (signifiant "le b√©lier") √† son nom, devenant ainsi Dia Houphou√´t-Boigny.'