In [1]:
import ollama
import psycopg

In [2]:
db_connection_str = "postgresql://postgres:postgres@localhost:5433/chatbot"

EMBEDDING_MODEL = "nomic-embed-text"  # Mod√®le pour les embeddings
CHAT_MODEL = "gpt-oss:120b-cloud"       # Mod√®le pour la g√©n√©ration de r√©ponses

print(f"‚úì Mod√®le d'embedding : {EMBEDDING_MODEL}")
print(f"‚úì Mod√®le de chat : {CHAT_MODEL}")
print(f"‚úì Base de donn√©es : PostgreSQL sous wsl (port 5433)")

‚úì Mod√®le d'embedding : nomic-embed-text
‚úì Mod√®le de chat : gpt-oss:120b-cloud
‚úì Base de donn√©es : PostgreSQL sous wsl (port 5433)


In [3]:
def embed_text(text: str, model_name: str = EMBEDDING_MODEL) -> list[float]:
    """
    G√©n√®re un embedding pour le texte donn√© avec Ollama
    """
    if not text or not text.strip():
        raise ValueError("Le texte ne peut pas √™tre vide")
    
    response = ollama.embeddings(
        model=model_name,
        prompt=text
    )
    return response["embedding"]

def fetch_similar_from_db(query_embedding: list[float], top_k: int = 3, connection: str = db_connection_str):
    """
    R√©cup√®re les top-k documents les plus similaires depuis la base de donn√©es
    
    Returns:
        list of tuples (id, corpus, similarity)
    """
    if not query_embedding:
        return []
    
    with psycopg.connect(connection) as conn:
        with conn.cursor() as cur:
            cur.execute(
                """
                SELECT id, corpus,
                       1 - (embedding <=> %s::vector) AS similarity
                FROM embeddings
                ORDER BY embedding <=> %s::vector
                LIMIT %s
                """,
                (query_embedding, query_embedding, top_k),
            )
            return cur.fetchall()


def build_prompt(question: str, docs: list[tuple], max_chars: int = 2000) -> str:
    """
    Construit un prompt RAG avec le contexte et la question
    Returns:
        Prompt format√© pour le mod√®le
    """
    context_parts = []
    used = 0
    
    for _id, content, _sim in docs:
        if not content:
            continue
        part = content.strip()
        if used + len(part) > max_chars:
            part = part[: max(0, max_chars - used)]
        context_parts.append(part)
        used += len(part)
        if used >= max_chars:
            break
    
    context_text = "\n\n---\n\n".join(context_parts)
    
    prompt = (
        "Tu es un assistant . Utilise UNIQUEMENT les documents fournis ci-dessous pour r√©pondre √† la question.\n\n"
        "Si la r√©ponse n'est pas dans les documents, dis 'Je ne sais pas'. \n\n"
        "CONTEXTE:\n" + context_text + "\n\n"
        "QUESTION: " + question + "\n\n"
        "R√©ponds de mani√®re claire et concise en te basant UNIQUEMENT sur le contexte fourni:"
    )
    return prompt


def generate_answer(question: str, top_k: int = 3, chat_model: str = CHAT_MODEL, verbose: bool = False):
    """
    Fonction principale : g√©n√®re une r√©ponse RAG compl√®te
    
    Args:
        question: Question de l'utilisateur
        top_k: Nombre de documents √† r√©cup√©rer
        chat_model: Mod√®le Ollama √† utiliser
        verbose: Afficher les d√©tails du prompt
    
    Returns:
        dict avec 'answer', 'contexts' et 'prompt'
    """
    # 1. Calculer l'embedding de la question
    print(f"üîç Recherche de documents similaires...")
    q_emb = embed_text(question)
    
    # 2. R√©cup√©rer les documents similaires
    docs = fetch_similar_from_db(q_emb, top_k=top_k)
    
    if not docs:
        return {
            "answer": "Aucun document pertinent trouv√© dans la base de donn√©es.",
            "contexts": [],
            "prompt": ""
        }
    
    print(f"‚úì {len(docs)} document(s) trouv√©(s)")
    
    # 3. Construire le prompt
    prompt = build_prompt(question, docs)
    
    if verbose:
        print(f"\nüìù Prompt g√©n√©r√© ({len(prompt)} caract√®res):\n")
        print("=" * 70)
        print(prompt)
        print("=" * 70 + "\n")
    
    # 4. G√©n√©rer la r√©ponse avec Ollama
    print(f"ü§ñ G√©n√©ration de la r√©ponse avec {chat_model}...")
    
    response = ollama.generate(
        model=chat_model,
        prompt=prompt,
        options={
            'temperature': 0.7,
            'top_p': 0.9,
            'num_predict': 500,  # Nombre maximum de tokens √† g√©n√©rer
        }
    )
    
    answer = response['response']
    
    return {
        "answer": answer,
        "contexts": docs,
        "prompt": prompt
    }

print("‚úì Fonctions d√©finies")

‚úì Fonctions d√©finies


In [5]:
test_question = "Quels sont les offre de travail disponibles ?"

print(f"Question : {test_question}\n")

result = generate_answer(test_question, top_k=3, verbose=False)

print("\n" + "=" * 70)
print("üìù R√âPONSE")
print("=" * 70)
print(result["answer"])

print("\n" + "=" * 70)
print("üìö SOURCES UTILIS√âES")
print("=" * 70)
for i, (_id, text, sim) in enumerate(result["contexts"], 1):
    preview = text[:150] + "..." if len(text) > 150 else text
    print(f"\n[{i}] ID:{_id} | Similarit√©: {sim:.4f}")
    print(f"    {preview}")

Question : Quels sont les offre de travail disponibles ?

üîç Recherche de documents similaires...

üìù R√âPONSE
Aucun document pertinent trouv√© dans la base de donn√©es.

üìö SOURCES UTILIS√âES


In [5]:
test_question = "combien dappeles sont faites ?"

print(f"Question : {test_question}\n")

result = generate_answer(test_question, top_k=3, verbose=False)

print("\n" + "=" * 70)
print("üìù R√âPONSE")
print("=" * 70)
print(result["answer"])

print("\n" + "=" * 70)
print("üìö SOURCES UTILIS√âES")
print("=" * 70)
for i, (_id, text, sim) in enumerate(result["contexts"], 1):
    preview = text[:150] + "..." if len(text) > 150 else text
    print(f"\n[{i}] ID:{_id} | Similarit√©: {sim:.4f}")
    print(f"    {preview}")

Question : Quels sont les offre de travail disponibles ?

üîç Recherche de documents similaires...

üìù R√âPONSE
Aucun document pertinent trouv√© dans la base de donn√©es.

üìö SOURCES UTILIS√âES
