In [4]:
import os
import requests
from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity


In [28]:
import os 
import requests
from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity
import torch

# 🔐 Ton token Hugging Face
HF_TOKEN = "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"
API_URL = "https://api-inference.huggingface.co/models/NousResearch/Nous-Hermes-2-Mistral-7B-DPO"
HEADERS = {"Authorization": f"Bearer {HF_TOKEN}"}

# 📂 Dossier contenant les fichiers textes des notices
folder_path = 'notices_txt'
embeddings_file = "embeddings.pt"

# 🔁 Fonctions pour embeddings

def load_documents_from_folder(folder_path):
    documents = []
    for filename in os.listdir(folder_path):
        if filename.endswith(".txt"):
            with open(os.path.join(folder_path, filename), "r", encoding="utf-8") as file:
                documents.append(file.read())
    return documents

def create_and_save_embeddings(documents, model_name='all-MiniLM-L6-v2', embeddings_path=embeddings_file):
    model = SentenceTransformer(model_name)
    embeddings = model.encode(documents, convert_to_tensor=True)
    torch.save(embeddings, embeddings_path)
    print(f"✅ Embeddings saved to {embeddings_path}")
    return embeddings

def load_embeddings(embeddings_path=embeddings_file):
    if os.path.exists(embeddings_path):
        embeddings = torch.load(embeddings_path)
        print(f"✅ Embeddings loaded from {embeddings_path}")
        return embeddings
    else:
        return None

def search_relevant_document(question, documents, embeddings, model_name='all-MiniLM-L6-v2', threshold=0.4):
    model = SentenceTransformer(model_name)
    question_embedding = model.encode([question], convert_to_tensor=True)
    similarities = cosine_similarity(question_embedding.cpu().numpy(), embeddings.cpu().numpy())
    max_score = similarities.max()
    if max_score < threshold:
        return None
    best_doc_index = similarities.argmax()
    return documents[best_doc_index]

# 💡 Version avec Nous-Hermes-2 via API Hugging Face

def answer_question_with_mistral_api(question, context):
    context = context.strip().replace("\n", " ")
    truncated_context = context[:1500]  # max ~1500-2000 caractères pour rester dans les limites

    prompt = f"""
    [INST]
    Tu es un assistant **francophone** chargé de répondre à des questions sur les médicaments en te basant **exclusivement sur le contenu de la notice fourni ci-dessous**.

    🧾 Consignes obligatoires :
    - Réponds **en français uniquement**.
    - Ne donne une réponse que **si l’information figure dans la notice**.
    - ❌ N’invente rien. Ne reformule pas librement. Tu peux **résumer légèrement**, mais tu dois **rester fidèle à la notice**.
    - ❌ Ne fais **aucune référence à la notice elle-même**, à ses sections, ni à un professionnel de santé.
    - Si l’information demandée n’est pas dans le contexte, réponds : **"L'information demandée n’est pas disponible dans le contexte fourni."**

    Notice :
    {truncated_context}
    [FIN DU CONTEXTE]

    Question : {question}
    [/INST]
    """

    payload = {
        "inputs": prompt,
        "parameters": {
            "max_new_tokens": 256,
            "temperature": 0.3,
            "top_p": 0.9,
            "do_sample": False,
            "return_full_text": False
        }
    }

    response = requests.post(API_URL, headers=HEADERS, json=payload)

    if response.status_code == 200:
        return response.json()[0]["generated_text"].strip()
    else:
        return f"Erreur API ({response.status_code}): {response.text}"

# 🧪 Utilisation

documents = load_documents_from_folder(folder_path)

# Essaie de charger les embeddings, sinon crée-les
embeddings = load_embeddings()
if embeddings is None:
    embeddings = create_and_save_embeddings(documents)

question = "CONTENU DE LEMBALLAGE ET AUTRES INFORMATIONS de CIMETIDINE ARROW 200 mg ?"
relevant_document = search_relevant_document(question, documents, embeddings)

if relevant_document:
    print("✅ Document pertinent trouvé.")
    print(relevant_document)
    answer = answer_question_with_mistral_api(question, relevant_document)
    print("\n🧠 Réponse :", answer)
else:
    print("❗ Aucun document pertinent trouvé pour cette question.")


✅ Embeddings loaded from embeddings.pt
✅ Document pertinent trouvé.
Dénomination du médicament
CIMETIDINE ARROW 200 mg, comprimé effervescent
Encadré
Veuillez lire attentivement cette notice avant de prendre ce médicament car elle contient des informations importantes pour vous.
·
Gardez cette notice. Vous pourriez avoir besoin de la relire.
·
Si vous avez dautres questions, interrogez votre médecin ou votre pharmacien.
·
Ce médicament vous a été personnellement prescrit. Ne le donnez pas à dautres personnes. Il pourrait leur être nocif, même si les signes de leur maladie sont identiques aux vôtres.
·
Si vous ressentez un quelconque effet indésirable, parlez-en à votre médecin ou votre pharmacien. Ceci sapplique aussi à tout effet indésirable qui ne serait pas mentionné dans cette notice.
Voir rubrique 4.
Que contient cette notice ?
1. Qu'est-ce que CIMETIDINE ARROW 200 mg, comprimé effervescent et dans quels cas est-il utilisé ?
2. Quelles sont les informations à connaître avant de

In [29]:
ollama pull nous-hermes2


SyntaxError: invalid syntax (Temp/ipykernel_24536/1496833733.py, line 1)