In [8]:
from neo4j import GraphDatabase
from qdrant_client import QdrantClient
from qdrant_client.models import PointStruct, VectorParams, Distance
import pandas as pd
from sentence_transformers import SentenceTransformer
from tqdm import tqdm


In [2]:

driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "12345678"))

def get_related_keywords(keyword):
    query = """
    MATCH (n)
    WHERE toLower(n.name) CONTAINS toLower($keyword)
    MATCH (n)--(related)
    RETURN DISTINCT related.name AS keyword, labels(related) AS type
    """
    with driver.session() as session:
        result = session.run(query, keyword=keyword)
        return [record["keyword"] for record in result]



In [None]:
print(get_related_keywords("chauffage"))

In [None]:
df = pd.read_csv("CHUNKS\\file_chunks.csv") 
model = SentenceTransformer("dangvantuan/sentence-camembert-base")

# Let's quickly check the embedding dimension:
dummy_vector = model.encode("texte de test")
dim = len(dummy_vector)  # This will be used in Qdrant's vector params
print(f"Embedding dimension: {dim}")

In [None]:
# Adjust host/port if Qdrant is elsewhere:
client = QdrantClient(url="http://localhost:6333")  # or QdrantClient("localhost", port=6333)

# Create or recreate a collection
collection_name = "PROJET_RCRA2"
client.recreate_collection(
    collection_name=collection_name,
    vectors_config=VectorParams(size=dim, distance=Distance.COSINE)
)

# Now, embed and upsert each CSV chunk as a separate point in Qdrant
points_to_upsert = []
for idx, row in tqdm(df.iterrows()):
    text_chunk = row["chunk"]
    file_id = row["file"]  # might be useful metadata
    vector = model.encode(text_chunk)

    # Create a unique ID for each chunk row
    point_id = idx  
    payload = {
        "file": file_id, 
        "chunk": text_chunk
    }

    # Construct a PointStruct
    points_to_upsert.append(
        PointStruct(
            id=point_id,
            vector=vector.tolist(),
            payload=payload
        )
    )

In [None]:
BATCH_SIZE = 100  # you can tweak this

for i in range(0, len(points_to_upsert), BATCH_SIZE):
    batch = points_to_upsert[i:i + BATCH_SIZE]
    client.upsert(
        collection_name=collection_name,
        points=batch
    )
    print(f"✅ Uploaded batch {i} to {i + len(batch)}")


In [12]:
def expand_query_with_neo4j(user_query):
    """
    Naive approach: split user query into tokens 
    and gather related keywords from Neo4j.
    """
    tokens = user_query.lower().split()
    all_expanded = set()
    for token in tokens:
        expansions = get_related_keywords(token)
        all_expanded.update(expansions)
    return list(all_expanded)


In [13]:
def retrieve_relevant_chunks(user_query, expansions, top_k=5):
    """
    - Combine the user query with expansions
    - Embed once
    - Query Qdrant for the top_k most similar chunks
    """
    if expansions:
        expansion_text = " ".join(expansions)
        augmented_text = user_query + " " + expansion_text
    else:
        augmented_text = user_query
    
    query_vector = model.encode(augmented_text)

    # Qdrant query
    results = client.query_points(
        collection_name=collection_name,
        query=query_vector.tolist(),
        limit=top_k
    )
    
    # 'results' will be a list of ScoredPoint objects
    # Each contains 'payload' (with our stored chunk)
    return results


In [None]:
def expand_query(user_query, top_k=5):
    # 1) Expand user query with Neo4j
    expansions = expand_query_with_neo4j(user_query)
    # 2) Retrieve relevant chunks from Qdrant
    docs = retrieve_relevant_chunks(user_query, expansions, top_k=top_k)
    context_text = ""
    for doc in docs:
        payload = doc[1][0].payload
        context_text += f"Fichier: {payload['file']}\nChunk: {payload['chunk']}\n\n"
    full_prompt = f"""
    CONTEXTE:
    {context_text}

    QUESTION UTILISATEUR:
    {user_query}

    RÉPONSE ATTENDUE (en utilisant uniquement les informations ci-dessus) :
    """
    return full_prompt


In [32]:
query = "Quels sont les avantages d’utiliser une pompe à chaleur avec un plancher chauffant ?"
query = expand_query(query, top_k=3)

['Ventilation', 'Chauffage', 'Isolation thermique', "Membrane d'étanchéité", 'Chauffe-eau thermodynamique', 'RE2020', 'VMC double flux', 'Pompe à chaleur', 'Plancher chauffant', 'Énergie renouvelable']


In [28]:
import requests

def query_ollama(prompt, model="llama3.2"):
    response = requests.post(
        "http://localhost:11434/api/generate",
        json={
            "model": model,
            "prompt": prompt,
            "stream": False  # you can use True if you want streamed responses
        }
    )
    data = response.json()
    return data["response"]




In [30]:

result = query_ollama(query)
print(result)

Les avantages de l'utilisation d'une pompe à chaleur avec un plancher chauffant sont :

1. Chauffage thermodynamique basse température : Cette technologie permet un chauffage efficace et respectueux de l'environnement, en utilisant les énergies renouvelables pour chauffer le plancher.
2. Suppression du bouclage ECS (Équilibreur de Charge Solaire) : En utilisant une pompe à chaleur avec un plancher chauffant, il n'est pas nécessaire d'installer un système de bouclage ECS, ce qui réduit les coûts et l'importance des déchets thermiques.
3. Économie d'énergie : Le chauffage basse température peut réduire la consommation d'énergie pour chauffer le plancher, ce qui peut entraîner une réduction des factures de gaz ou d'électricité.
4. Sécurité et confort : L'utilisation d'une pompe à chaleur avec un plancher chauffant peut améliorer la sécurité et le confort dans les bâtiments, en particulier pour les personnes âgées ou handicapées.
5. Double ou triple service : Cette technologie permet de fo