In [2]:
import json
with open("outputs/all_triples.json", "r", encoding="utf-8") as f:
    all_triples = json.load(f)


In [3]:
from neo4j import GraphDatabase

# ---------- 1. Configuration de la connexion Neo4j ----------
# Remplacez ces valeurs par celles de votre instance Neo4j
uri  = "bolt://localhost:7687"
user = "neo4j"
pwd  = "BNEOsucks8921_"

# Cr√©e un driver Neo4j
driver = GraphDatabase.driver(uri, auth=(user, pwd))


# ---------- 2. Fonction d‚Äôinsertion d‚Äôun triplet dans Neo4j ----------
def insert_triplet(tx, source, relation, target):
    """
    Cr√©e ou r√©cup√®re deux n≈ìuds (Entity) nomm√©s 'source' et 'target', 
    puis cr√©e (si n√©cessaire) la relation entre eux.
    Le type de relation est stock√© dans la propri√©t√© 'type' de l'arc.

    Exemple Cypher g√©n√©r√© :
      MERGE (a:Entity {name: $source})
      MERGE (b:Entity {name: $target})
      MERGE (a)-[:RELATION {type: $relation}]->(b)
    """
    query = """
    MERGE (a:Entity {name: $source})
    MERGE (b:Entity {name: $target})
    MERGE (a)-[:RELATION {type: $relation}]->(b)
    """
    tx.run(query, source=source, relation=relation, target=target)


# ---------- 3. Fonction de chargement de tous les triplets ----------
def load_all_triplets(triplets):
    """
    Parcourt la liste 'triplets' (liste de tuples (source, relation, target))
    et ex√©cute 'insert_triplet' pour chacun d‚Äôentre eux dans une m√™me session.
    """
    with driver.session() as session:
        for src, rel, tgt in triplets:
            session.write_transaction(insert_triplet, src, rel, tgt)
    print(f"‚úÖ {len(triplets)} triplets ins√©r√©s dans Neo4j.")


# ---------- 4. Point d‚Äôentr√©e du script ----------
if __name__ == "__main__":
    # Supposons que vous ayez, dans un autre module, votre liste 'all_triples'
    # Exemple : all_triples = [("Navette autonome", "test√©e dans", "Toulouse"), ...]
    # Il faut donc importer ou recr√©er cette liste ici.
    #
    # Si votre extraction a produit un module Python ou un fichier pickle,
    # r√©cup√©rez la liste de tuples et assignez-la √† 'all_triples'.
    #
    # Par exemple, si vous avez sauvegard√© vos relations dans un fichier JSON :
    #
    # import json
    # with open("outputs/all_triples.json", "r", encoding="utf-8") as f:
    #     all_triples = json.load(f)
    #
    # Mais ici, illustrons un exemple statique (√† remplacer par votre propre liste) :

    # Charge tous les triplets dans Neo4j
    load_all_triplets(all_triples)

    # Ferme le driver une fois termin√©
    driver.close()


  session.write_transaction(insert_triplet, src, rel, tgt)


‚úÖ 26746 triplets ins√©r√©s dans Neo4j.


In [None]:
def fetch_all_triples():
    """
    R√©cup√®re l'ensemble des triplets (entit√©, relation, entit√©) dans Neo4j.
    """
    query = """
    MATCH (a:Source)-[r:RELATION]->(b:Target)
    RETURN a.name AS source, r.type AS relation, b.name AS target
    """
    triples = []
    with driver.session() as session:
        for record in session.run(query):
            triples.append({
                "source": record["source"],
                "relation": record["relation"],
                "target": record["target"]
            })
    return triples

# Exemple :
all_triples = fetch_all_triples()

In [13]:
from llama_index.core.service_context_elements.llm_predictor import LLMPredictor
from llama_index.core import PromptHelper, ServiceContext
from llama_index.cli.rag.base import LLM
from llama_index.core.indices import KnowledgeGraphIndex
#from llama_index.indices.knowledge_graph.schema import KGTable
from llama_index.graph_stores.neo4j import Neo4jPropertyGraphStore
from dotenv import load_dotenv
from llama_index.core.indices import PropertyGraphIndex
import os
import requests
from neo4j import GraphDatabase
import openai
from langchain.llms.base import LLM
from typing import Optional, List, Mapping, Any
from pydantic import BaseModel




In [14]:
# 1) On configure openai pour pointer vers Albert
openai.api_key = 'sk-eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VyX2lkIjo4NDAyLCJ0b2tlbl9pZCI6MTQ4OSwiZXhwaXJlc19hdCI6MTc4MDM1MTIwMH0.mOB9Cx4U4G7K5gin0twePc_WauAEPtRWQ0UaK6oUs9I'
openai.api_base = "https://albert.api.etalab.gouv.fr/v1"


In [15]:
class AlbertLLM(LLM, BaseModel):
    """
    Wrapper LangChain pour Albert (API OpenAI-compatible).
    """

    temperature: float = 0.2
    model_name: str = "albert-small"

    class Config:
        """Pour que pydantic accepte les champs suppl√©mentaires (ignorez-les)."""
        extra = "ignore"

    def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:
        """
        Envoie le prompt √† l‚ÄôAPI Albert et renvoie le texte g√©n√©r√©.
        """
        response = openai.ChatCompletion.create(
            model=self.model_name,
            messages=[{"role": "user", "content": prompt}],
            temperature=self.temperature,
            stop=stop,
            max_tokens=1024,
        )
        return response.choices[0].message.content

    @property
    def _identifying_params(self) -> Mapping[str, Any]:
        return {"model_name": self.model_name, "temperature": self.temperature}

    @property
    def _llm_type(self) -> str:
        return "albert"


In [None]:


import os
from typing import List, Any
from neo4j import GraphDatabase
from langchain.schema import BaseRetriever, Document
from pydantic import PrivateAttr


class Neo4jRetriever(BaseRetriever):
    """
    Retriever LangChain qui interroge Neo4j pour ramener un sous-graphe pertinent.
    """

    # D√©clare driver comme attribut priv√© afin que Pydantic ne l'exige pas comme champ
    _driver: Any = PrivateAttr()

    def __init__(self):
        # Appelle le constructeur de BaseModel
        super().__init__()

        uri = os.getenv("NEO4J_URI")
        user = os.getenv("NEO4J_USER")
        pwd  = os.getenv("NEO4J_PWD")
        self._driver = GraphDatabase.driver(uri, auth=(user, pwd))

    def get_relevant_documents(self, query: str) -> List[Document]:
        """
        1) On extrait des tokens (mots) de la question,
        2) On interroge Neo4j pour chaque token correspondant
           √† un n≈ìud Entity.name,
        3) On construit un Document par relation trouv√©e.
        """
        # Tokenisation basique ; dans la vraie vie, on ferait un NER ou des lowercase+strip
        tokens = [tok.strip() for tok in query.split() if len(tok) > 1]
        seen_relations = set()
        docs: List[Document] = []

        with self._driver.session() as session:
            for tok in tokens:
                cypher = """
                MATCH (n:Entity {name: $name})-[r]-(m:Entity)
                RETURN n.name AS source, type(r) AS rel, m.name AS target
                """
                result = session.run(cypher, name=tok)
                for record in result:
                    src = record["source"]
                    rel = record["rel"]
                    tgt = record["target"]
                    triple_text = f"{src} {rel} {tgt}."
                    if triple_text not in seen_relations:
                        seen_relations.add(triple_text)
                        docs.append(Document(page_content=triple_text))

        return docs

    async def aget_relevant_documents(self, query: str) -> List[Document]:
        # Pour la plupart des usages on peut renvoyer synchrone
        return self.get_relevant_documents(query)

    def __del__(self):
        try:
            self._driver.close()
        except:
            pass


  class Neo4jRetriever(BaseRetriever):
  class Neo4jRetriever(BaseRetriever):


In [None]:
from langchain.prompts import PromptTemplate
from langchain.indexes.vectorstore import RetrievalQA
import dotenv

# ----------------------------------------
# 1. Charger les variables d‚Äôenvironnement
# ----------------------------------------
load_dotenv()

# ----------------------------------------
# 2. Instancier le LLM Albert
# ----------------------------------------
llm = AlbertLLM(temperature=0.2)

# ----------------------------------------
# 3. Cr√©er le prompt template pour la QA
# ----------------------------------------
# {context} = textes du graphe Neo4j
# {question} = question utilisateur
prompt_template = """
Tu es un assistant expert en v√©hicules autonomes.
Voici le contexte extrait d'un graphe de connaissances :
{context}

Question : {question}

R√©ponds de fa√ßon pr√©cise, en t‚Äôappuyant seulement sur ces faits. Si ce n‚Äôest pas dans le contexte, r√©pond ¬´ D√©sol√©, je n‚Äôai pas cette information. ¬ª.
"""

prompt = PromptTemplate(
    template=prompt_template,
    input_variables=["context", "question"]
)

# ----------------------------------------
# 4. Instancier le retriever Neo4j personnalis√©
# ----------------------------------------
graph_retriever = Neo4jRetriever()

# ----------------------------------------
# 5. Construire la cha√Æne RetrievalQA
# ----------------------------------------
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",           # on bourre tout le contexte d‚Äôun coup
    retriever=graph_retriever,
    return_source_documents=False,
    chain_type_kwargs={"prompt": prompt}
)

# ----------------------------------------
# 6. Boucle interactive
# ----------------------------------------
if __name__ == "__main__":
    print("=== Chat GraphRAG (Neo4j + Albert via LangChain) ===")
    while True:
        question = input("\nPose ta question (ou ¬´ exit ¬ª pour quitter) : ")
        if question.lower().strip() in ("exit", "quit"):
            break

        # LangChain :
        #  1) graph_retriever.get_relevant_documents(question) ‚Üí liste de Docs
        #  2) Concat√®ne ‚Äúcontext‚Äù = sommaire des docs, plus ‚Äúquestion‚Äù dans le prompt
        #  3) Envoie tout √† llm._call(prompt_final) ‚Üí Albert ‚Üí g√©n√©ration
        result = qa_chain({"query": question})
        print("\nüìù R√©ponse :")
        print(result["result"])

NameError: name 'load_dotenv' is not defined