In [None]:
%pip install -qU langchain-google-vertexai
%pip install -qU langchain-community
%pip install -qU faiss-cpu
%pip install -qU tiktoken
#

  # google-cloud-aiplatform \
  # google-cloud-storage \



In [None]:
!gcloud config set project fiscalia-455807


Updated property [core/project].


In [None]:
from langchain_google_vertexai import VertexAIEmbeddings

# Initialize the a specific Embeddings Model version
embeddings = VertexAIEmbeddings(model_name="text-embedding-004")

In [None]:
from google.cloud import storage
from langchain_community.vectorstores import FAISS
import os

def download_faiss_from_gcs(bucket_name: str, gcs_prefix: str, local_path: str):
    client = storage.Client()
    bucket = client.bucket(bucket_name)

    # Cr√©e le dossier local
    os.makedirs(local_path, exist_ok=True)

    # Liste et t√©l√©charge les fichiers du vector store
    blobs = list(bucket.list_blobs(prefix=gcs_prefix))
    for blob in blobs:
        filename = blob.name.split("/")[-1]
        destination = os.path.join(local_path, filename)
        blob.download_to_filename(destination)
        print(f"‚¨áÔ∏è  {blob.name} ‚Üí {destination}")

# === Param√®tres
BUCKET_NAME = "fiscalia-455807-vector-store"

# CGI
CGI_PREFIX = "vector_stores/cgi_index"
CGI_LOCAL_PATH = "/tmp/vector_stores/cgi_faiss"

# BOFIP
BOFIP_PREFIX = "vector_stores/bofip_index"
BOFIP_LOCAL_PATH = "/tmp/vector_stores/bofip_faiss"

# BOFIP_bareme
BOFIP_BAREME_PREFIX = "vector_stores/bofip_bareme_index"
BOFIP_BAREME_LOCAL_PATH = "/tmp/vector_stores/bofip_bareme_faiss"

# === T√©l√©chargement & Chargement CGI
download_faiss_from_gcs(BUCKET_NAME, CGI_PREFIX, CGI_LOCAL_PATH)
cgi_db = FAISS.load_local(
    CGI_LOCAL_PATH,
    embeddings,
    allow_dangerous_deserialization=True
)

# === T√©l√©chargement & Chargement BOFIP
download_faiss_from_gcs(BUCKET_NAME, BOFIP_PREFIX, BOFIP_LOCAL_PATH)
bofip_db = FAISS.load_local(
    CGI_LOCAL_PATH,
    embeddings,
    allow_dangerous_deserialization=True
)

print("‚úÖ Vector store charg√© depuis GCS")

# === T√©l√©chargement & Chargement BOFIP_bareme
download_faiss_from_gcs(BUCKET_NAME, BOFIP_BAREME_PREFIX, BOFIP_BAREME_LOCAL_PATH)
bofip_barem_db = FAISS.load_local(
    CGI_LOCAL_PATH,
    embeddings,
    allow_dangerous_deserialization=True
)

print("‚úÖ Vector store charg√© depuis GCS")

‚¨áÔ∏è  vector_stores/cgi_index/index.faiss ‚Üí /tmp/vector_stores/cgi_faiss/index.faiss
‚¨áÔ∏è  vector_stores/cgi_index/index.pkl ‚Üí /tmp/vector_stores/cgi_faiss/index.pkl
‚¨áÔ∏è  vector_stores/bofip_index/index.faiss ‚Üí /tmp/vector_stores/bofip_faiss/index.faiss
‚¨áÔ∏è  vector_stores/bofip_index/index.pkl ‚Üí /tmp/vector_stores/bofip_faiss/index.pkl
‚úÖ Vector store charg√© depuis GCS
‚¨áÔ∏è  vector_stores/bofip_bareme_index/index.faiss ‚Üí /tmp/vector_stores/bofip_bareme_faiss/index.faiss
‚¨áÔ∏è  vector_stores/bofip_bareme_index/index.pkl ‚Üí /tmp/vector_stores/bofip_bareme_faiss/index.pkl
‚úÖ Vector store charg√© depuis GCS


In [None]:
from langchain.agents import initialize_agent, Tool
from langchain_google_vertexai import VertexAI
from langchain.chains import RetrievalQA
from langchain_core.prompts import PromptTemplate

# === LLM
llm = VertexAI(model_name="gemini-2.0-flash-lite", temperature=0.3)

# === Prompt g√©n√©rique
prompt_template = """
Tu es un assistant fiscal expert du Code G√©n√©ral des Imp√¥ts et du BOFiP.

Tu dois r√©pondre √† la question suivante de mani√®re claire, structur√©e et pr√©cise.
Ta r√©ponse doit **prioritairement** s‚Äôappuyer sur les extraits de documents fournis.
Tu peux utiliser tes **connaissances fiscales g√©n√©rales** si les extraits sont insuffisants, √† condition de l‚Äôindiquer explicitement dans ta r√©ponse.

Lorsque les extraits contiennent des tableaux, tu es autoris√© √† les interpr√©ter et √† appliquer les formules qui y figurent.

Exemple :
---
Extrait :
Puissance administrative | Jusqu'√† 5 000 km | De 5001 √† 20 000 km | Au del√† de 20 000 km
7 CV et plus | d x 0,697 | (d x 0,394) + 1515 | d x 0,470

Question :
Quel est le montant des indemnit√©s kilom√©triques pour 7 CV et 5500 km ?

R√©ponse :
Pour un v√©hicule de 7 CV ayant parcouru 5500 km, la formule applicable est : (5500 √ó 0,394) + 1515 = 3 682 ‚Ç¨.

---

Contexte :
{context}

Question :
{question}

R√©ponse :
"""


prompt = PromptTemplate(
    input_variables=["context", "question"],
    template=prompt_template,
)


In [None]:
from langchain.chains import RetrievalQA

def build_rag_chain(retriever):
    return RetrievalQA.from_chain_type(
        llm=llm,
        retriever=retriever,
        return_source_documents=True,
        chain_type="stuff",
        chain_type_kwargs={"prompt": prompt}
    )


In [None]:
# === 1. CGI
retriever_cgi = cgi_db.as_retriever(search_kwargs={"k": 3})
qa_chain_cgi = build_rag_chain(retriever_cgi)

def rag_cgi(query: str) -> str:
    result = qa_chain_cgi.invoke(query)
    sources = [doc.metadata.get("source", "CGI") for doc in result["source_documents"]]
    return f"{result['result']}\n\nüìö Sources CGI :\n" + "\n".join(f"- {s}" for s in sources)

# === 2. BOFiP
retriever_bofip = bofip_db.as_retriever(search_kwargs={"k": 3})
qa_chain_bofip = build_rag_chain(retriever_bofip)

def rag_bofip(query: str) -> str:
    result = qa_chain_bofip.invoke(query)
    sources = [doc.metadata.get("source", "BOFiP") for doc in result["source_documents"]]
    return f"{result['result']}\n\nüìö Sources BOFiP :\n" + "\n".join(f"- {s}" for s in sources)

# === 3. BOFiP_bareme
retriever_bofip_barem = bofip_barem_db.as_retriever(search_kwargs={"k": 3})
qa_chain_bofip_barem = build_rag_chain(retriever_bofip_barem)

def rag_bofip_barem(query: str) -> str:
    result = qa_chain_bofip_barem.invoke(query)
    sources = [doc.metadata.get("source", "BOFiP Bar√®me") for doc in result["source_documents"]]
    return f"{result['result']}\n\nüìö Sources BOFiP Bar√®me :\n" + "\n".join(f"- {s}" for s in sources)



In [None]:
def search_web(query: str) -> str:
    return "üîç Recherche web d√©sactiv√©e pour l‚Äôinstant."


In [None]:
from langchain.agents import Tool

tools = [
    Tool(
        name="Recherche_CGI",
        func=rag_cgi,
        description="Utilise pour r√©pondre √† une question en interrogeant le Code G√©n√©ral des Imp√¥ts."
    ),
    Tool(
        name="Recherche_BOFIP",
        func=rag_bofip,
        description="Utilise pour r√©pondre √† une question en interrogeant la base de doctrine fiscale (BOFiP)."
    ),
      Tool(
        name="Recherche_BOFIP_bareme",
        func=rag_bofip,
        description="Utilise pour r√©pondre √† une question en interrogeant les baremes de la base de doctrine fiscale (BOFiP)."
    ),
    Tool(
        name="Recherche_Web",
        func=search_web,
        description="(Optionnel) Recherche compl√©mentaire sur des sites sp√©cialis√©s de fiscalit√©."
    )
]


In [None]:
agent = initialize_agent(
    tools=tools,
    llm=llm,
    agent="zero-shot-react-description",
    verbose=True
)

# === Test
response = agent.invoke("Comment fonctionne les indemnit√©s kilom√©triques ?")
print("üß† R√©ponse de l‚Äôagent :", response)




[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mJe dois trouver des informations sur le fonctionnement des indemnit√©s kilom√©triques. Je vais commencer par chercher dans le Code G√©n√©ral des Imp√¥ts.
Action: Recherche_CGI
Action Input: indemnit√©s kilom√©triques fonctionnement[0m
Observation: [36;1m[1;3mJe suis d√©sol√©, mais les extraits fournis ne contiennent aucune information concernant le calcul ou le fonctionnement des indemnit√©s kilom√©triques. Ils traitent de sujets li√©s aux imp√¥ts directs, aux provisions techniques dans le secteur de l'assurance, et √† la compensation des r√©sultats techniques d√©ficitaires.

Par cons√©quent, je ne peux pas r√©pondre √† votre question sur le fonctionnement des indemnit√©s kilom√©triques en me basant sur les documents fournis.


üìö Sources CGI :
- Code G√©n√©ral des Imp√¥ts
- Code G√©n√©ral des Imp√¥ts
- Code G√©n√©ral des Imp√¥ts[0m
Thought:[32;1m[1;3mJe n'ai pas trouv√© d'informations pertinentes dans le Code G√©n√©r

In [None]:
# === Test
response = agent.invoke("Combien je vais payer d'indemnit√©s kilom√©triques pour une voiture de 7 CV et 5500 km?")
print("üß† R√©ponse de l‚Äôagent :", response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mJe dois calculer le montant des indemnit√©s kilom√©triques. Pour cela, je dois consulter les bar√®mes fiscaux. Je vais commencer par chercher le bar√®me applicable pour les voitures.
Action: Recherche_BOFIP_bareme
Action Input: indemnit√©s kilom√©triques bar√®me voiture[0m
Observation: [38;5;200m[1;3mLes informations fournies ne permettent pas de calculer directement les indemnit√©s kilom√©triques en utilisant le bar√®me. Cependant, elles donnent des indications importantes :

1.  **Le bar√®me existe :** Il est pr√©cis√© que l'√©valuation des frais de d√©placement (autres que les frais de p√©age, de garage, de parking et les int√©r√™ts d'emprunt) peut se faire sur la base d'un bar√®me forfaitaire fix√© par arr√™t√© du ministre charg√© du budget.
2.  **Les crit√®res du bar√®me :** Ce bar√®me tient compte de la puissance administrative du v√©hicule (limit√©e √† 7 CV), du type de motorisation et de la distance annuelle parcou

NameError: name 'chunks_bofip_bareme' is not defined