In [2]:
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document
from langchain_community.embeddings import OllamaEmbeddings
from langchain.vectorstores.faiss import FAISS
from langchain_community.embeddings import HuggingFaceHubEmbeddings
from langchain import hub
from langchain.vectorstores import Chroma
from langchain_pinecone import PineconeVectorStore
from langchain_community.embeddings import HuggingFaceEmbeddings
import pickle
from langchain_community.llms import Ollama
from langchain.retrievers.multi_query import MultiQueryRetriever
from langchain import hub
import pathlib
import textwrap
import os
import google.generativeai as genai
from IPython.display import display
from IPython.display import Markdown
import glob
from FlagEmbedding import FlagReranker

In [3]:
genai.configure(api_key="AIzaSyBs7fa0hdQsl2cPEQYwLhsO5INKQZxt0Vk")

os.environ["PINECONE_API_KEY"] = "9721efa4-ff98-4bc5-9b28-93919d1657a5"

prompt = hub.pull("mehdixlabetix/rag-law-fr")

llm = Ollama(model="mistral")

embedder = HuggingFaceEmbeddings(
    model_name = "BAAI/bge-m3"
)

persist_directory = 'docs/chroma/'

# Document loader

In [5]:
pdf_files = glob.glob("src/*.pdf")
pages = []

for pdf_file in pdf_files:
    pages.extend(PyPDFLoader(pdf_file).load_and_split())

for page in pages:
    page.page_content = page.page_content.replace("Imprimerie Officielle de la République Tunisienne", "")
    page.page_content = page.page_content.replace("/tatweel", "")


# Splitter


In [6]:
doc_chunks = []
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=850,
    separators=["\nArticle", "\n\n", "\n", ".", "!", "?", ",", " ", ""],
    chunk_overlap=100,
)
chunks = text_splitter.split_documents(pages)
len(chunks)


15880

# Vectorstores
## for now BAAI/bge-m3 is the best embedder

#### In the cloud (pinecone)

In [None]:
index_name = "pfa"

#docsearch = PineconeVectorStore.from_documents(chunks, embedder, index_name=index_name)
#docsearch = PineconeVectorStore(index_name=index_name,embedding=embedder)

#### Locally (chroma)

In [5]:
# vectordb = Chroma.from_documents(
#     documents=chunks,
#     embedding=embedder,
#     persist_directory=persist_directory
# ) 
# vectordb.persist()
vectordb = Chroma(persist_directory=persist_directory,embedding_function=embedder)
print(vectordb._collection.count())

15880


# Retrieval
### 4 methodes

In [19]:

query="j'ai fait un accident aujourd'hui, qu'est ce que je fais ?"

#needs optimization
# rewrite_prompt = " Fournir une meilleure requête au moteur de recherche web pour répondre à la question donnée,commençant les requêtes par '**' et en terminant les requêtes par '**'.Répondez en une seule phrase. Question :"+query+". Réponse (la réponse doit etre en français):"
# rewrited_prompt=llm.invoke(rewrite_prompt)
# rewrited_prompt = rewrited_prompt.split('**')[1]

#méthode 1 avec retriever
# retriever = vectordb.as_retriever(search_type="mmr",search_kwargs={"k": 20})
# matched_docs = retriever.get_relevant_documents(query)
# for i, d in enumerate(matched_docs):
#     print(f"\n## Document {i}\n")
#     print(d.page_content)


#méthode 2 avec mmr
# found_docs = vectordb.max_marginal_relevance_search(query, k=10, fetch_k=500)
# print(found_docs)
# for i, doc in enumerate(found_docs):
#     print(f"{i + 1}.", doc.page_content, "\n\n")

#méthode 3 avec similarity search
# sim_docs = vectordb.similarity_search_with_score(rewrited_prompt, k=5)  
# for result in sim_docs:
#     print("\n")
#     print(result[1])
#     print(result[0].page_content)

#méthode 4 avec multiquery qui utilise le llm pour trouver le contexte
llm_retriever = MultiQueryRetriever.from_llm(retriever=vectordb.as_retriever(), llm=llm)
unique_docs = llm_retriever.get_relevant_documents(query=query)
print(unique_docs)
    

[Document(page_content='\xad Alerter en cas d’accident \n\xad Diagnostic  \n\xad Donner les premiers secours : \n\xad L’état de choc \n\xad Les hémorragies \n\xad L’asphyxie \n\xad Les blessures \n\xad Les positions de sécurité \n\xad Les fractures \n\xad Les brûlures \n\xad L’évacuation des victimes dans les cas extrêmes  \n\xad Transport des victimes', metadata={'page': 408, 'source': 'src\\Route.pdf'}), Document(page_content="31 - prendre les mesures relatives à l’établissement et la signature du \nconstat à l’amiable pour les accidents entre particuliers ; \n- avertir ou faire avertir immédiatement la Police ou la Garde \nNationale, si l'accident a provoqué la mort ou la blessure d'une \npersonne, et éviter  toute modification de l'état des lieux ou la disparition des traces susceptibles de permettre de déterminer la \nresponsabilité de chaque partie, et ce, sans gêner la circulation ; \n- informer la société d'assurance dans les délais réglementaires. \nTITRE II \nREGLES D'UTILISA

# Reranking (using bge reranker)

In [20]:
reranker = FlagReranker('BAAI/bge-reranker-v2-m3', use_fp16=True) # Setting use_fp16 to True speeds up computation with a slight performance degradation

# You can map the scores into 0-1 by set "normalize=True", which will apply sigmoid function to the score
scores = reranker.compute_score([[query,context.page_content] for context in unique_docs ], normalize=True)
print(scores) 
#rank the context.page_content by the scores
reranked_found_docs=sorted(zip(scores,unique_docs),reverse=True)
#remove the scores and keep only the context.page_content
sorted_found_docs=[doc[1] for doc in reranked_found_docs] 


[0.01647841179270704, 0.011103745677516179, 0.0028051707648723955, 0.0052041960460757295, 0.02049719776112262, 0.017915507323800997, 8.304485397564e-05]


# Prompt Engineering and generation

In [21]:
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

final_prompt = prompt.invoke({"context":format_docs(sorted_found_docs), "question":query})

print(final_prompt)

messages=[HumanMessage(content=" Tu es un assistant juridique spécialisé dans la loi en Tunisie. Ta mission est de répondre aux questions des gens sur différents aspects juridiques ,en te limitant aux informations générales et en évitant les cas sensibles ou extrêmes. Si une question dépasse ton champ d'expertise ou si elle concerne un sujet délicat, tu dois informer l'utilisateur que tu ne peux pas fournir d'aide spécifique dans ce cas. Utilise les pièces suivantes du contexte pour répondre. Utilise un langage simple et accessible pour garantir que tout le monde puisse comprendre tes réponses. Gardez votre réponse brève et efficace maximum quatre ou cinq phrases.\xa0Tu dois répondre en français.\n Question: j'ai fait un accident aujourd'hui, qu'est ce que je fais ?.\nContexte: Article 60.- Sous réserve des dispositions relatives au secours des \npersonnes en état de danger, tout conducteur impliqué dans un \naccident de circulation doit :  \n- s'arrêter immédiatement en prenant les pr

#### mistral LLM

In [22]:
llm.invoke(final_prompt)

" Dans un accident, il faut d'abord arrêter immédiatement, éviter toute gêne et prendre les précautions nécessaires. Informer la Police ou la Gendarmerie si seuls des dégâts matériels sont constatés. Selon l'article 60 de la loi tunisienne, il est obligatoire signaler l'accident aux autorités et faire un constat amiable pour les accidents entre particuliers. En cas d'urgence, assurer les premiers secours en suivant les instructions appropriées comme le diagnostic, donner les premiers secours en cas de choc, hémorragies, asphyxie, blessures, positions de sécurité, fractures et brûlures. Enfin, évacuer les victimes dans les cas extrêmes et transportez-les vers un hôpital si nécessaire."

#### list of gemini versions (optional)

In [6]:
for m in genai.list_models():
  if 'generateContent' in m.supported_generation_methods:
    print(m.name)

models/gemini-1.0-pro
models/gemini-1.0-pro-001
models/gemini-1.0-pro-latest
models/gemini-1.0-pro-vision-latest
models/gemini-1.5-pro-latest
models/gemini-pro
models/gemini-pro-vision


#### Gemini (stream)

In [23]:
def to_markdown(text):
  text = text.replace('•', '  *')
  return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))

model = genai.GenerativeModel('gemini-1.5-pro-latest')

# response = model.generate_content(final_prompt.messages[0].content)

response = model.generate_content(final_prompt.messages[0].content,stream=True)
for chunk in response:
  print(chunk.text)

##
 Que faire après un accident de la route en Tunisie? 

Je suis dés
olé d'apprendre que vous avez eu un accident. Voici les étapes à suivre
 :

1. **Sécurité d'abord :** Arrêtez-vous immédiatement et assurez-vous que tout le monde est en sécurité. Si
 nécessaire, prodiguez les premiers soins et appelez les secours.
2. **Prévenir les autorités :** Si l'accident a causé des dommages matéri
els, contactez la police ou la Garde nationale. En cas de blessures ou de décès, contactez-les immédiatement et ne modifiez pas la scène de l'accident.
3. **Documentez l'accident :** Si possible
, prenez des photos des dommages et échangez les informations d'assurance avec les autres parties impliquées.
4. **Contactez votre assurance :** Informez votre compagnie d'assurance de l'accident dans les délais impartis.


**Important :** N'oubliez pas que ces informations sont générales et ne constituent pas un avis juridique. 



# Query safety evaluation

In [24]:
response._result.candidates[0].safety_ratings

[category: HARM_CATEGORY_SEXUALLY_EXPLICIT
probability: NEGLIGIBLE
, category: HARM_CATEGORY_HATE_SPEECH
probability: NEGLIGIBLE
, category: HARM_CATEGORY_HARASSMENT
probability: NEGLIGIBLE
, category: HARM_CATEGORY_DANGEROUS_CONTENT
probability: NEGLIGIBLE
]