# Traffic Violation RAG System
In this exam, you will implement a Retrieval-Augmented Generation (RAG) system that uses a language model and a vector database to answer questions about traffic violations. The goal is to generate answers with relevant data based on a dataset of traffic violations and fines.

Here are helpful resources:
* [LangChain](https://www.langchain.com/)
* [groq cloud documentation](https://console.groq.com/docs/models)
* [LangChain HuggingFace](https://python.langchain.com/docs/integrations/text_embedding/sentence_transformers/)
* [Chroma Vector Store](https://python.langchain.com/docs/integrations/vectorstores/chroma/)
* [Chroma Website](https://docs.trychroma.com/getting-started)
* [ChatGroq LangChain](https://python.langchain.com/docs/integrations/chat/groq/)
* [LLM Chain](https://api.python.langchain.com/en/latest/chains/langchain.chains.llm.LLMChain.html#langchain.chains.llm.LLMChain)

Dataset [source](https://www.moi.gov.sa/wps/portal/Home/sectors/publicsecurity/traffic/contents/!ut/p/z0/04_Sj9CPykssy0xPLMnMz0vMAfIjo8ziDTxNTDwMTYy83V0CTQ0cA71d_T1djI0MXA30gxOL9L30o_ArApqSmVVYGOWoH5Wcn1eSWlGiH1FSlJiWlpmsagBlKCQWqRrkJmbmqRqUZebngB2gUJAKdERJZmqxfkG2ezgAhzhSyw!!/)

Some installs if needed:
```python
!pip install langchain_huggingface langchain langchain-community langchain_chroma Chroma langchain_groq LLMChain
```

In [141]:
!kaggle datasets download -d khaledzsa/dataset
!unzip dataset.zip

Dataset URL: https://www.kaggle.com/datasets/khaledzsa/dataset
License(s): unknown
dataset.zip: Skipping, found more recently modified local copy (use --force to force download)
Archive:  dataset.zip
replace Dataset.csv? [y]es, [n]o, [A]ll, [N]one, [r]ename: 

## Step 1: Install Required Libraries

To begin, install the necessary libraries for this project. The libraries include `LangChain` for building language model chains, and `Chroma` for managing a vector database.

In [142]:
!pip install chromadb

[31mERROR: Operation cancelled by user[0m[31m
[0m

In [143]:
!pip install langchain_huggingface langchain langchain-community langchain_chroma Chroma langchain_groq LLMChain

Collecting langchain_huggingface
  Using cached langchain_huggingface-0.1.0-py3-none-any.whl.metadata (1.3 kB)
Collecting langchain_chroma
  Using cached langchain_chroma-0.1.4-py3-none-any.whl.metadata (1.6 kB)
Collecting Chroma
  Using cached Chroma-0.2.0.tar.gz (5.8 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
[31mERROR: Could not find a version that satisfies the requirement LLMChain (from versions: none)[0m[31m
[0m[31mERROR: No matching distribution found for LLMChain[0m[31m
[0m

In [144]:
!pip install sentence-transformers



In [145]:
%pip install -qU langchain-experimental

In [160]:
import os
import pandas as pd
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.prompts import PromptTemplate
from langchain_community.document_loaders import DirectoryLoader
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings.sentence_transformer import (
    SentenceTransformerEmbeddings,
)
import markdown
from langchain_groq import ChatGroq
from langchain.chains import LLMChain

# Step 2: Load the Traffic Violations Dataset

You are provided with a dataset of traffic violations. Load the CSV file into a pandas DataFrame and preview the first few rows of the dataset using `.head()`. You can also try and see the dataset's characteristics.

In [147]:
df = pd.read_csv('/content/Dataset.csv')
df.head()

Unnamed: 0,المخالفة,الغرامة
0,قيادة المركبة في الأسواق التي لا يسمح بالقيادة...,الغرامة المالية 100 - 150 ريال
1,ترك المركبة مفتوحة وفي وضع التشغيل بعد مغادرتها.,الغرامة المالية 100 - 150 ريال
2,عدم وجود تأمين ساري للمركبة.,الغرامة المالية 100 - 150 ريال
3,عبور المشاة للطرق من غير الأماكن المخصصة لهم.,الغرامة المالية 100 - 150 ريال
4,عدم تقيد المشاة بالإشارات الخاصة بهم.,الغرامة المالية 100 - 150 ريال


In [148]:
len(df)

104

## Step 3: Create Markdown Content from the Dataset

For each traffic violation in the dataset, you will generate markdown text that describes the violation and the associated fine. Create a loop to iterate through the dataset and store the generated markdown in a list. Each fine should look like this:

**المخالفة** - الغرامة

In [161]:
#Create Markdown Content from the Dataset
directory = 'data/markdown_files'
os.makedirs(directory, exist_ok=True)

In [162]:
for i in range(0,103):

     title = df["المخالفة"].iloc[i]
     content = df["الغرامة"].iloc[i]

     markdown_content = f"# {title}\n\n"
     markdown_content += f"{content}\n\n"

     with open(f'{directory}/{i}.md', 'w', encoding='utf-8') as file:
        file.write(markdown_content)

In [163]:
markdown_texts = []
for filename in os.listdir(directory):
  if filename.endswith(".md"):
    with open(os.path.join(directory, filename), 'r', encoding='utf-8') as file:
      markdown_content = file.read()
      html_content = markdown.markdown(markdown_content)
      markdown_texts.append(html_content)

## Step 4: Chunk the Markdown Data

In [152]:
!pip install tiktoken



Using LangChain's `RecursiveCharacterTextSplitter`, split the markdown texts into smaller chunks that will be stored in the vector database.

In [166]:
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(chunk_size=100,
                                               chunk_overlap=20,
                                               length_function=len,
                                               is_separator_regex=False,
                                               )
text = text_splitter.create_documents(markdown_texts)
print(text)

[Document(metadata={}, page_content='<h1>طمس لوحات المركبة.</h1>\n<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة المركبة في الأسواق التي لا يسمح بالقيادة فيها.</h1>\n<p>الغرامة المالية 100 - 150 ريال</p>'), Document(metadata={}, page_content='<h1>عدم ربط حزام الأمان.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>استعمال المركبة لغير الغرض الذي رخصت من أجله.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>القيادة على أكتاف الطريق وعلى الأرصفة أو المسارات التي يمنع القيادة فيها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم قيام السائق الذي يرغب في تغيير مساره بإعطاء الأفضلية لسائق المركبة التي تسير في اتجاه مستقيم'), Document(metadata={}, page_content='في اتجاه مستقيم في حال سير المركبتين متحاذيتين بشكل متواز.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ر

## Step 5: Generate Embeddings for the Documents

Generate embeddings for the chunks of text using HuggingFace's pre-trained Arabic language model. These embeddings will be stored in a `Chroma` vector store.

In [154]:
!pip install -U langchain-community



In [170]:
from langchain.embeddings import HuggingFaceEmbeddings
embeddings = HuggingFaceEmbeddings(model_name="asafaya/bert-base-arabic")
db = Chroma(text,embedding_function, persist_directory="./chroma_db")
# "aubmindlab/bert-large-arabertv02" # embedding



ValueError: Expected collection name that (1) contains 3-63 characters, (2) starts and ends with an alphanumeric character, (3) otherwise contains only alphanumeric characters, underscores or hyphens (-), (4) contains no two consecutive periods (..) and (5) is not a valid IPv4 address, got [Document(metadata={}, page_content='<h1>طمس لوحات المركبة.</h1>\n<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة المركبة في الأسواق التي لا يسمح بالقيادة فيها.</h1>\n<p>الغرامة المالية 100 - 150 ريال</p>'), Document(metadata={}, page_content='<h1>عدم ربط حزام الأمان.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>استعمال المركبة لغير الغرض الذي رخصت من أجله.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>القيادة على أكتاف الطريق وعلى الأرصفة أو المسارات التي يمنع القيادة فيها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم قيام السائق الذي يرغب في تغيير مساره بإعطاء الأفضلية لسائق المركبة التي تسير في اتجاه مستقيم'), Document(metadata={}, page_content='في اتجاه مستقيم في حال سير المركبتين متحاذيتين بشكل متواز.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>نقل الركاب في الأماكن غير المخصصة لهم في المركبة.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>قيام السائق بتخطي أرتال المركبات أمام إشارات المرور أو نقاط الضبط الأمني باستخدام كتف الطريق أو'), Document(metadata={}, page_content='كتف الطريق أو المسار المخصص للالتفاف.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إعطاء أفضلية المرور لوسائل النقل العام كالقطارات أو الحافلات وما في حكمها في حال سيرها على'), Document(metadata={}, page_content='في حال سيرها على المسارات المخصصة لها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم الوقوف وقوفاً تاماً عند إشارة (أمامك أفضلية) في حالة مرور مركبات على الطريق المعطاة له'), Document(metadata={}, page_content='الطريق المعطاة له الأفضلية.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إعطاء أفضلية المرور للمشاة أثناء عبورهم في المسارات المخصصة لهم.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 100 - 150 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إعطاء الأفضلية للمركبات التي على الطريق الرئيسي في حالة عدم وجود إشارة أفضلية.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>تجاوز إشارة المرور الضوئية أثناء الضوء الأحمر.</h1>\n<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إعطاء أفضلية المرور لمركبات المواكب الرسمية أو الطوارئ.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>تركيب تجهيزات في المركبة كتلك الخاصة بالمركبات الرسمية ومركبات الطوارئ.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم التقيد بإشارات رجل الأمن اليدوية عند تنظيمه للحركة وعدم إعطاء إشارته الأولوية على الإشارات'), Document(metadata={}, page_content='على الإشارات الضوئية.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم استخدام الأنوار اللازمة عند السير ليلاً أو في الأحوال الجوية التي تكون فيها الرؤية غير'), Document(metadata={}, page_content='فيها الرؤية غير واضحة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>الوقوف في أماكن وقوف ذوي الاحتياجات الخاصة من غير هذه الفئة المسموح لها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>التجمهر في مواقع التفحيط.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>قيام سائق الدراجة الآلية أو العادية - أو ما في حكمهما - بالتعلق بأي مركبة أخرى، أو سحب أو حمل'), Document(metadata={}, page_content='أخرى، أو سحب أو حمل أشياء تعرض مستخدمي الطريق للخطر.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>عدم الالتزام بحدود المسارات المحددة على الطريق.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>ترك المركبة مفتوحة وفي وضع التشغيل بعد مغادرتها.</h1>\n<p>الغرامة المالية 100 - 150 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة المركبة تحت تأثير مسكر أو مخدر، أو عقاقير محذر من القيادة تحت تأثيرها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 5000 - 10000 ريال</p>'), Document(metadata={}, page_content='<h1>دخول الشاحنات والمعدات الثقيلة وما في حكمهما إلى المدن أو الخروج منها في الأوقات غير المسموح'), Document(metadata={}, page_content='الأوقات غير المسموح بها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>الانشغال بغير الطريق أثناء قيادة المركبة.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>التحرك بالمركبة بسرعة عالية، بحيث تحدث الإطارات صوتاً عالياً.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>رفض إبراز الوثائق الخاصة بالسائق أو المركبة للمصرح لهم الاطلاع عليها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>زيادة أبعاد الحمولة المنقولة لمركبات النقل الثقيل على الحد المسموح به.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>طمس رقم هيكل المركبة أو محاولة طمسه.</h1>\n<p>الغرامة المالية 5000 - 10000 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة مركبة دون توافر التجهيزات اللازمة، مثل المكابح والأنوار وما في حكمهما.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>زيادة أبعاد الحمولة المنقولة لمركبات النقل الخفيف على الحد المسموح به.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة المركبة برخصة قيادة لا تتناسب مع حجم المركبة ونوع استخدامها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>القيام بأعمال الطرق قبل التنسيق مع الإدارة المختصة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 5000 - 10000 ريال</p>'), Document(metadata={}, page_content='<h1>المراوغة بسرعة بين المركبات على الطرق العامة.</h1>\n<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم وجود إنارة جانبية أو عواكس أو سواتر للشاحنات والمقطورات.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة المركبة قبل الحصول على رخصة قيادة أو في حال سحب الرخصة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة المركبة داخل الأنفاق من غير إضاءة أنوارها.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إعطاء أفضلية المرور في ملتقيات الطرق أو تقاطعاتها لسائق المركبة المتقدم على غيره في حال عدم'), Document(metadata={}, page_content='على غيره في حال عدم وجود لوحات تنظم ذلك.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>قيام سائق مركبة الطوارئ باستعمال المنبهات الخاصة بها من غير ضرورة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم تثبيت اللوحة في مكانها المخصص.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>العبث بعلامات الطريق أو العاكسات أو الشاحنات المنظمة لحركة السير.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم استخدام إشارة الالتفاف عند التحول لليمين أو اليسار أو التجاوز أو تغيير المسار.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة المركبة بالاتجاه المعاكس لحركة السير.</h1>\n<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>سماح أصحاب الحيوانات بعبور حيواناتهم من غير الأماكن المخصصة لها، أو دون التنسيق مع الجهات'), Document(metadata={}, page_content='التنسيق مع الجهات المختصة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 5000 - 10000 ريال</p>'), Document(metadata={}, page_content='<h1>الرجوع إلى الخلف في الطريق العام لمسافة تزيد على عشرين متراً.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>تظليل زجاج المركبة دون التقيد بالضوابط التي تضعها الإدارة المختصة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم ترك السائق مسافة كافية بين مركبته والمركبة التي أمامه، تسمح له بتفادي وقوع حادث.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>عدم قيام السائق في حال تغيير اتجاهه بالدوران للخلف بإعطاء أفضلية المرور للمركبات القادمة من'), Document(metadata={}, page_content='للمركبات القادمة من الاتجاهات الأخرى.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>تسيير مركبات الأشغال العامة على الطرق قبل اتخاذ الإجراءات اللازمة لتلافي أضرارها، بما في ذلك عدم'), Document(metadata={}, page_content='بما في ذلك عدم وضع الشرائح العاكسة على جانبي مؤخرة المركبة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إنهاء إجراءات تعديل مجال استعمال المركبة.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>استخدام أجهزة غير مصرح بها في المركبة أو وضع شعارات أو ملصقات تتنافى مع الآداب العامة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم استخدام مقاعد الأمان المخصصة للأطفال.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إعطاء الأفضلية للمركبات التي بداخل الدوار من قبل المركبات التي خارجه في حالة عدم وجود إشارات'), Document(metadata={}, page_content='عدم وجود إشارات ضوئية أو رجل أمن يوجه السير.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>التجاوز في المناطق التي يمنع فيها التجاوز، مثل المنعطفات والمرتفعات.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>نقل عدد من الركاب يزيد على العدد المحدد في رخصة السير.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>استخدام لوحات غير عائدة للمركبة.</h1>\n<p>الغرامة المالية 5000 - 10000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إخراج المركبة المعدة للتصدير خلال المدة المحددة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>تسيير مركبة تحدث تلويثاً للبيئة على الطرق العامة.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>استعمال المكابح (الفرامل) بشكل مفاجئ لغير ضرورة.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>قيادة المركبة بلوحات غير واضحة أو بها تلف.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>القيادة على الطريق بمركبات مخصصة للاقتناء.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عبور المشاة للطرق السريعة.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>القيادة برخصة قيادة صلاحيتها منتهية.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>التجمهر في موقع الحادث.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>المجازفة بعبور الأودية والشعاب أثناء جريانها.</h1>\n<p>الغرامة المالية 5000 - 10000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم تقديم المركبة للفحص الفني الدوري.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>استخدام السائق بيده أي جهاز محمول أثناء سير المركبة.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم اتخاذ الاحتياطات اللازمة عند إيقاف المركبة في حالات الطوارئ على الطرق العامة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>عدم التقيد بتنظيمات السير عند تقاطعات الطرق.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>إجراء سباق للمركبات على الطرق العامة، أو السير في مواكب دون الحصول على تصريح.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم قيام السائق في حال إغلاق جزء من الطريق بإعطاء الأفضلية لمن كان طريقه مفتوحاً.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم الوقوف تماماً عند إشارة قف.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>عدم قيام أصحاب الحيوانات بإبعادها عن حرم الطريق المعتمد.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>وضع حواجز داخل المركبة أو خارجها تعوق رؤية السائق.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>سير المركبة بلا لوحة خلفية، أو بلا لوحات.</h1>\n<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عبور المشاة للطرق من غير الأماكن المخصصة لهم.</h1>\n<p>الغرامة المالية 100 - 150 ريال</p>'), Document(metadata={}, page_content='<h1>استخدام لوحات غير صادرة من الإدارة المختصة.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم التزام الشاحنات والمعدات الثقيلة بالسير في المسار الآمن في الطريق المتعدد المسارات.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>إحداث ضوضاء باستعمال أجهزة من داخل المركبة، أو ارتكاب أي سلوك يتنافى مع الآداب العامة أثناء'), Document(metadata={}, page_content='الآداب العامة أثناء القيادة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>إجراء أي تعديل أو إضافة على جسم المركبة أو هيكلها، يغير معالمها أو تجهيزاتها الأساسية دون اتخاذ'), Document(metadata={}, page_content='الأساسية دون اتخاذ الإجراءات النظامية.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم حمل رخصة القيادة أو رخصة السير أثناء القيادة.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>عدم تغطية الحمولة المنقولة وتثبيتها.</h1>\n<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>مخالفة تنظيمات السير على الطرق.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>عدم وجود تأمين ساري للمركبة.</h1>\n<p>الغرامة المالية 100 - 150 ريال</p>'), Document(metadata={}, page_content='<h1>عدم توافر المتطلبات النظامية للمقطورة.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إعطاء الأفضلية للمركبة القادمة من اليمين عند الوصول إلى تقاطع متساوي الأفضلية في آن واحد'), Document(metadata={}, page_content='الأفضلية في آن واحد وعندما لا يكون هناك إشارات أولوية.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>ترك أجسام على الطرق العامة تعرض السلامة العامة للخطر.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>سير المركبة بلا لوحة أمامية.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>إساءة استعمال منبه المركبة.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>ترك الأطفال دون سن العاشرة في المركبة دون مرافق راشد.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>الوقوف على خطوط السكة الحديدية.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>ترك المركبة في طريق منحدرة مع عدم اتخاذ الاحتياطات اللازمة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>رمي أجسام خارج المركبة.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>عدم تقيد المشاة بالإشارات الخاصة بهم.</h1>\n<p>الغرامة المالية 100 - 150 ريال</p>'), Document(metadata={}, page_content='<h1>عدم ارتداء الخوذة أثناء قيادة الدراجة الآلية.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>وقوف المركبة في أماكن غير مخصصة للوقوف.</h1>\n<p>الغرامة المالية 100 - 150 ريال</p>'), Document(metadata={}, page_content='<h1>ملاحقة مركبات الطوارئ أثناء استعمال المنبهات الخاصة بها.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>وضع كتابة أو رسم أو ملصق أو أي بيان آخر على جسم المركبة دون موافقة الجهات المختصة.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>التباطؤ في السير على نحو يعرقل الحركة.</h1>\n<p>الغرامة المالية 300 - 500 ريال</p>'), Document(metadata={}, page_content='<h1>عدم إعطاء أفضلية المرور للمركبات القادمة من طريق رئيسي في حالة تقاطعها مع طريق فرعي أو طريق'), Document(metadata={}, page_content='طريق فرعي أو طريق ترابي.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 500 - 900 ريال</p>'), Document(metadata={}, page_content='<h1>النزول أو الركوب أثناء سير المركبات.</h1>\n<p>الغرامة المالية 1000 - 2000 ريال</p>'), Document(metadata={}, page_content='<h1>مخالفة قواعد استعمال أنوار التلاقي.</h1>\n<p>الغرامة المالية 150 - 300 ريال</p>'), Document(metadata={}, page_content='<h1>تجاوز حافلات النقل المدرسي عند توقفها للتحميل أو التنزيل.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>'), Document(metadata={}, page_content='<h1>عدم الوقوف عند مراكز الضبط الأمني أو نقاط التفتيش أو عدم الوقوف للدورية الأمنية عند وجود توجيه'), Document(metadata={}, page_content='عند وجود توجيه أو علامة توجب الوقوف.</h1>'), Document(metadata={}, page_content='<p>الغرامة المالية 3000 - 6000 ريال</p>')]

# Step 6: Define the RAG Prompt Template

Define a custom prompt template in Arabic to retrieve traffic violation-related answers based on the context. Ensure the template encourages the model to give **advice** in **Arabic**, staying within the context provided.

In [None]:
PROMPT_TEMPLATE="""
Answer the question based only on the following context:
Context: {context_text}
Question: {query}
Your answer:
"""

prompt_template = PromptTemplate(
    template=PROMPT_TEMPLATE, input_variables=["context", "question"]
)

## Step 7: Initialize the Language Model

Initialize the language model using the Groq API. Set up the model with a specific configuration, including the API key, temperature setting, and model name.

In [None]:
!pip install langchain_groq

In [None]:
groq_api_key = "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"

In [159]:
from langchain_groq import ChatGroq

llm = ChatGroq(
    model="llama3-8b-8192",
    temperature=0.8,
    max_retries=2,
    api_key=groq_api_key
)

## Step 8: Create the LLM Chain

Now, you will create an LLM Chain that combines the language model and the prompt template you defined. This chain will be used to generate responses based on the retrieved context.

In [None]:
from langchain.chains import LLMChain
MODEL = LLMChain(llm=llm,
                 prompt=prompt_template,
                 verbose=True)

## Step 9: Implement the Query Function

Create a function `query_rag` that will take a user query as input, retrieve relevant context from the vector store, and use the language model to generate a response based on that context.

In [None]:
def query_rag(query: str):
    similarity_search_results = db.similarity_search_with_score(query, k=4)
    context_text = "\n\n".join([text.page_content for text, _score in similarity_search_results])

    rag_response = MODEL.invoke({"context": context_text, "question": query})

    return rag_response

In [None]:
response = query_rag("ماهي الغرامة على القيادة بدون رخصة؟")
response

## Step 10: Inference - Running Queries in the RAG System

In this final step, you will implement an inference pipeline to handle real-time queries. You will allow the system to retrieve the most relevant violations and fines based on a user's input and generate a response.

1. Inference Workflow:

  * The user inputs a query (e.g., "ماهي الغرامة على القيادة بدون رخصة؟").
  * The system searches for the most relevant context from the traffic violation vector store.
  * It generates an answer and advice based on the context.

2. Goal:
  * Run the inference to answer questions based on the traffic violation dataset.