<center>
<p style="text-align:center"><img alt="Ragas" src="https://github.com/explodinggradients/ragas/blob/main/docs/_static/imgs/logo.png?raw=true" width="400"><br><a href="https://arize.com/docs/phoenix/">Phoenix Docs</a> | <a href="https://github.com/explodinggradients/ragas">Ragas</a> | <a href="https://arize-ai.slack.com/join/shared_invite/zt-2w57bhem8-hq24MB6u7yE_ZF_ilOYSBw#/shared-invite/email">Community</a>
</p>
    </center>

## 1. Introduction

Building a baseline for a RAG pipeline is not usually difficult, but enhancing it to make it suitable for real-world Arabic question-answering tasks requires careful evaluation, observability, and iterative refinement. Choosing the right tools, retrieval strategies, and LLM configurations can be challenging, especially when working with large and diverse datasets.

This notebook demonstrates how to **evaluate, visualize, and analyze an Arabic RAG pipeline** using a combination of powerful open-source libraries:

- **[Ragas](https://docs.ragas.io/en/stable/)** for evaluation metrics such as faithfulness, answer correctness, context precision, and context recall  
- **Arize AI’s [Phoenix](https://arize.com/docs/phoenix)** for tracing, debugging, embedding visualization, and cluster analysis  
- **[LlamaIndex](https://docs.llamaindex.ai/en/stable/)** for building RAG pipelines, managing document indexes, and connecting retrieval to LLMs  

In this tutorial, instead of using arXiv PDFs, we will work with the **ArabicaQA dataset**, a large-scale Arabic machine-reading comprehension (MRC) dataset containing questions, contexts, and ground-truth answers. This allows us to build and evaluate an **Arabic-focused RAG system** in a realistic setting.

> ℹ️ **Note:**  
> This notebook uses **open-source HuggingFace LLMs** (such as LLaMA or Gemma) and **does not require an OpenAI API key**.


## 2. Install Dependencies and Import Libraries

Install and import Python dependencies.

In [1]:
%pip install -U "ragas==0.1.4" pypdf "arize-phoenix[llama-index,embeddings]" "openai>=1.0.0" pandas "httpx<0.28" "openinference-instrumentation>=0.1.38"


Collecting ragas==0.1.4
  Using cached ragas-0.1.4-py3-none-any.whl.metadata (5.2 kB)
Collecting pypdf
  Using cached pypdf-6.3.0-py3-none-any.whl.metadata (7.1 kB)
Collecting openai>=1.0.0
  Using cached openai-2.8.1-py3-none-any.whl.metadata (29 kB)
Collecting pandas
  Downloading pandas-2.3.3-cp310-cp310-win_amd64.whl.metadata (19 kB)
Collecting httpx<0.28
  Using cached httpx-0.27.2-py3-none-any.whl.metadata (7.1 kB)
Collecting openinference-instrumentation>=0.1.38
  Using cached openinference_instrumentation-0.1.42-py3-none-any.whl.metadata (5.0 kB)
Collecting arize-phoenix[embeddings,llama-index]
  Using cached arize_phoenix-12.16.0-py3-none-any.whl.metadata (35 kB)
Collecting numpy (from ragas==0.1.4)
  Downloading numpy-2.2.6-cp310-cp310-win_amd64.whl.metadata (60 kB)
Collecting datasets (from ragas==0.1.4)
  Using cached datasets-4.4.1-py3-none-any.whl.metadata (19 kB)
Collecting tiktoken (from ragas==0.1.4)
  Downloading tiktoken-0.12.0-cp310-cp310-win_amd64.whl.metadata (6.9



In [6]:
!pip install "llama-index>=0.11.0" "llama-index-llms-huggingface"

Collecting llama-index>=0.11.0
  Downloading llama_index-0.14.8-py3-none-any.whl.metadata (13 kB)
Collecting llama-index-llms-huggingface
  Downloading llama_index_llms_huggingface-0.6.1-py3-none-any.whl.metadata (2.5 kB)
Collecting llama-index-cli<0.6,>=0.5.0 (from llama-index>=0.11.0)
  Downloading llama_index_cli-0.5.3-py3-none-any.whl.metadata (1.4 kB)
Collecting llama-index-core<0.15.0,>=0.14.8 (from llama-index>=0.11.0)
  Downloading llama_index_core-0.14.8-py3-none-any.whl.metadata (2.5 kB)
Collecting llama-index-embeddings-openai<0.6,>=0.5.0 (from llama-index>=0.11.0)
  Downloading llama_index_embeddings_openai-0.5.1-py3-none-any.whl.metadata (400 bytes)
Collecting llama-index-indices-managed-llama-cloud>=0.4.0 (from llama-index>=0.11.0)
  Downloading llama_index_indices_managed_llama_cloud-0.9.4-py3-none-any.whl.metadata (3.7 kB)
Collecting llama-index-llms-openai<0.7,>=0.6.0 (from llama-index>=0.11.0)
  Downloading llama_index_llms_openai-0.6.9-py3-none-any.whl.metadata (3.0 

In [1]:
import torch
print("CUDA:", torch.cuda.is_available())
print("Torch CUDA build:", torch.version.cuda)
print("GPU:", torch.cuda.get_device_name(0) if torch.cuda.is_available() else "No GPU")


CUDA: True
Torch CUDA build: 12.1
GPU: NVIDIA GeForce GTX 1660 Ti


In [2]:
import pandas as pd

# Display the complete contents of dataframe cells.
pd.set_option("display.max_colwidth", None)

In [3]:
from llama_index.core.settings import Settings
from llama_index.llms.huggingface import HuggingFaceLLM

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# Reset any previous LLM in LlamaIndex
Settings.llm = None  

model_name = "meta-llama/Llama-3.2-1B-Instruct"

device = "cuda" if torch.cuda.is_available() else "cpu"
dtype = torch.float16 if device == "cuda" else torch.float32

print("Using device:", device)

# --- Tokenizer ---
tokenizer = AutoTokenizer.from_pretrained(model_name)
if tokenizer.pad_token is None:
    tokenizer.pad_token = tokenizer.eos_token
    tokenizer.pad_token_id = tokenizer.eos_token_id

# --- Model ---
if device == "cuda":
    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        torch_dtype=dtype,
        device_map="auto",
    )
else:
    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        torch_dtype=dtype,
    )

print("First model parameter device:", next(model.parameters()).device)

# --- Wrap in LlamaIndex LLM ---
llm = HuggingFaceLLM(
    model=model,
    tokenizer=tokenizer,
    model_name=model_name,
    tokenizer_name=model_name,
    context_window=4096,
    max_new_tokens=256,
    generate_kwargs={
        "do_sample": False,   # greedy, deterministic (good for evaluation)
    },
)

from ragas.llms import LlamaIndexLLMWrapper
evaluator_llm = LlamaIndexLLMWrapper(llm)   # deprecation warning is OK for now

# Register with LlamaIndex (if you use it elsewhere)
Settings.llm = llm


  from .autonotebook import tqdm as notebook_tqdm


LLM is explicitly disabled. Using MockLLM.
Using device: cuda


OSError: You are trying to access a gated repo.
Make sure to have access to it at https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct.
403 Client Error. (Request ID: Root=1-693b3b40-05fbd94931edb91a484df44e;eaa73c62-bfbf-4db1-8f8e-07e761085e65)

Cannot access gated repo for url https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct/resolve/main/config.json.
Access to model meta-llama/Llama-3.2-1B-Instruct is restricted and you are not in the authorized list. Visit https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct to ask for access.

In [None]:
import phoenix as px

(session := px.launch_app()).view()

In [11]:
!pip install openinference-instrumentation-langchain openinference-instrumentation-llama-index

Collecting openinference-instrumentation-langchain
  Downloading openinference_instrumentation_langchain-0.1.55-py3-none-any.whl.metadata (5.2 kB)
Collecting openinference-instrumentation-llama-index
  Downloading openinference_instrumentation_llama_index-4.3.9-py3-none-any.whl.metadata (5.2 kB)
Collecting opentelemetry-instrumentation (from openinference-instrumentation-langchain)
  Downloading opentelemetry_instrumentation-0.59b0-py3-none-any.whl.metadata (7.1 kB)
Downloading openinference_instrumentation_langchain-0.1.55-py3-none-any.whl (22 kB)
Downloading openinference_instrumentation_llama_index-4.3.9-py3-none-any.whl (29 kB)
Downloading opentelemetry_instrumentation-0.59b0-py3-none-any.whl (33 kB)
Installing collected packages: opentelemetry-instrumentation, openinference-instrumentation-llama-index, openinference-instrumentation-langchain

   --------- ------------------ 1/3 [openinference-instrumentation-llama-index]
   ------------------------------ 3/3 [openinference-instrum

In [33]:
from phoenix.otel import register
from openinference.instrumentation.langchain import LangChainInstrumentor

tracer_provider = register()
LangChainInstrumentor().instrument(tracer_provider=tracer_provider)

print("✅ LangChain tracing enabled!")
print("⚠️  LlamaIndex tracing skipped due to version compatibility")

Overriding of current TracerProvider is not allowed
Attempting to instrument while already instrumented


OpenTelemetry Tracing Details
|  Phoenix Project: default
|  Span Processor: SimpleSpanProcessor
|  Collector Endpoint: localhost:4317
|  Transport: gRPC
|  Transport Headers: {}
|  
|  Using a default SpanProcessor. `add_span_processor` will overwrite this default.
|  
|  
|  `register` has set this TracerProvider as the global OpenTelemetry default.
|  To disable this behavior, call `register` with `set_global_tracer_provider=False`.

✅ LangChain tracing enabled!
⚠️  LlamaIndex tracing skipped due to version compatibility


## 4. Load our dataset (ArabicaQA)

In [34]:
from datasets import load_dataset

# Load the MRC split of ArabicaQA from Hugging Face
arabica_mrc = load_dataset(
    "abdoelsayed/ArabicaQA",
    data_files={
        #"train": "MRC/train.json",
        #"validation": "MRC/val.json",
        "test": "MRC/test.json",
    },
    field="data",  # the JSON has a top-level field called "data"
)

arabica_mrc


DatasetDict({
    test: Dataset({
        features: ['paragraphs'],
        num_rows: 2108
    })
})

In ArabicaQA (MRC task):
The MRC test set contains:
- question
-  context (the correct paragraph from Wikipedia)
-  answers (ground truth answer spans)

We will use:
- context → to build your vector index (RAG knowledge base)
- question → to query your RAG
- answers → ground truth for RAGAS evaluation

In [35]:
test_ds = arabica_mrc["test"]
test_ds[0]


{'paragraphs': [{'context': 'المرصد الحضري لمدينة الرياض ويعرف اختصارًا بمرصد الرياض هو مركز متخصص في وضع نظم مراقبة حضرية لرصد سير عمليات التنمية الحضرية للمدينة، ويهدف إلى فهم الوضع الحالي للمدينة ووضع تصور للاتجاهات المستقبلية، ومراقبة الإنجاز لتحقيق الأهداف واتخاذ القرارات. التأسيس. بدأت أول خطوات إنشاء المرصد في عام 2009م، من الهيئة العليا لتطوير مدينة الرياض؛ ومن ثم أُقرَّ الهيكل التنظيمي للمرصد الحضري الذي يتكون من مجلس ولجنة تنفيذية ومركز. ويترأس مجلس المرصد أمير المنطقة بالإضافة إلى أربعة عشر عضوا، وتتكون اللَّجنة التنفيذية من 15 عضوًا يمثلون أهم مصادر البيانات ذات الصلة بالمؤشرات الحضرية من القطاع الحكومي والقطاع الخاص. المهام. في عام 1434هـ أطلق المرصد الحضري لمدينة الرياض، المؤشرات الحضرية للدورة الأولى التي ضمت (80) مؤشراً، بعد إقرار نتائج تلك المؤشرات في اجتماع الهيئة الثاني لعام 1435هـ، وشملت الحدّ الأدنى من المؤشرات الحضرية العالمية بالإضافة إلى المؤشرات المحلية. يعمل المرصد الحضري لمدينة الرياض على رصد وتقييم اتجاهات التنمية في مدينة الرياض من خلال إنتاج المؤشرات الحضر

## Convert the test set into a clean RAG-ready DataFrame
For RAG, we need:
- knowledge documents → contexts
- evaluation questions → questions
- ground truth → answers

ArabicaQA test samples have 1 context + multiple Q/A pairs, so we must flatten them.

In [36]:
import pandas as pd

def flatten_arabica_mrc(dataset):
    rows = []

    for item in dataset:
        for para in item["paragraphs"]:
            context = para["context"]
            for qa in para["qas"]:
                question = qa["question"]
                answers = qa["answers"]
                # Most have exactly 1 answer
                gt_answer = answers[0]["text"] if len(answers) > 0 else ""

                rows.append({
                    "context": context,
                    "question": question,
                    "ground_truth": gt_answer
                })
    return pd.DataFrame(rows)


df_test = flatten_arabica_mrc(test_ds)
df_test.head()


Unnamed: 0,context,question,ground_truth
0,المرصد الحضري لمدينة الرياض ويعرف اختصارًا بمرصد الرياض هو مركز متخصص في وضع نظم مراقبة حضرية لرصد سير عمليات التنمية الحضرية للمدينة، ويهدف إلى فهم الوضع الحالي للمدينة ووضع تصور للاتجاهات المستقبلية، ومراقبة الإنجاز لتحقيق الأهداف واتخاذ القرارات. التأسيس. بدأت أول خطوات إنشاء المرصد في عام 2009م، من الهيئة العليا لتطوير مدينة الرياض؛ ومن ثم أُقرَّ الهيكل التنظيمي للمرصد الحضري الذي يتكون من مجلس ولجنة تنفيذية ومركز. ويترأس مجلس المرصد أمير المنطقة بالإضافة إلى أربعة عشر عضوا، وتتكون اللَّجنة التنفيذية من 15 عضوًا يمثلون أهم مصادر البيانات ذات الصلة بالمؤشرات الحضرية من القطاع الحكومي والقطاع الخاص. المهام. في عام 1434هـ أطلق المرصد الحضري لمدينة الرياض، المؤشرات الحضرية للدورة الأولى التي ضمت (80) مؤشراً، بعد إقرار نتائج تلك المؤشرات في اجتماع الهيئة الثاني لعام 1435هـ، وشملت الحدّ الأدنى من المؤشرات الحضرية العالمية بالإضافة إلى المؤشرات المحلية. يعمل المرصد الحضري لمدينة الرياض على رصد وتقييم اتجاهات التنمية في مدينة الرياض من خلال إنتاج المؤشرات الحضرية التي تقدم معلومات موجزة عن الوضع الراهن والاتجاهات المستقبلية المتوقعة وتقيس مستوى الاستجابة للسياسات والبرامج التنفيذية حسب الأهداف لخطط التنمية المستدامة، ويتم ذلك ضمن إطار رصد عالمي يوفر خطة شاملة للرصد والتقييم ويسهل من عملية تحديد المؤشرات الأساسية ضمن مجموعات معيارية تُمكِّن من مقارنة التقدم مع المدن الأخرى ومؤشرات أخرى تعكس خصوصية مدينة الرياض من خلال تحديد الأولويات والقضايا الهامة في المدينة حسب أهداف المخطط الاستراتيجي الشامل لمدينة الرياض، ورؤية المملكة 2030، بالإضافة إلى أولويات الجهات المشاركة بالمرصد التي تشمل القطاع الحكومي والقطاع الخاص والمجتمع المدني. الإنجازات. في مارس 2017 حصل المرصد الحضري بمدينة الرياض على الشهادة الذهبية WCCD ISO 37120 من المجلس العالمي لبيانات المدن في كندا (WCCD).,من الذي يترأس المرصد الحضري لمدينة الرياض؟,يترأس مجلس المرصد أمير المنطقة بالإضافة إلى أربعة عشر عضوا،
1,المرصد الحضري لمدينة الرياض ويعرف اختصارًا بمرصد الرياض هو مركز متخصص في وضع نظم مراقبة حضرية لرصد سير عمليات التنمية الحضرية للمدينة، ويهدف إلى فهم الوضع الحالي للمدينة ووضع تصور للاتجاهات المستقبلية، ومراقبة الإنجاز لتحقيق الأهداف واتخاذ القرارات. التأسيس. بدأت أول خطوات إنشاء المرصد في عام 2009م، من الهيئة العليا لتطوير مدينة الرياض؛ ومن ثم أُقرَّ الهيكل التنظيمي للمرصد الحضري الذي يتكون من مجلس ولجنة تنفيذية ومركز. ويترأس مجلس المرصد أمير المنطقة بالإضافة إلى أربعة عشر عضوا، وتتكون اللَّجنة التنفيذية من 15 عضوًا يمثلون أهم مصادر البيانات ذات الصلة بالمؤشرات الحضرية من القطاع الحكومي والقطاع الخاص. المهام. في عام 1434هـ أطلق المرصد الحضري لمدينة الرياض، المؤشرات الحضرية للدورة الأولى التي ضمت (80) مؤشراً، بعد إقرار نتائج تلك المؤشرات في اجتماع الهيئة الثاني لعام 1435هـ، وشملت الحدّ الأدنى من المؤشرات الحضرية العالمية بالإضافة إلى المؤشرات المحلية. يعمل المرصد الحضري لمدينة الرياض على رصد وتقييم اتجاهات التنمية في مدينة الرياض من خلال إنتاج المؤشرات الحضرية التي تقدم معلومات موجزة عن الوضع الراهن والاتجاهات المستقبلية المتوقعة وتقيس مستوى الاستجابة للسياسات والبرامج التنفيذية حسب الأهداف لخطط التنمية المستدامة، ويتم ذلك ضمن إطار رصد عالمي يوفر خطة شاملة للرصد والتقييم ويسهل من عملية تحديد المؤشرات الأساسية ضمن مجموعات معيارية تُمكِّن من مقارنة التقدم مع المدن الأخرى ومؤشرات أخرى تعكس خصوصية مدينة الرياض من خلال تحديد الأولويات والقضايا الهامة في المدينة حسب أهداف المخطط الاستراتيجي الشامل لمدينة الرياض، ورؤية المملكة 2030، بالإضافة إلى أولويات الجهات المشاركة بالمرصد التي تشمل القطاع الحكومي والقطاع الخاص والمجتمع المدني. الإنجازات. في مارس 2017 حصل المرصد الحضري بمدينة الرياض على الشهادة الذهبية WCCD ISO 37120 من المجلس العالمي لبيانات المدن في كندا (WCCD).,ما هي الإنجازات البارزة التي حققها المرصد الحضري بمدينة الرياض؟,في مارس 2017 حصل المرصد الحضري بمدينة الرياض على الشهادة الذهبية WCCD ISO 37120 من المجلس العالمي لبيانات المدن في كندا (WCCD)
2,المرصد الحضري لمدينة الرياض ويعرف اختصارًا بمرصد الرياض هو مركز متخصص في وضع نظم مراقبة حضرية لرصد سير عمليات التنمية الحضرية للمدينة، ويهدف إلى فهم الوضع الحالي للمدينة ووضع تصور للاتجاهات المستقبلية، ومراقبة الإنجاز لتحقيق الأهداف واتخاذ القرارات. التأسيس. بدأت أول خطوات إنشاء المرصد في عام 2009م، من الهيئة العليا لتطوير مدينة الرياض؛ ومن ثم أُقرَّ الهيكل التنظيمي للمرصد الحضري الذي يتكون من مجلس ولجنة تنفيذية ومركز. ويترأس مجلس المرصد أمير المنطقة بالإضافة إلى أربعة عشر عضوا، وتتكون اللَّجنة التنفيذية من 15 عضوًا يمثلون أهم مصادر البيانات ذات الصلة بالمؤشرات الحضرية من القطاع الحكومي والقطاع الخاص. المهام. في عام 1434هـ أطلق المرصد الحضري لمدينة الرياض، المؤشرات الحضرية للدورة الأولى التي ضمت (80) مؤشراً، بعد إقرار نتائج تلك المؤشرات في اجتماع الهيئة الثاني لعام 1435هـ، وشملت الحدّ الأدنى من المؤشرات الحضرية العالمية بالإضافة إلى المؤشرات المحلية. يعمل المرصد الحضري لمدينة الرياض على رصد وتقييم اتجاهات التنمية في مدينة الرياض من خلال إنتاج المؤشرات الحضرية التي تقدم معلومات موجزة عن الوضع الراهن والاتجاهات المستقبلية المتوقعة وتقيس مستوى الاستجابة للسياسات والبرامج التنفيذية حسب الأهداف لخطط التنمية المستدامة، ويتم ذلك ضمن إطار رصد عالمي يوفر خطة شاملة للرصد والتقييم ويسهل من عملية تحديد المؤشرات الأساسية ضمن مجموعات معيارية تُمكِّن من مقارنة التقدم مع المدن الأخرى ومؤشرات أخرى تعكس خصوصية مدينة الرياض من خلال تحديد الأولويات والقضايا الهامة في المدينة حسب أهداف المخطط الاستراتيجي الشامل لمدينة الرياض، ورؤية المملكة 2030، بالإضافة إلى أولويات الجهات المشاركة بالمرصد التي تشمل القطاع الحكومي والقطاع الخاص والمجتمع المدني. الإنجازات. في مارس 2017 حصل المرصد الحضري بمدينة الرياض على الشهادة الذهبية WCCD ISO 37120 من المجلس العالمي لبيانات المدن في كندا (WCCD).,ما هو المرصد الحضري لمدينة الرياض؟,هو مركز متخصص في وضع نظم مراقبة حضرية لرصد سير عمليات التنمية الحضرية للمدينة،
3,المرصد الحضري لمدينة الرياض ويعرف اختصارًا بمرصد الرياض هو مركز متخصص في وضع نظم مراقبة حضرية لرصد سير عمليات التنمية الحضرية للمدينة، ويهدف إلى فهم الوضع الحالي للمدينة ووضع تصور للاتجاهات المستقبلية، ومراقبة الإنجاز لتحقيق الأهداف واتخاذ القرارات. التأسيس. بدأت أول خطوات إنشاء المرصد في عام 2009م، من الهيئة العليا لتطوير مدينة الرياض؛ ومن ثم أُقرَّ الهيكل التنظيمي للمرصد الحضري الذي يتكون من مجلس ولجنة تنفيذية ومركز. ويترأس مجلس المرصد أمير المنطقة بالإضافة إلى أربعة عشر عضوا، وتتكون اللَّجنة التنفيذية من 15 عضوًا يمثلون أهم مصادر البيانات ذات الصلة بالمؤشرات الحضرية من القطاع الحكومي والقطاع الخاص. المهام. في عام 1434هـ أطلق المرصد الحضري لمدينة الرياض، المؤشرات الحضرية للدورة الأولى التي ضمت (80) مؤشراً، بعد إقرار نتائج تلك المؤشرات في اجتماع الهيئة الثاني لعام 1435هـ، وشملت الحدّ الأدنى من المؤشرات الحضرية العالمية بالإضافة إلى المؤشرات المحلية. يعمل المرصد الحضري لمدينة الرياض على رصد وتقييم اتجاهات التنمية في مدينة الرياض من خلال إنتاج المؤشرات الحضرية التي تقدم معلومات موجزة عن الوضع الراهن والاتجاهات المستقبلية المتوقعة وتقيس مستوى الاستجابة للسياسات والبرامج التنفيذية حسب الأهداف لخطط التنمية المستدامة، ويتم ذلك ضمن إطار رصد عالمي يوفر خطة شاملة للرصد والتقييم ويسهل من عملية تحديد المؤشرات الأساسية ضمن مجموعات معيارية تُمكِّن من مقارنة التقدم مع المدن الأخرى ومؤشرات أخرى تعكس خصوصية مدينة الرياض من خلال تحديد الأولويات والقضايا الهامة في المدينة حسب أهداف المخطط الاستراتيجي الشامل لمدينة الرياض، ورؤية المملكة 2030، بالإضافة إلى أولويات الجهات المشاركة بالمرصد التي تشمل القطاع الحكومي والقطاع الخاص والمجتمع المدني. الإنجازات. في مارس 2017 حصل المرصد الحضري بمدينة الرياض على الشهادة الذهبية WCCD ISO 37120 من المجلس العالمي لبيانات المدن في كندا (WCCD).,ما هو الهدف من المرصد الحضري لمدينة الرياض؟,يهدف إلى فهم الوضع الحالي للمدينة ووضع تصور للاتجاهات المستقبلية،
4,المرصد الحضري لمدينة الرياض ويعرف اختصارًا بمرصد الرياض هو مركز متخصص في وضع نظم مراقبة حضرية لرصد سير عمليات التنمية الحضرية للمدينة، ويهدف إلى فهم الوضع الحالي للمدينة ووضع تصور للاتجاهات المستقبلية، ومراقبة الإنجاز لتحقيق الأهداف واتخاذ القرارات. التأسيس. بدأت أول خطوات إنشاء المرصد في عام 2009م، من الهيئة العليا لتطوير مدينة الرياض؛ ومن ثم أُقرَّ الهيكل التنظيمي للمرصد الحضري الذي يتكون من مجلس ولجنة تنفيذية ومركز. ويترأس مجلس المرصد أمير المنطقة بالإضافة إلى أربعة عشر عضوا، وتتكون اللَّجنة التنفيذية من 15 عضوًا يمثلون أهم مصادر البيانات ذات الصلة بالمؤشرات الحضرية من القطاع الحكومي والقطاع الخاص. المهام. في عام 1434هـ أطلق المرصد الحضري لمدينة الرياض، المؤشرات الحضرية للدورة الأولى التي ضمت (80) مؤشراً، بعد إقرار نتائج تلك المؤشرات في اجتماع الهيئة الثاني لعام 1435هـ، وشملت الحدّ الأدنى من المؤشرات الحضرية العالمية بالإضافة إلى المؤشرات المحلية. يعمل المرصد الحضري لمدينة الرياض على رصد وتقييم اتجاهات التنمية في مدينة الرياض من خلال إنتاج المؤشرات الحضرية التي تقدم معلومات موجزة عن الوضع الراهن والاتجاهات المستقبلية المتوقعة وتقيس مستوى الاستجابة للسياسات والبرامج التنفيذية حسب الأهداف لخطط التنمية المستدامة، ويتم ذلك ضمن إطار رصد عالمي يوفر خطة شاملة للرصد والتقييم ويسهل من عملية تحديد المؤشرات الأساسية ضمن مجموعات معيارية تُمكِّن من مقارنة التقدم مع المدن الأخرى ومؤشرات أخرى تعكس خصوصية مدينة الرياض من خلال تحديد الأولويات والقضايا الهامة في المدينة حسب أهداف المخطط الاستراتيجي الشامل لمدينة الرياض، ورؤية المملكة 2030، بالإضافة إلى أولويات الجهات المشاركة بالمرصد التي تشمل القطاع الحكومي والقطاع الخاص والمجتمع المدني. الإنجازات. في مارس 2017 حصل المرصد الحضري بمدينة الرياض على الشهادة الذهبية WCCD ISO 37120 من المجلس العالمي لبيانات المدن في كندا (WCCD).,ما هي مهام المرصد الحضري لمدينة الرياض؟,ومراقبة الإنجاز لتحقيق الأهداف واتخاذ القرارات.


In [37]:
df_test.shape

(13970, 3)

In [38]:
import pandas as pd

# Shuffle the dataset safely
df_shuffled = df_test.sample(frac=1, random_state=42)

# Take a representative sample
df_sample = df_shuffled.head(1000)

df_sample.shape


(1000, 3)

## Deduplicate contexts → build RAG documents

In [39]:
# Make a list of unique contexts (documents)
unique_contexts = df_sample["context"].drop_duplicates().tolist()

len(unique_contexts)


758

In [40]:
print(unique_contexts[0])
print("---------------------------------------")
print(unique_contexts[1])
print("---------------------------------------")
print(unique_contexts[2])


السيخية (بالبنجابيَّة: ਸਿੱਖੀ) هي ديانة توحيدية دارميَّة نشأت في شمالي الهند في نهاية القرن الخامس عشر. وتأتي كلمة «سيخية» من كلمة «سيخ» وهي بدورها تأتي من الجذر السنسكريتي التي تعني التلميذ و في اللغة البالية المريد أو التابع. وهي واحدة من أحدث الأديان الرئيسية في العالم، وهي واحدة من أكبر الديانات في العالم. وتتضمن المعتقدات الأساسية للسيخية، والتي وضِحَت في كتابهم المقدس جورو جرانث صاحب، الإيمان والتأمل في اسم الخالق الواحد، والوحدة الإلهية والمساواة للبشرية جمعاء، والانخراط في خدمة نكران الذات، والسعي لتحقيق العدالة لمصلحة الجميع وازدهارها، وإتباع سلوك معيشة صادق. وفي أوائل القرن الواحد والعشرين كان هناك حوالي 25 مليون سيخي في جميع أنحاء العالم، وتعيش الغالبية العظمى أو 76% (20 مليون) من السيخ في البنجاب، موطن السيخ في شمال غرب الهند، ويعيش حوالي مليوني في الدول الهندية المجاورة، والتي كانت جزءاً من ولاية البنجاب الهندية سابقاً. وسبب انتشارها في العالم هو اعتماد الإنجليز عليهم في بعض الحروب وهجرات السيخ خارج بلادهم، حيث بدأت الهجرة السيخية من الهند البريطانية خلال النصف الثاني من ال

## Build the Vector Index (Embedding + Index + QueryEngine)


In [15]:
import sys
print(sys.executable)

%pip show llama-index


C:\Users\AZhaa\anaconda3\envs\nlp_gpu\python.exe
Name: llama-index
Version: 0.14.8
Summary: Interface between LLMs and your data
Home-page: https://llamaindex.ai
Author: 
Author-email: Jerry Liu <jerry@llamaindex.ai>
License-Expression: MIT
Location: c:\users\azhaa\anaconda3\envs\nlp_gpu\lib\site-packages
Requires: llama-index-cli, llama-index-core, llama-index-embeddings-openai, llama-index-indices-managed-llama-cloud, llama-index-llms-openai, llama-index-readers-file, llama-index-readers-llama-parse, nltk
Required-by: 
Note: you may need to restart the kernel to use updated packages.


In [16]:
!pip install "llama-index-embeddings-huggingface>=0.1.4"

Collecting llama-index-embeddings-huggingface>=0.1.4
  Downloading llama_index_embeddings_huggingface-0.6.1-py3-none-any.whl.metadata (458 bytes)
Collecting sentence-transformers>=2.6.1 (from llama-index-embeddings-huggingface>=0.1.4)
  Downloading sentence_transformers-5.1.2-py3-none-any.whl.metadata (16 kB)
Downloading llama_index_embeddings_huggingface-0.6.1-py3-none-any.whl (8.9 kB)
Downloading sentence_transformers-5.1.2-py3-none-any.whl (488 kB)
Installing collected packages: sentence-transformers, llama-index-embeddings-huggingface

   ---------------------------------------- 0/2 [sentence-transformers]
   ---------------------------------------- 0/2 [sentence-transformers]
   ---------------------------------------- 0/2 [sentence-transformers]
   ---------------------------------------- 0/2 [sentence-transformers]
   ---------------------------------------- 0/2 [sentence-transformers]
   ---------------------------------------- 0/2 [sentence-transformers]
   -------------------

In [41]:
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
import torch
from llama_index.core import Settings

embed_model = HuggingFaceEmbedding(
    model_name="sentence-transformers/all-MiniLM-L6-v2",
    device="cuda" if torch.cuda.is_available() else "cpu",
)

Settings.embed_model = embed_model

test_vec = embed_model.get_text_embedding("hello world")
print("Test embedding length:", len(test_vec))


Test embedding length: 384


## Create LlamaIndex Documents from ArabicaQA contexts

In [42]:
from llama_index.core import Document

documents = [Document(text=c) for c in unique_contexts]
len(documents)


758

## Build the RAG Vector Store using HuggingFace Embeddings

In [43]:
from llama_index.core import Settings, VectorStoreIndex
from llama_index.core import Document

def build_query_engine(documents):

    # reset old config
    Settings.llm = llm
    Settings.embed_model = embed_model
    Settings.callback_manager = None

    # create the index
    vector_index = VectorStoreIndex.from_documents(
        documents,
        embed_model=embed_model
    )

    # query engine
    query_engine = vector_index.as_query_engine(similarity_top_k=2)

    return query_engine

query_engine = build_query_engine(documents)



## Generate model answers for the test questions

In [44]:
model_answers = []

for q in df_sample["question"]:
    try:
        response = query_engine.query(q)
        model_answers.append(response.response)
    except Exception as e:
        print("Error:", e)
        model_answers.append("")

# Add model answers to dataframe
df_sample["model_answer"] = model_answers

df_sample.head()


KeyboardInterrupt: 

In [47]:
import pandas as pd

completed_n = len(model_answers)  # should be 328
df_sample = df_sample.reset_index(drop=True)

# Attach the answers ONLY to the first completed_n rows
df_sample.loc[:completed_n-1, "model_answer"] = model_answers

# Keep only rows that actually have a model answer (not NaN / empty)
df_done = df_sample.iloc[:completed_n].copy()
df_done = df_done[df_done["model_answer"] != ""]

print(df_done.shape)
df_done.head()


(328, 4)


Unnamed: 0,context,question,ground_truth,model_answer
0,السيخية (بالبنجابيَّة: ਸਿੱਖੀ) هي ديانة توحيدية دارميَّة نشأت في شمالي الهند في نهاية القرن الخامس عشر. وتأتي كلمة «سيخية» من كلمة «سيخ» وهي بدورها تأتي من الجذر السنسكريتي التي تعني التلميذ و في اللغة البالية المريد أو التابع. وهي واحدة من أحدث الأديان الرئيسية في العالم، وهي واحدة من أكبر الديانات في العالم. وتتضمن المعتقدات الأساسية للسيخية، والتي وضِحَت في كتابهم المقدس جورو جرانث صاحب، الإيمان والتأمل في اسم الخالق الواحد، والوحدة الإلهية والمساواة للبشرية جمعاء، والانخراط في خدمة نكران الذات، والسعي لتحقيق العدالة لمصلحة الجميع وازدهارها، وإتباع سلوك معيشة صادق. وفي أوائل القرن الواحد والعشرين كان هناك حوالي 25 مليون سيخي في جميع أنحاء العالم، وتعيش الغالبية العظمى أو 76% (20 مليون) من السيخ في البنجاب، موطن السيخ في شمال غرب الهند، ويعيش حوالي مليوني في الدول الهندية المجاورة، والتي كانت جزءاً من ولاية البنجاب الهندية سابقاً. وسبب انتشارها في العالم هو اعتماد الإنجليز عليهم في بعض الحروب وهجرات السيخ خارج بلادهم، حيث بدأت الهجرة السيخية من الهند البريطانية خلال النصف الثاني من القرن التاسع عشر، عندما أكمل البريطانيون ضمهم للبنجاب.\nتستند السيخية على التعاليم الروحية لمؤسس الديانة وهو الغورو ناناك، وخلفائه التسعة من الغورو البشر. لقب غورو يعني بالهندية المعلم. أما الغورو غورو جوبيند سينغ الملقب بالعاشر، ساهم في الكثير من أجل السيخية، وكان إسهامه في الإضفاء المستمر للطابع الرسمي على الديانة التي أسسها أولًا الغورو السيخ ناناك ديف جي في القرن الخامس عشر إسهامًا جديرًا بالملاحظة. وسمى الكتاب المقدس للسيخ جورو جرانث صاحب كخليفة له، وبالتالي أنهى خط الغورو البشر وجعل ن الكتاب المقدس للسيخ جورو جرانث صاحب الدليل الروحي الديني والدينوي للسيخ. وترفض الديانة السيخية الادعاءات بأن أي تقليد ديني معين له احتكار للحقيقة المطلقة. وتطورت السيخية في أوقات الاضطهاد الديني. حيث تعرض اثنان من أتباع السيخ وهم الغورو أرجان والغورو تيج بهادور للتعذيب وأعدم من قبل حكام المغول بعد رفضهم اعتناق الإسلام. وأثار اضطهاد السيخ تأسيس الخالسا كطلب لحماية حرية الضمير والدين.\nالتاريخ.\nيرتبط تاريخ السيخية ارتباطًا وثيقًا بتاريخ منطقة البنجاب والوضع الاجتماعي السياسي في شمال غرب شبه القارة الهندية في القرن السادس عشر. منذ الحكم المغولي للهند على يد الإمبراطور جهانكير (1605-1707)، كانت السيخية في صراع مع قوانين إمبراطورية المغول، لأنها كانت تؤثر في التعاقب السياسي للمغول في حين تعتز بالأولياء من الإسلام. قُتل العديد من السيخ البارزين على يد حكام المغول لرفضهم الانصياع لأوامرهم، ومعارضتهم لاضطهاد السيخ. من مجموع 10 من الغورو السيخ، عُذب وأُعدم اثنان من المعلمين أنفسهم (الغورو أرجان والغورو تيج بهادور)، وأقرباء مقربين للعديد من الغورو السيخ قُتلو بوحشية دون رحمة (مثل أبناء الغورو جوبيند سينغ البالغين من العمر 6 و9 سنوات)، إلى جانب العديد من الشخصيات الرئيسية الأخرى السيخية التي عُذبت وقُتلت (مثل باندا بهادور، بهاي ماتي داس، بهاي ساتي داس وباهاي ديالا)، على يد الحكام المغول المتجبرين لرفضهم الخضوع لأوامرهم، ومعارضتهم لاضطهاد السيخ والهندوس. بعد ذلك، عسكرت السيخية لمعارضة هيمنة المغول على أرضهم.\nتميّز ظهور الكونفدرالية السيخية تحت حكم الأمراء والسيخ تحت حكم المهراجا رانجيت سينغ بالتسامح الديني والتعايش السلمي والتعددية مع المسيحيين والمسلمين والهندوس في مواقع السلطة. يعد تأسيس إمبراطورية السيخ عادةً ذروة السيخية على المستوى السياسي، خلال هذه الفترة جاءت إمبراطورية السيخ لتشمل كشمير (أقصى شمال شبه القارة الهندية)، ولداخ (إقليم اتحادي تديره الهند)، وبيشاور (هي عاصمة مقاطعة خيبر بختونخوا الباكستانية وأكبر مدنها). اعتنق عدد من الفلاحين المسلمين والهندوس السيخية. أخذ هاري سينغ نالوا، القائد العام لجيش السيخ على طول الحدود الشمالية الغربية، حدود إمبراطورية السيخ إلى مصب ممر خيبر (هو ممر جبلي في شمال غرب باكستان، على الحدود مع أفغانستان). دمجت الإدارة العلمانية لإمبراطورية السيخ إصلاحات عسكرية واقتصادية وحكومية مبتكرة.\nشهدت الأشهر التي سبقت تقسيم الهند (تقسيم الهند البريطانية إلى دولتين مستقلتين، الهند وباكستان) سنة 1947، صراعًا حادًا في البنجاب (منطقة جيوسياسية وثقافية وتاريخية في جنوب آسيا، تحديدًا شمال شبه القارة الهندية، وتضم مناطق في شرق باكستان وشمال الهند) بين السيخ والمسلمين، شهد الهجرة الدينية الفعالة للسيخ البنجاب والهندوس من البنجاب الغربية مقابل هجرة دينية مماثلة للمسلمين البنجاب في شرق البنجاب. في الوقت الحاضر، يعيش غالبية السيخ في ولاية البنجاب في الهند.\nالخمسة كاكارس أو الكافات الخمسة.\nالخمسة كافات هم يصرون على الألتزام بها وعندهم من لا يلتزم بالكافات الخمس يصفوه بصفة باتت patitأي المرتد، ومن يدخل السيخية جديد يجعلوه يتعود عليها ويسموه المتكيف البطئ.\nالغورو السيخ.\nالغورو كلمة تعني المعلم وهم عشرة غورو للسيخية وهم:\n,\nما هي المناطق التي شملتها إمبراطورية السيخ؟,كشمير (أقصى شمال شبه القارة الهندية)، ولداخ (إقليم اتحادي تديره الهند)، وبيشاور (هي عاصمة مقاطعة خيبر بختونخوا الباكستانية وأكبر مدنها),"لا يوجد معلومات حول الإمبراطورية السيخية أو أي منطقة كانت تحتوي على إمبراطورية السيخ. يبدو أن هناك خطأ في السؤال. هل يمكنك تقديم المزيد من المعلومات أو التحقق من السؤال؟\n\nفيما يلي بعض المعلومات العامة عن الإمبراطورية السيخية:\n\n1. كانت الإمبراطورية السيخية تأسست في القرن الثالث عشر الميلادي.\n\n2. كانت تغطي معظم شمال أفريقيا وجنوب شرق آسيا.\n\n3. كانت تضم العديد من الدول والمناطق مثل مصر، سوريا، العراق، الهند، الصين، وباكستان.\n\n4. كانت تتميز بالثقافة الإسلامية واللغة العربية.\n\n5. كانت تواجه تحديات كبيرة بسبب الصراعات الداخلية والخارجية.\n\n6. انتهت الإمبراطورية في القرن السادس عشر الميلادي بعد هزيمتها في حرب النيل الكبرى.\n\nلذا، فإن الإجابة على السؤال ""ما هي المناطق التي شملتها الإمبراطورية السيخية؟"" قد تكون غير دقيقة أو غير دقيقة بشكل كبير، حيث أنها لم تشمل جميع المناطق كما ذكرت في السؤال. يجب التحقق من المعلومات المقدمة للحصول على الإ"
1,"صيفنا الحبيب (هانغل: 그 해 우리는)؛ هو مسلسل تلفزيوني رومانسي كوميدي كوري جنوبي، يصنف بأنه «أول مشروع أصلي لي إستوديو إن». من بطولة وكيم دامي، عرض على SBS TV من 6 ديسمبر 2021 إلى 25 يناير 2022، بث كل يوم الإثنين والثلاثاء الساعة 22:00 بتوقيت (KST). وهو متاحًا أيضًا على نتفليكس. القصة. انفصل الثنائي تشوي وونغ (تشوي وو شيك) ويون سو (كيم دامي) قبل 10 سنوات، لكن يصبح الفيلم الوثائقي الذي صوروه خلال أيام دراستهما الثانوية شائعًا، بسببه عليهما الوقوف أمام الكاميرا مجددا، على رغم انهم لايريدون ذلك. طاقم. الشخصيات الرئيسية. رسام تشكيلي حر مفعم بالحيوية. خبيرة علاقات عامة وواقعية. مخرج وثائقي، وهو كان المسؤول عن إنتاج الفيلم الوثائقي لي تشوي وونغ وايون سو. أيدول مشهورة تحتفظ بالمركز الأول منذ ظهورها. الإنتاج. صناعة. تم إنشاء المشروع بواسطة إستوديو إن، وهي أول دراما أصلية لهم، سيتم إنتاج المسلسل بتعاون مع شركة سوبر مون بيكتشرز، بتنسيق مع المقر الرئيسي للإنتاج والتخطيط الدرامي التابع لإس بي إس المعروف بـ «إستوديو إس». طاقم. في مارس 2021، أعلن تأكيد انضمام كل من تشوي وو شيك وكيم دا مي في المسلسل التلفزيوني، يجمع المسلسل بهم بعد ثلاث سنوات، آخر مرة ظهروا فيه في معا بفيلم الغموض """" لعام 2018. تم تأكيد اختيار الطاقم الشبابي في 8 يوليو. التصوير. بدأ تصوير المسلسل في أوائل يوليو 2021. طبعة أخرى. سيتم أيضًا إنتاج ويب تون من «صيفنا الحبيب»، الويب تون هو عبارة عن مقدمة عن أيام المدرسة الثانوية للشخصيتين الرئيسيتين في المسلسل التلفزيوني (تشوي وانغ وايون سوو)، ومن المقرر أن يتم إصداره على «نايفر ويبتوون» هذا العام. هي ناشر ومنصة على الويب أطلقته شركة نافير في كوريا الجنوبية في عام 2004.","متى تم عرض المسلسل ""صيفنا الحبيب ؟\n",من 6 ديسمبر 2021,"2023\nThe given text does not contain any information about a TV series called ""Our Sweet Summer"". Therefore, I cannot provide an accurate date for when it was first shown. The provided information only mentions that there is a Russian mission named Lena-26 planned to explore the Moon's pole in 2024 using Soyuz 2 rockets. There is no mention of any other TV shows or movies being released around this time period. Without more specific details from reliable sources, I am unable to determine if there has been any release of a TV show titled ""Our Sweet Summer"" at all, let alone its premiere year. Thus, based on the limited information available, I cannot confidently state whether ""Our Sweet Summer"" was first shown in 2023 or not. To accurately answer such questions, one would need access to comprehensive databases of television releases or official announcements regarding the airing dates of various programs. \n\nPlease note that without additional context or verification through external resources, providing an exact date for the premiere of a fictional or non-existent TV show like ""Our Sweet Summer"" is speculative and unreliable. If you have any further information or clarification about this topic, please feel free to ask! However, my current understanding based solely on the provided context"
2,"""العنف ضد كبار السن"" هو مصطلح يشير إلى السلوك العدواني والعنيف ضد كبار السن والذي من شأنه أن يسبب لهم العديد من الأضرار على المستويين النفسي والجسدي. قد يتم العنف ضد كبار السن في أي مكانً كان وعلى يدي أي شخص فهو لا ينطوي على شكل أو سبب واحد وهو يعتبر ظاهرة عالمية واسعة الانتشار ومن القضايا المجتمعية الرئيسية والتي تُقلِق المحاكم الدولية والمجتمعية وتدفعها باستمرار للبحث عن طرق للحفاظ على حقوق هؤلاء المُسنين وحمايتهم منه. كبار السن حسب تعريف دولة اسرائيل هم الأشخاص الذي يتجاوز عمرهم ال 65 سنة وهم أشخاص يحصلون على امتيازات وحماية مكثفة في اسرائيل وذلك بحسب التعديل رقم 26 لقانون العقوبات وهو قانون حماية القاصرين والعاجزين كما ويعود ذلك لضعفهم ولكثرة احتياجاتهم والتحديات التي يواجهها قسم كبير منهم. في دولة اسرائيل يتم التفريق بين مصطلح ""العنف ضد كبار السن"" وبين مصطلح ""إساءة وإهمال كبار السن"" حيث أنه وعلى الرغم من أن الإساءة لكبار السن قد تضمن العنف إلا أنها عادة ما تحدث من شخص مقرب لكبير السن مثل الأقرباء والأشخاص المخصصين لرعايتهم وتستمر لفترة وهو ضمن مجال عمل وزارة الرفاه والضمان الاجتماعي، على عكس مصطلح العنف ضد كبار السن والذي يدل على حادث الذي فيه يتم التهجم على شخص كبير بالسن من قبل شخص غريب ويحدث ذلك لمرة واحدة ويكون ضمن مجال عمل الشرطة. من الجدير بالذكر أن دولة إسرائيل تقوم باتخاذ الإجراءات اللازمة في كلتا الحالتين، سواء كانت إساءة او عنف، بهدف الحد من ظاهرة العنف ضد كبار السن. إحصائيات العنف ضد كبار السن. حسب التقرير الذي أصدرته الكنيست عام 2007 والذي يعرض ظاهرة العنف ضد كبار السن فأنه وفقًا للإحصائيات التي أجريت في نهاية سنة 2006 عاش ما يقارب ال 70،000 مُسن في اسرائيل وهذا يعادل 10% من إجمالي السكان، 30% منهم هم ناجون من المحرقة اليهودية او الهولوكوست كما ان حوالي 12،000 من كبار السن يعيشون مع شخص واحد على الأقل لا تربطه معهم صلة دم (عادة ما يكون هذا الشخص معالج او مرافق للاعتناء بهم). مراكز الشرطة تتلقى عدد هائل من البلاغات وفتحت ما يقارب 12,228 ملف يتعلق بالعنف والجرائم ضد كبار السن من عام 2002 حتى الرابع من سبتمبر عام 2007 (هذه الملفات تتضمن القتل، محاولات القتل، الجرائم الجنسية والاغتصاب، جرائم السرقة والسطو على البيوت كما وتتضمن الاعتداء والتخريب) هذا العدد من الشكاوي والملفات لا يتضمن أولئك الذين وصلوا إلى الحرس المدني وغيرها من الأقسام. بحسب الاحصائيات فإن: 32% من هذه الشكاوى هي بلاغات عن السطو على بيوتهم، 17% هي عن تهديدات تلقوها، 31% عن سرقات تعرضوا لها بينما 11% هي فقط اعتداءات جسدية. بشكل عام في تلك السنوات (2002-2007) كان يقدم كبار السن القادمون جديدًا للدولة (المهاجرون) حوالي 9% من الشكاوى رغم أن نسبتهم من السكان لا تتعدى 25% بينما المسنين العرب كانوا يقدمون 5% من البلاغات. وفقًا لوزارة الرفاه والضمان الاجتماعي إن لجائحة كورونا أثرًا سلبيًا على ظاهرة العنف ضد كبار السن فقد لوحظ ارتفاع في الحالات التي تم فيها تعنيف كبار السن (معظمها تمت من قبل أفراد العائلة ومقدمي الرعاية) فعلى سبيل المثال في عام 2018 تم علاج 6707 حالة بينما حتى منتصف عام 2019 فقط تم علاج أكثر من 7000 حالة وهذا عدا عن الحالات التي",من هم كبار السن حسب تعريف دولة إسرائيل؟\n\n,الذي يتجاوز عمرهم ال 65 سنة,"1992 هو العام الذي ولد فيه الميلاميد، وهو أكبر من كولينز بعام واحد فقط. لذا فإن كولينز هو الأكبر سنًا حسب هذا التعريف. ولكن إذا تم تقسيم السن إلى 65 عامًا أو أكثر، فهناك العديد من الأشخاص الذين يتجاوزون ذلك مثل رونالدينيو (70 عامًا) ورونالدو (34 عامًا). لذا فإن الإجابة على السؤال ""من هم كبار السن حسب تعريف دولة إسرائيل"" قد تتغير بناءً على هذه التفاصيل. ولكن من الناحية العامة، يمكن اعتبار كولينز كبار السن حسب هذا التعريف. \n\nفيما يتعلق بالسؤال عن كبار السن حسب تعريف دولة إسرائيل، فإن الإجابة هي كولينز. فهو أكبر من الميلاميد بعام واحد فقط، وبالتالي يعتبر كبار السن حسب هذا التعريف. ولكن إذا تم تقسيم السن إلى 65 عامًا أو أكثر، فهناك العديد من الأشخاص الذين يتجاوزون ذلك مثل رونالدينيو (70 عامًا) و"
3,عدم التحمل في نظام الطاقة الكهربائية هي الحالة التي يكون فيها فقدان التحمل المفاجئ في النظام والذي يتسبب في زيادة تواتر معدات التوليد. يعد اختبار عدم التحمل جزءًا من التكليف لأنظمة الطاقة للتأكد من أن النظام يمكنه تحمل الفقد المفاجئ للتحمل والعودة إلى ظروف التشغيل العادية.,ما هي عدم التحمل في نظام الطاقة الكهربائية؟\n,الحالة التي يكون فيها فقدان التحمل المفاجئ في النظام والذي يتسبب في زيادة تواتر معدات التوليد,"لا يوجد أي معلومات محددة حول ""العدوى الكهربائية"" أو ""العدوى في النظام الكهربائي"". يبدو أن هناك خطأ في الطلب. هل يمكن إعادة طرح السؤال بشكل صحيح؟ إذا كان لديك المزيد من المعلومات أو استفسارات أخرى، فأنا هنا للمساعدة. \n\nفيما يتعلق بالسؤال الذي تم تقديمته، فإن ""العدوى الكهربائية"" ليست عبارة عن مشكلة في النظام الكهربائي. ربما كان هناك بعض الخطأ في كتابة السؤال. قد يكون هناك شيء آخر تحتاج إلى معرفته. هل يمكنك تقديم المزيد من المعلومات أو الاستفسارات حتى أتمكن من مساعدتك بشكل أفضل؟\n---------------------"
4,الهندسة الكهربائية هي تخصص يهتم بدراسة وتطبيقات علوم الكهرباء والإلكترونيات والمجالات الكهرومغناطيسية.\nأصبح هذا المجال معروفاً في أواخر القرن التاسع عشر وذلك بعد انتشار التلغراف ومحطات إمداد الطاقة. والآن يغطي هذا المجال عدداً من المواضيع الفرعية والتي تتضمن الطاقة والإلكترونيات ونظم التحكم الآلي ومعالجة الإشارات والاتصالات اللاسلكية.\nومن الممكن أن نقول أن الهندسة الكهربائية قد تتضمن أيضاً هندسة الإلكترونيات وقد لا تتضمنها. ويمكن التفريق بينهما حيث تهتم هندسة الكهرباء بالأمور المتعلقة بنظم الكهرباء عالية الجهد مثل نقل الطاقة والتحكم في المحركات، بينما تتعامل هندسة الإلكترونيات مع دراسة النظم الإلكترونية ذات المقاييس المنخفضة (تيار منخفض –جهد منخفض)، ويتضمن ذلك علوم الحاسبات والدوائر المتكاملة.\nوتتناول الهندسة الكهربائية دراسة وتصميم العديد من النظم الكهربائية والإلكترونية المختلفة، مثل الدوائر الكهربائية والمولدات، المحركات، المحولات، مولد القدرة غير المنقطعة UPS، المواد المغناطيسية وغيرها من الأجهزة الكهرومغناطيسية والكهروميكانيكية.\nتاريخ وأعلام الهندسة الكهربائية.\nظهر الاهتمام العلمي بالكهرباء منذ بدايات القرن السابع عشر على الأقل. فيعتقد أن أول مهندس كهرباء هو وليام جلبرت الذي صمم آلة لاكتشاف الأجسام ذات الشحنات الكهربية الساكنة. وهو من فرَّق بين المغناطيسية والكهربية الساكنة، كما يعتقد بأنه أول من أنشأ مصطلح الكهرباء.\nوفي بادئ الأمر كانت كل الاكتشافات والاختراعات تتعلق بالشحنة. وبدأ فصل الهندسة الكهربائية عن الفيزياء في زمن توماس اديسون وفيرنر فون سيمنس. وفي عام 1752 اخترع بينيامين فرانكلين موصلة الصواعق ونشر بين 1751 و1753 نتائج تجاربه تحت عنوان «تجارب ومشاهدات عن الكهرباء» (Experiments and Observations on Electricity). في العام 1800 قام ألساندرو فولتا ببناء بطاريته الأولى المسماة «عمود فولتا» بعد اعجابه بتجربة اجراها لويجي جالفاني عام 1792. في العام 1820 قام هانز كريستيان اورستد بعمل تجارب عن انحناء ابرة البوصلة بتاثير التيار الكهربي. وفي نفس العام كرر اندريه ماري امبير تلك التجربة واثبت ان سلكين يمر فيهما التيار يؤثران بقوى على بعضهما البعض وعرف خلالها الجهد الكهربي والتيار الكهربي.\nمايكل فاراداي (ينطق أيضا ميشيل فاراداي) قدم أعمال كبيرة في مجال الفيضين الكهربي والمغناطيسي، وعرف أيضا خطوط المجال. وبناء على أعمال فاراداي قدم جيمس كليرك ماكسويل أعمالا في إكمال نظرية الكهرومغناطيسية والكهروديناميكيةـ وقدم عام 1864 معادلات ماكسويل والتي تعتبر أحد أهم أسس الهندسة الكهربية.\nتطور مجال إنتاج الطاقة الكهربائية والضوء في نفس السنوات أدت لزيادة الطلب على مهندسوا كهرباء ذوي تجربة. في نفس الفترة تم الحصول على المؤهلات الهندسية من خلال التخصصات بأطر أعمال هندسية. هذه الطريقة اهلت مهندسوا بناء ومهندسو ماكينات لكنها فشلت بان تؤهل مهندسوا كهرباء على ضوء تسارع المجال، ولم يكن هناك مهندسو كهرباء يدرسون الموضوع لطلاب هندسه الكهرباء. \nبشكل طبيعي مهمة تعليم وتأهيل مهندسوا الكهرباء وقعت على عاتق الفيزيائين، حيث انه لم يكن لاحد اخر العلم بمجال الكهرباء المطلوب والقدرة لتوصيله لاكبر عدد من الطلاب.\n,ما هو دور الإلكترونيات في مجال الهندسة الكهربائية؟\n,.,"الإلكترونات هي جزء أساسي من الهندسة الكهربائية حيث تستخدم لإنتاج ونقل الطاقة الكهربائية. يمكن أن تكون الإلكترونات في شكل كابلات أو أجهزة كهربائية مثل الأجهزة المنزلية أو المعدات الصناعية. بالإضافة إلى ذلك، يمكن استخدام الإلكترونات في مجالات أخرى مثل التكنولوجيا الحيوية والذكاء الاصطناعي. في النهاية، الإلكترونات هي جزء لا يتجزأ من الهندسة الكهربائية. \n\nالإجابة على السؤال ""ما هو دور الإلكترونيات في مجال الهندسة الكهربائية؟"" هي أنه تعتبر جزءًا أساسياً من الهندسة الكهربائية حيث تستخدم لإنتاج ونقل الطاقة الكهربائية. ويمكن أن تكون الإلكترونات في شكل كابلات أو أجهزة كهربائية مثل الأجهزة المنزلية أو المعدات الصناعية. بالإضافة إلى ذلك، يمكن استخدام الإلكترونات في مجالات أخرى مثل التكنولوجيا الحيوية والذكاء الاصطناعي. في النهاية، الإلكترونات هي جزء لا"


In [48]:
df_done.to_csv("df_sample_with_answers_328.csv", index=False)


In [18]:
print(session.url)


http://localhost:6006/


## RAGAS Evaluation

In [27]:
!pip install -U "ragas[langchain]" langchain-core langchain pydantic







Collecting ragas[langchain]
  Downloading ragas-0.3.9-py3-none-any.whl.metadata (22 kB)
Collecting diskcache>=5.6.3 (from ragas[langchain])
  Downloading diskcache-5.6.3-py3-none-any.whl.metadata (20 kB)
Collecting typer (from ragas[langchain])
  Downloading typer-0.20.0-py3-none-any.whl.metadata (16 kB)
Collecting rich (from ragas[langchain])
  Downloading rich-14.2.0-py3-none-any.whl.metadata (18 kB)
Collecting instructor (from ragas[langchain])
  Downloading instructor-1.13.0-py3-none-any.whl.metadata (11 kB)
Collecting gitpython (from ragas[langchain])
  Downloading gitpython-3.1.45-py3-none-any.whl.metadata (13 kB)
Collecting scikit-network (from ragas[langchain])
  Downloading scikit_network-0.33.5-cp310-cp310-win_amd64.whl.metadata (4.6 kB)
Collecting gitdb<5,>=4.0.1 (from gitpython->ragas[langchain])
  Downloading gitdb-4.0.12-py3-none-any.whl.metadata (1.2 kB)
Collecting smmap<6,>=3.0.1 (from gitdb<5,>=4.0.1->gitpython->ragas[langchain])
  Downloading smmap-5.0.2-py3-none-any

In [49]:
from ragas.llms import LlamaIndexLLMWrapper

# you already defined `llm = HuggingFaceLLM(...)` and `Settings.llm = llm`

evaluator_llm = LlamaIndexLLMWrapper(llm)


  evaluator_llm = LlamaIndexLLMWrapper(llm)


In [50]:
from sentence_transformers import SentenceTransformer

embedding_model = SentenceTransformer(
    "sentence-transformers/LaBSE",
    device="cuda" if torch.cuda.is_available() else "cpu"
)


In [51]:
from langchain_community.embeddings import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/LaBSE",
    model_kwargs={"device": "cuda"},
)


  embeddings = HuggingFaceEmbeddings(


In [52]:
# Starting from df_sample with: context, question, ground_truth, model_answer
df_ragas = df_done.copy()

# Rename columns to match Ragas expectations
df_ragas["retrieved_contexts"] = df_ragas["context"].apply(lambda x: [x])  # must be list of strings
df_ragas["response"] = df_ragas["model_answer"]
df_ragas["user_input"] = df_ragas["question"]
df_ragas["reference"] = df_ragas["ground_truth"]  # rename ground_truth to reference

print(df_ragas.columns)
# Should include: 'user_input', 'response', 'retrieved_contexts', 'reference'


Index(['context', 'question', 'ground_truth', 'model_answer',
       'retrieved_contexts', 'response', 'user_input', 'reference'],
      dtype='object')


In [53]:

from ragas import EvaluationDataset
ragas_dataset = EvaluationDataset.from_pandas(df_ragas)


In [None]:
from ragas.metrics import (
    faithfulness,
    answer_relevancy,
    context_precision,
    context_recall,
    answer_correctness,
)

from ragas import evaluate

result = evaluate(
    ragas_dataset,
    metrics=[
        faithfulness,
        answer_relevancy,
        context_precision,
        context_recall,
        answer_correctness,
    ],
    llm=evaluator_llm,
    embeddings=embeddings,
)
result


            id = uuid7()
Future versions will require UUID v7.
  input_data = validator(cls_, input_data)
n values greater than 1 not support for LlamaIndex LLMs0 [00:00<?, ?it/s]
LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.


### Overall RAGAS Scores

In [None]:
import pandas as pd

overall_df = result.to_pandas()
overall_df.to_csv("ragas_overall_scores.csv", index=False)

print("Saved: ragas_overall_scores.csv")


### Per-Question RAGAS Scores

In [None]:
from ragas import evaluate

per_question = evaluate(
    df_sample,
    metrics=[
        faithfulness,
        answer_relevancy,
        context_precision,
        context_recall,
        answer_correctness,
    ],
    return_multi=True 
)


In [None]:
per_question_df = per_question.to_pandas()
per_question_df.to_csv("ragas_per_question_scores.csv", index=False)

print("Saved: ragas_per_question_scores.csv")


In [None]:
ragas_df = result.to_pandas()
ragas_df


## Bar Chart + Save

In [None]:
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 5))
plt.bar(ragas_df["metric"], ragas_df["value"], color="#4C72B0")
plt.ylim(0, 1)
plt.title("RAGAS Metrics Overview", fontsize=16)
plt.ylabel("Score", fontsize=14)
plt.xticks(rotation=45, ha="right")
plt.grid(axis="y", linestyle="--", alpha=0.4)

plt.tight_layout()
plt.savefig("ragas_bar_chart.png", dpi=400)
plt.show()

print("✔ Saved: ragas_bar_chart.png")


## Line Chart + Save

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(ragas_df["metric"], ragas_df["value"], marker="o", linewidth=2, color="#55A868")
plt.ylim(0, 1)
plt.title("RAGAS Metrics Trend", fontsize=16)
plt.ylabel("Score", fontsize=14)
plt.xticks(rotation=45, ha="right")
plt.grid(True, linestyle="--", alpha=0.4)

plt.tight_layout()
plt.savefig("ragas_line_chart.png", dpi=400)
plt.show()

print("✔ Saved: ragas_line_chart.png")


## Radar Chart (Spider Plot) + Save

In [None]:
import numpy as np
import matplotlib.pyplot as plt

metrics = ragas_df["metric"].tolist()
values = ragas_df["value"].tolist()

# Close the circle
values += values[:1]
angles = np.linspace(0, 2*np.pi, len(values))

plt.figure(figsize=(8, 8))
ax = plt.subplot(111, polar=True)

ax.plot(angles, values, linewidth=2, color="#C44E52")
ax.fill(angles, values, alpha=0.25, color="#C44E52")

ax.set_thetagrids(angles[:-1] * 180/np.pi, metrics)
ax.set_title("RAGAS Radar Chart", fontsize=16)
ax.grid(True, linestyle="--", alpha=0.4)

plt.tight_layout()
plt.savefig("ragas_radar_chart.png", dpi=400)
plt.show()

print("✔ Saved: ragas_radar_chart.png")
