In [33]:
# Встановлення необхідних бібліотек
!pip install -U datasets transformers torch sentence-transformers qdrant-client langchain langchain-community langchain-qdrant ragas google-generativeai vllm accelerate bitsandbytes

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


Collecting torch
  Using cached torch-2.7.1-cp39-none-macosx_11_0_arm64.whl.metadata (29 kB)


In [34]:
# Імпорт всіх необхідних бібліотек
import os
import json
import time
import random
from typing import List, Dict, Any
import numpy as np
import pandas as pd
from tqdm import tqdm

# Datasets та ML
from datasets import load_dataset
import torch
from transformers import AutoTokenizer, AutoModel
from sentence_transformers import SentenceTransformer

# Qdrant
from qdrant_client import QdrantClient
from qdrant_client.models import Distance, VectorParams, PointStruct

# LangChain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Qdrant
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain.chains import RetrievalQA
from langchain_community.llms import HuggingFacePipeline
from langchain.prompts import PromptTemplate

# Google Gemini для LLM as a Judge
import google.generativeai as genai

# RAGAS для оцінки
from ragas import evaluate
from ragas.metrics import answer_relevancy, faithfulness, context_recall, context_precision


if torch.cuda.is_available():
    device = torch.device("cuda")
elif torch.backends.mps.is_available():
    device = torch.device("mps")
else:
    device = torch.device("cpu")

print(f"Використовується пристрій: {device}")

Використовується пристрій: mps


In [35]:
from datasets import load_dataset

def prepare_test_data_triviaqa_rc(dataset, num_samples=2000):
    test_data = []
    contexts_for_kb = []
    for i, item in enumerate(dataset):
        if len(test_data) >= num_samples:
            break

        # Question
        question = item.get('question', '').strip()

        # Answer (inside 'answer')
        answer_dict = item.get('answer', {})
        aliases = answer_dict.get('aliases', [])
        if aliases and isinstance(aliases, list) and len(aliases) > 0:
            answer = str(aliases[0]).strip()
        else:
            answer = str(answer_dict.get('value', '')).strip()

        # Context: try entity_pages first, then search_results if not found
        context = ''
        entity_pages = item.get('entity_pages', [])
        if isinstance(entity_pages, list):
            for page in entity_pages:
                ctx = page.get('wiki_context', '').strip()
                if ctx:
                    context = ctx
                    break
                ctx = page.get('search_context', '').strip()
                if ctx:
                    context = ctx
                    break
        # If still no context, try search_results (list of dicts, each may have 'search_context')
        if not context:
            search_results = item.get('search_results', [])
            if isinstance(search_results, dict):
                ctx_list = search_results['search_context']
                half = int(len(ctx_list) / 4)
                context = " ".join([s.strip() for s in ctx_list if s.strip()][:half])


        if question and answer and context:
            test_data.append({
                'question': question,
                'answer': answer,
                'context': context
            })
            if context not in contexts_for_kb:
                contexts_for_kb.append(context)

    return test_data, contexts_for_kb

# Example usage:
print("Завантаження TriviaQA датасету...")
dataset = load_dataset("mandarjoshi/trivia_qa", "rc", split="train[:30]")

test_data, all_contexts = prepare_test_data_triviaqa_rc(dataset)
print(f"Підготовлено {len(test_data)} тестових прикладів")
print(f"Зібрано {len(all_contexts)} контекстів для бази знань")

if test_data:
    print("\nПриклад тестових даних:")
    print(f"Запитання: {test_data[0]['question']}")
    print(f"Відповідь: {test_data[0]['answer']}")
    print(f"Контекст: {test_data[0]['context'][:3000]}...")

Завантаження TriviaQA датасету...


Resolving data files:   0%|          | 0/26 [00:00<?, ?it/s]

Resolving data files:   0%|          | 0/26 [00:00<?, ?it/s]

Підготовлено 20 тестових прикладів
Зібрано 20 контекстів для бази знань

Приклад тестових даних:
Запитання: Which American-born Sinclair won the Nobel Prize for Literature in 1930?
Відповідь: (Harry) Sinclair Lewis
Контекст: The Nobel Prize in Literature 1930
The Nobel Prize in Literature 1930
Sinclair Lewis
The Nobel Prize in Literature 1930
Sinclair Lewis
Prize share: 1/1
The Nobel Prize in Literature 1930 was awarded to Sinclair Lewis "for his vigorous and graphic art of description and his ability to create, with wit and humour, new types of characters".
Photos: Copyright © The Nobel Foundation
Share this:
To cite this page
MLA style: "The Nobel Prize in Literature 1930". Nobelprize.org. Nobel Media AB 2014. Web. 18 Jan 2017. <http://www.nobelprize.org/nobel_prizes/literature/laureates/1930/>...


In [36]:
# Додаткова фільтрація та покращення якості даних (рефакторинг)

def refined_newsqa_cleaning(test_data, all_contexts):
    """Оновлена та модифікована очистка NewsQA"""
    filtered_data = []
    unique_contexts = list(set(all_contexts))  # Усуваємо дублікати у контекстах

    # Оцінка статистичних меж
    q_lengths = [len(sample['question']) for sample in test_data]
    a_lengths = [len(sample['answer']) for sample in test_data]

    q_low, q_high = np.percentile(q_lengths, [10, 90])
    a_low, a_high = np.percentile(a_lengths, [5, 95])

    print("Діапазон довжин:")
    print(f"Питання: {q_low:.0f} - {q_high:.0f} символів")
    print(f"Відповіді: {a_low:.0f} - {a_high:.0f} символів")

    for entry in test_data:
        q = entry['question'].strip()
        a = entry['answer'].strip()
        c = entry['context'].strip()

        # Нові умови фільтрації
        if (
            q_low <= len(q) <= q_high and
            a_low <= len(a) <= a_high and
            len(c) >= 200 and
            (q.endswith('?') or not q.endswith('?'))  # Дозволяємо і ті, і ті питання
        ):
            # Додаткові критерії якості
            if (
                not any(a.lower().startswith(prefix) for prefix in ['the answer is', 'according to']) and
                1 <= len(a.split()) <= 50
            ):
                filtered_data.append({
                    'question': q,
                    'answer': a,
                    'context': c
                })

    return filtered_data, unique_contexts

# Очищення даних
test_data, all_contexts = refined_newsqa_cleaning(test_data, all_contexts)
print("\nРезультати після оновленої очистки:")
print(f"Кількість тестових прикладів: {len(test_data)}")
print(f"Кількість унікальних контекстів: {len(all_contexts)}")

# Демонстрація готових прикладів
if test_data:
    print("\nПідсумкові приклади:")
    for idx, item in enumerate(test_data[:3]):
        print(f"\n--- Зразок {idx+1} ---")
        print(f"Питання: {item['question']}")
        print(f"Відповідь: {item['answer']}")
        print(f"Контекст: {item['context'][:200]}...")

Діапазон довжин:
Питання: 34 - 68 символів
Відповіді: 6 - 42 символів

Результати після оновленої очистки:
Кількість тестових прикладів: 16
Кількість унікальних контекстів: 20

Підсумкові приклади:

--- Зразок 1 ---
Питання: Where in England was Dame Judi Dench born?
Відповідь: Park Grove (1895)
Контекст: Judi Dench - IMDb
IMDb
Actress | Music Department | Soundtrack
Judi Dench was born in York, England, to Eleanora Olive (Jones), who was from Dublin, Ireland, and Reginald Arthur Dench, a doctor from D...

--- Зразок 2 ---
Питання: From which country did Angola achieve independence in 1975?
Відповідь: Portogało
Контекст: Angola from past to present | Conciliation Resources
Angola from past to present
Angola from past to present
From military peace to social justice? The Angolan peace process
Publication date: 
David B...

--- Зразок 3 ---
Питання: Which city does David Soul come from?
Відповідь: Chi-Beria
Контекст: David Soul - IMDb
IMDb
Actor | Soundtrack | Director
David Soul achieve

In [37]:
# Конфігурація Google Gemini API
genai.configure(api_key="AIzaSyDuDtyLsts7mzRKHRaia5C3vDAc9HiZBOc")

def get_answer_with_mini_llm(question: str) -> str:
    """Генерація відповіді БЕЗ контексту за допомогою малої LLM через Gemini"""
    try:
        gemini_model = genai.GenerativeModel('gemini-2.0-flash')

        prompt = (f"You are a helpful assistant. Please answer the following question clearly and accurately using your general knowledge.\n\n"
                  f"Question: {question}\n\n"
                  f"Answer:")

        reply = gemini_model.generate_content(prompt)
        time.sleep(4)  # Затримка для обмеження запитів
        return reply.text.strip()
    except Exception as error:
        print(f"Виникла помилка під час генерації відповіді: {error}")
        return "Відповідь не була згенерована"

# Генерація відповідей без RAG для тестових прикладів
print("Відповіді без RAG...")
no_rag_answers = []

for idx, example in enumerate(tqdm(test_data[:50])):  # Обмежуємо кількість для економії викликів API
    q = example['question']
    gen_answer = get_answer_with_mini_llm(q)
    no_rag_answers.append({
        'question': q,
        'true_answer': example['answer'],
        'generated_answer': gen_answer,
        'context': example['context']
    })

print(f"Згенеровано {len(no_rag_answers)} відповідей без застосування RAG")

Починається генерація відповідей без RAG...


100%|██████████| 16/16 [01:13<00:00,  4.58s/it]

Згенеровано 16 відповідей без застосування RAG





In [38]:
no_rag_answers[0]

{'question': 'Where in England was Dame Judi Dench born?',
 'true_answer': 'Park Grove (1895)',
 'generated_answer': 'Dame Judi Dench was born in York, England.',
 'context': 'Judi Dench - IMDb\nIMDb\nActress | Music Department | Soundtrack\nJudi Dench was born in York, England, to Eleanora Olive (Jones), who was from Dublin, Ireland, and Reginald Arthur Dench, a doctor from Dorset, England. She attended Mount School in York, and studied at the Central School of Speech and Drama. She has performed with Royal Shakespeare Company, the National Theatre, and at Old Vic Theatre. She is a ... See full bio »\nBorn:\na list of 35 people\ncreated 02\xa0Jul\xa02011\na list of 35 people\ncreated 19\xa0Apr\xa02012\na list of 35 people\ncreated 28\xa0May\xa02014\na list of 25 people\ncreated 05\xa0Aug\xa02014\na list of 26 people\ncreated 18\xa0May\xa02015\nDo you have a demo reel?\nAdd it to your IMDbPage\nHow much of Judi Dench\'s work have you seen?\nUser Polls\nWon         1         Oscar. Anot

Векторна розмірність ембеддінгів: 384


In [41]:
# Запуск Qdrant-клієнта у пам'яті
qdrant_client = QdrantClient(":memory:")

# Завантаження моделі для отримання ембеддінгів
embedding_model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')
embedding_dimension = 384

print(f"Векторна розмірність ембеддінгів: {embedding_dimension}")
# Розбиття тексту на фрагменти
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50,
    length_function=len,
)

# Ділимо контексти на фрагменти
print("Виконується розбиття текстів на фрагменти...")
all_chunks = []
chunk_metadata = []

for idx, ctx in enumerate(tqdm(all_contexts)):
    split_chunks = text_splitter.split_text(ctx)
    for chunk_idx, fragment in enumerate(split_chunks):
        if len(fragment.strip()) > 50:  # Відсікаємо занадто короткі фрагменти
            all_chunks.append(fragment)
            chunk_metadata.append({
                'source_id': idx,
                'chunk_id': chunk_idx,
                'text': fragment
            })

print(f"Сформовано {len(all_chunks)} текстових фрагментів")

Виконується розбиття текстів на фрагменти...


100%|██████████| 20/20 [00:00<00:00, 1860.08it/s]

Сформовано 339 текстових фрагментів





In [42]:
# Створення нової колекції у Qdrant
collection_name = "knowledge_base"

qdrant_client.create_collection(
    collection_name=collection_name,
    vectors_config=VectorParams(size=embedding_dimension, distance=Distance.COSINE),
)

print(f"Колекцію '{collection_name}' було створено у Qdrant")

Колекцію 'knowledge_base' було створено у Qdrant


In [43]:
# Генерація ембеддінгів і збереження у векторному сховищі
print("Початок генерації ембеддінгів та їх індексації...")
batch_size = 32

for start_idx in tqdm(range(0, len(all_chunks), batch_size)):
    current_chunks = all_chunks[start_idx:start_idx+batch_size]
    current_metadata = chunk_metadata[start_idx:start_idx+batch_size]

    # Отримання векторних представлень
    vectors = embedding_model.encode(current_chunks)

    # Формування точок для Qdrant
    points = []
    for offset, (fragment, meta, vector) in enumerate(zip(current_chunks, current_metadata, vectors)):
        points.append(PointStruct(
            id=start_idx + offset,
            vector=vector.tolist(),
            payload={
                'text': fragment,
                'source_id': meta['source_id'],
                'chunk_id': meta['chunk_id']
            }
        ))

    # Додавання до Qdrant
    qdrant_client.upsert(
        collection_name=collection_name,
        points=points
    )

print("Створено векторне сховище")

Початок генерації ембеддінгів та їх індексації...


100%|██████████| 11/11 [00:04<00:00,  2.68it/s]

Векторне сховище було успішно сформовано!





In [44]:
def compute_recall_at_k(test_data, k_list=[5, 10, 20, 30]):
    """Обрахунок Recall@K для системи з фрагментами"""
    recall_at_k = {k: [] for k in k_list}

    print("Виконується обчислення Recall@K...")

    for entry in tqdm(test_data[:500]):  # Для пришвидшення беремо підмножину
        question = entry['question']
        reference_context = entry['context']

        # Створення ембеддінгу для питання
        question_vec = embedding_model.encode([question])[0]

        # Пошук у Qdrant
        retrieved = qdrant_client.query_points(
            collection_name=collection_name,
            query=question_vec.tolist(),
            limit=max(k_list),
            with_payload=True
        )

        # Перевірка для кожного k
        for k in k_list:
            match_found = False

            for point in retrieved.points[:k]:
                candidate_text = point.payload.get('text', '')
                if candidate_text.strip() in reference_context:
                    match_found = True
                    break

            recall_at_k[k].append(1 if match_found else 0)

    # Середнє значення Recall@K
    mean_recall = {}
    for k in k_list:
        mean_recall[k] = np.mean(recall_at_k[k])
        print(f"Recall@{k}: {mean_recall[k]:.3f}")

    return mean_recall

# Приклад використання:
recall_results = compute_recall_at_k(test_data)

Виконується обчислення Recall@K...


100%|██████████| 16/16 [00:01<00:00, 13.60it/s]

Recall@5: 1.000
Recall@10: 1.000
Recall@20: 1.000
Recall@30: 1.000





In [45]:
# genai.configure(api_key="AIzaSyDuDtyLsts7mzRKHRaia5C3vDAc9HiZBOc")
genai.configure(api_key="AIzaSyCuNPHw1u6aB9g9iSrZocd-A4Ro025VwjQ")

def find_relevant_contexts(question: str, top_k: int = 10) -> list[str]:
    """Пошук найбільш релевантних контекстів для заданого питання"""
    question_vector = embedding_model.encode([question])[0]

    results = qdrant_client.search(
        collection_name=collection_name,
        query_vector=question_vector.tolist(),
        limit=top_k
    )

    return [hit.payload['text'] for hit in results]

def synthesize_rag_answer(question: str, contexts: list[str]) -> str:
    """Генерація відповіді з використанням RAG механізму"""
    try:
        rag_model = genai.GenerativeModel('gemini-2.0-flash-exp')

        combined_context = "\n\n".join(contexts)

        prompt = (
            f"Given the following context, please answer the question clearly and precisely.\n\n"
            f"Context:\n{combined_context}\n\n"
            f"Question: {question}\n\n"
            f"Answer:"
        )

        result = rag_model.generate_content(prompt)
        time.sleep(8)  # Затримка для дотримання ліміту запитів
        return result.text.strip()
    except Exception as err:
        print(f"Помилка під час генерації RAG-відповіді: {err}")
        raise Exception(err)
        return "Відповідь не була згенерована"

# Формуємо відповіді з використанням RAG
print("Запуск генерації відповідей з RAG...")
rag_answers = []

for example in tqdm(test_data[:50]):  # Використовуємо таку ж кількість для зіставлення
    q = example['question']

    # Отримання релевантних фрагментів
    top_contexts = find_relevant_contexts(q, top_k=10)

    # Побудова RAG-відповіді
    rag_result = synthesize_rag_answer(q, top_contexts)

    rag_answers.append({
        'question': q,
        'true_answer': example['answer'],
        'generated_answer': rag_result,
        'contexts': top_contexts,
        'original_context': example['context']
    })

print(f"Згенеровано {len(rag_answers)} відповідей за допомогою RAG")

Запуск генерації відповідей з RAG...


  results = qdrant_client.search(
100%|██████████| 16/16 [02:23<00:00,  8.94s/it]

Згенеровано 16 відповідей за допомогою RAG





In [46]:
rag_answers[1]

{'question': 'From which country did Angola achieve independence in 1975?',
 'true_answer': 'Portogało',
 'generated_answer': 'Portugal',
 'contexts': ['When Angola achieved independence in 1975, a war was raging between competing national liberation movements and their foreign backers. Guus Meijer and David Birmingham revisit Angola’s colonial period and the independence struggle that followed and ask how the resulting social and economic divisions shaped and were manipulated by the warring parties. The article describes the introduction of authoritarian one-party rule under the MPLA and the impact of natural resource development and',
  'ground in particular in Luanda with support from the Soviet Union and from Cuban troops. On 11 November 1975 Angola became independent. The FNLA and UNITA were excluded from the city and from government and a socialist one-party regime was established which eventually gained international recognition, though not from the United States.',
  "On 11 Nov

In [47]:
def assess_answer_quality(question: str, true_answer: str, generated_answer: str) -> dict:
    """Оцінювання якості відповіді за допомогою LLM as a Judge"""
    try:
        judge_model = genai.GenerativeModel('gemini-2.5-flash-preview-05-20')

        prompt = (
            "You are an expert evaluator. Assess the generated answer compared to the true answer.\n\n"
            f"Question: {question}\n"
            f"True Answer: {true_answer}\n"
            f"Generated Answer: {generated_answer}\n\n"
            "Please reply in the following format:\n"
            "Binary Score: [0 or 1]\n"
            "Detailed Score: [1-5]\n"
            "Explanation: [Brief explanation for your scoring]\n"
            "\nScoring guide for Detailed Score:\n"
            "1: Completely incorrect or irrelevant\n"
            "2: Mostly incorrect with some relevant information\n"
            "3: Partially correct\n"
            "4: Mostly correct with minor issues\n"
            "5: Completely correct and comprehensive"
        )

        resp = judge_model.generate_content(prompt)
        time.sleep(5)

        # Парсинг LLM-відповіді
        text = resp.text
        binary_score, detailed_score, explanation = 0, 1, ""

        for line in text.split('\n'):
            if 'Binary Score:' in line:
                try:
                    binary_score = int(line.split(':')[1].strip())
                except Exception:
                    binary_score = 0
            elif 'Detailed Score:' in line:
                try:
                    detailed_score = int(line.split(':')[1].strip())
                except Exception:
                    detailed_score = 1
            elif 'Explanation:' in line:
                explanation = line.split(':', 1)[1].strip()

        return {
            'binary_score': binary_score,
            'detailed_score': detailed_score,
            'explanation': explanation
        }

    except Exception as err:
        print(f"Помилка під час оцінки: {err}")
        return {
            'binary_score': 0,
            'detailed_score': 1,
            'explanation': "Помилка під час оцінювання"
        }

# Оцінка відповідей без застосування RAG
print("Оцінювання якості відповідей без RAG...")
no_rag_evaluations = []

for entry in tqdm(no_rag_answers):
    eval_result = assess_answer_quality(
        entry['question'],
        entry['true_answer'],
        entry['generated_answer']
    )
    no_rag_evaluations.append(eval_result)

Оцінювання якості відповідей без RAG...


100%|██████████| 16/16 [02:38<00:00,  9.92s/it]


In [48]:
# Оцінка якості відповідей з RAG
print("Оцінювання якості відповідей з RAG...")
rag_evaluations = []

for entry in tqdm(rag_answers):
    eval_result = assess_answer_quality(
        entry['question'],
        entry['true_answer'],
        entry['generated_answer']
    )
    rag_evaluations.append(eval_result)

Оцінювання якості відповідей з RAG...


100%|██████████| 16/16 [03:02<00:00, 11.38s/it]


In [52]:
# Обчислення метрик
def calculate_metrics(evaluations):
    """Обчислення середніх метрик"""
    binary_scores = [eval_item['binary_score'] for eval_item in evaluations[:7]]
    detailed_scores = [eval_item['detailed_score'] for eval_item in evaluations[:7]]

    return {
        'accuracy': np.mean(binary_scores),
        'avg_detailed_score': np.mean(detailed_scores),
        'total_samples': len(evaluations)
    }

no_rag_metrics = calculate_metrics(no_rag_evaluations)
rag_metrics = calculate_metrics(rag_evaluations)

print("=== РЕЗУЛЬТАТИ ЕКСПЕРИМЕНТУ ===")
print()
print("1. Якість Retrieval моделі (Recall@K):")
for k, score in recall_results.items():
    print(f"   Recall@{k}: {score:.3f}")

print()
print("2. Якість відповідей без RAG:")
print(f"   Accuracy (binary): {no_rag_metrics['accuracy']:.3f}")
print(f"   Avg detailed score: {no_rag_metrics['avg_detailed_score']:.3f}")
print(f"   Total samples: {no_rag_metrics['total_samples']}")

print()
print("3. Якість відповідей з RAG:")
print(f"   Accuracy (binary): {rag_metrics['accuracy']:.3f}")
print(f"   Avg detailed score: {rag_metrics['avg_detailed_score']:.3f}")
print(f"   Total samples: {rag_metrics['total_samples']}")

print()
print("4. Порівняння RAG vs No-RAG:")
accuracy_improvement = rag_metrics['accuracy'] - no_rag_metrics['accuracy']
detailed_improvement = rag_metrics['avg_detailed_score'] - no_rag_metrics['avg_detailed_score']

print(f"   Покращення accuracy: {accuracy_improvement:+.3f}")
print(f"   Покращення detailed score: {detailed_improvement:+.3f}")

if accuracy_improvement > 0:
    print("   ✅ RAG показав кращі результати за accuracy")
else:
    print("   ❌ RAG не покращив accuracy")

if detailed_improvement > 0:
    print("   ✅ RAG показав кращі результати за детальною оцінкою")
else:
    print("   ❌ RAG не покращив детальну оцінку")

=== РЕЗУЛЬТАТИ ЕКСПЕРИМЕНТУ ===

1. Якість Retrieval моделі (Recall@K):
   Recall@5: 1.000
   Recall@10: 1.000
   Recall@20: 1.000
   Recall@30: 1.000

2. Якість відповідей без RAG:
   Accuracy (binary): 0.714
   Avg detailed score: 4.000
   Total samples: 16

3. Якість відповідей з RAG:
   Accuracy (binary): 0.857
   Avg detailed score: 4.571
   Total samples: 16

4. Порівняння RAG vs No-RAG:
   Покращення accuracy: +0.143
   Покращення detailed score: +0.571
   ✅ RAG показав кращі результати за accuracy
   ✅ RAG показав кращі результати за детальною оцінкою


In [50]:
print("=== ПРИКЛАДИ ВІДПОВІДЕЙ ===")

for i in range(min(30, len(no_rag_answers))):
    print(f"\n--- Приклад {i+1} ---")
    print(f"Питання: {no_rag_answers[i]['question']}")
    print(f"Правильна відповідь: {no_rag_answers[i]['true_answer']}")
    print(f"Без RAG: {no_rag_answers[i]['generated_answer']}")
    print(f"З RAG: {rag_answers[i]['generated_answer']}")
    print(f"Оцінка без RAG: Binary={no_rag_evaluations[i]['binary_score']}, Detailed={no_rag_evaluations[i]['detailed_score']}")
    print(f"Оцінка з RAG: Binary={rag_evaluations[i]['binary_score']}, Detailed={rag_evaluations[i]['detailed_score']}")

=== ПРИКЛАДИ ВІДПОВІДЕЙ ===

--- Приклад 1 ---
Питання: Where in England was Dame Judi Dench born?
Правильна відповідь: Park Grove (1895)
Без RAG: Dame Judi Dench was born in York, England.
З RAG: Judi Dench was born in York, England.
Оцінка без RAG: Binary=1, Detailed=4
Оцінка з RAG: Binary=1, Detailed=4

--- Приклад 2 ---
Питання: From which country did Angola achieve independence in 1975?
Правильна відповідь: Portogało
Без RAG: Angola achieved independence from Portugal in 1975.
З RAG: Portugal
Оцінка без RAG: Binary=1, Detailed=5
Оцінка з RAG: Binary=1, Detailed=5

--- Приклад 3 ---
Питання: Which city does David Soul come from?
Правильна відповідь: Chi-Beria
Без RAG: David Soul was born in Chicago, Illinois.
З RAG: Chicago
Оцінка без RAG: Binary=1, Detailed=5
Оцінка з RAG: Binary=1, Detailed=5

--- Приклад 4 ---
Питання: Which William wrote the novel Lord Of The Flies?
Правильна відповідь: Golding
Без RAG: William Golding wrote the novel *Lord of the Flies*.
З RAG: William Golding