**Завдання 2. Порівняння ефективності **`OOBTree`** і словника для діапазонних запитів**

Розробіть програму для зберігання великого набору даних про товари у двох структурах даних — `OOBTree` та `dict` — і проведіть порівняльний аналіз їхньої продуктивності для виконання діапазонних запитів.

**Опис завдання**

1. Використовуйте запропонований файл `generated_items_data.csv` для завантаження інформації про товари. Кожен товар включає унікальний ідентифікатор `ID`, назву `Name`, категорію `Category` та ціну `Price`.

2. Реалізуйте дві структури для зберігання товарів. Першу — `OOBTree` з бібліотеки `BTrees`, де ключем є `ID`, а значенням — словник із атрибутами товару. Другу — `dict` (стандартний словник), де ключем також є `ID`, а значенням — аналогічний словник із атрибутами товару.

3. Створіть функції для додавання товарів у обидві структури: `add_item_to_tree` та `add_item_to_dict`.

4. Створіть функції для виконання діапазонного запиту, де потрібно знайти всі товари у визначеному діапазоні цін: `range_query_tree` та `range_query_dict` .

5. Виміряйте загальний час виконання діапазонного запиту для кожної структури, використовуючи `timeit`.

6. Для кожної структури виконайте діапазонний запит 100 разів, щоб обчислити середній час виконання.

7. Виведіть загальний час виконання діапазонного запиту для кожної структури, зокрема, скільки часу займає виконання 100 запитів для `OOBTree` та `dict`.

**Технічні умови**

1. Використовуйте лише `OOBTree` та стандартний словник `dict` для порівняння.

2. Реалізуйте окремі функції для додавання товару в структуру: `add_item_to_tree`, `add_item_to_dict`.

3. Реалізуйте окремі функції для діапазонного запиту: `range_query_tree`, `range_query_dict`.

4. Використовуйте бібліотеку `timeit` для точного вимірювання продуктивності кожної структури.

5. Вимірювання часу має відбуватися для 100 діапазонних запитів для кожної структури.

**Критерії прийняття**

1. Програма коректно виконує діапазонний запит і повертає точні результати для обох структур: `OOBTree` та `dict`.

2. Дані коректно додаються до кожної структури.

3. `OOBTree` використовує метод `items(min, max)` для швидкого доступу до діапазону значень.

4. Словник `dict` реалізовує діапазонний запит за допомогою лінійного пошуку.

5. Порівняльні результати часу виконання для `OOBTree` і `dict` коректно виведені.

6. Очікується, що `OOBTree` покаже кращі результати для діапазонних запитів через відсортовану структуру даних.

7. Вивід результатів включає загальний час виконання діапазонного запиту для кожної структури з форматом:

    Total range_query time for OOBTree: X.XXXXXX secondsTotal range_query time for Dict: X.XXXXXX seconds



In [40]:
import csv
import timeit
from pprint import pprint

from BTrees.OOBTree import OOBTree

In [47]:
# Завантаження даних з файлу
def load_data(file_path):
    records = []
    with open(file_path, newline="") as file:
        reader = csv.DictReader(file)
        for row in reader:
            record = {
                "ID": int(row["ID"]),
                "Name": row["Name"],
                "Category": row["Category"],
                "Price": float(row["Price"]),
            }
            records.append(record)
    return records


# Додавання запису в OOBTree
def add_item_to_tree(tree, item):
    tree[item["ID"]] = item


# Додавання запису в dict
def add_item_to_dict(dictionary, item):
    dictionary[item["ID"]] = item


""" 3. Реалізуйте окремі функції для діапазонного запиту: `range_query_tree`, `range_query_dict`. """


# Діапазонний запит для OOBTree
def range_query_tree(tree: OOBTree, min_price: float, max_price: float) -> dict:
    return {k: v for k, v in tree.items() if min_price <= v["Price"] <= max_price}


# Діапазонний запит для dict
def range_query_dict(dictionary: dict, min_price: float, max_price: float) -> dict:
    return {k: v for k, v in dictionary.items() if min_price <= v["Price"] <= max_price}


# Функція для вимірювання часу виконання
def compare_time(
    file_path, min_price: float = 50, max_price: float = 100, iterations: int = 100
):

    # Завантаження даних з файлу
    csv_data = load_data(file_path)

    # Створення OOBTree
    tree = OOBTree()
    # Створення dict
    dictionary = {}

    # Додавання даних в OOBTree та dict
    for item in csv_data:
        add_item_to_tree(tree, item)
        add_item_to_dict(dictionary, item)

    # Вимірювання часу виконання
    tree_time = timeit.timeit(
        lambda: range_query_tree(tree, min_price, max_price), number=iterations
    )
    dict_time = timeit.timeit(
        lambda: range_query_dict(dictionary, min_price, max_price), number=iterations
    )
    return tree_time, dict_time

In [48]:
# Шлях до файлу
file_path = "data/generated_items_data.csv"
# Налаштування
min_price = 50
max_price = 100
iterations = 100

tree_time, dict_time = compare_time(file_path, min_price, max_price, iterations)

print(f"Total range_query time for OOBTree: {tree_time:6f} seconds")
print(f"Total range_query time for Dict:    {dict_time:6f} seconds")

Total range_query time for OOBTree: 4.082718 seconds
Total range_query time for Dict:    1.036252 seconds


OOBTree — це структура даних з модуля BTrees. Особливість OOBTree у відсортованих ключах, що забезпечує швидкі операції за ключем (`ID` в нашому випадку). В нашому випадку пошук здійснюється по значенням `price`, що вимагає додаткового перебору.