# Лабораторна робота №7  
## Тема: Структури даних: дерева, купи, геш-таблиці
## Виконав: Варакута Олександр
## група: КІ-24-1


## Мета роботи: Вивчити принципи побудови та використання структур даних *дерево*, *купа*та *геш-таблиця*, реалізувати їх мовою Python і проаналізувати асимптотичну складність основних операцій.


## 1. Теоретичні відомості

**Дерево** — це ієрархічна структура даних, що складається з вузлів,
з’єднаних відношенням «батько–нащадок». Існує один кореневий вузол,
а кожен вузол може мати піддерева.

**Купа** — це повне бінарне дерево, яке задовольняє властивість купи:
- **max-heap** — значення в батьківському вузлі не менше за значення нащадків;
- **min-heap** — значення в батьківському вузлі не більше за значення нащадків.

**Геш-таблиця** — це структура даних для зберігання пар «ключ–значення»,
у якій доступ до елементів здійснюється за допомогою геш-функції.

У середньому час доступу до елемента в геш-таблиці дорівнює:
$$
T(n) = O(1)
$$


## 2.Дерева

### 2.1 Реалізація бінарного дерева


In [23]:
def BinaryTree(root):
    return [root, [], []]

def insertLeft(tree, value):
    subtree = tree.pop(1)
    if len(subtree) > 0:
        tree.insert(1, [value, subtree, []])
    else:
        tree.insert(1, [value, [], []])
    return tree

def insertRight(tree, value):
    subtree = tree.pop(2)
    if len(subtree) > 0:
        tree.insert(2, [value, [], subtree])
    else:
        tree.insert(2, [value, [], []])
    return tree

def getRootVal(tree):
    return tree[0]

def getLeftChild(tree):
    return tree[1]

def getRightChild(tree):
    return tree[2]


### 2.2 Самостійне завдання: створення та модифікація дерева


In [24]:
tree = BinaryTree(10)
insertLeft(tree, 5)
insertRight(tree, 15)
insertLeft(getLeftChild(tree), 3)
insertRight(getLeftChild(tree), 7)

tree


[10, [5, [3, [], []], [7, [], []]], [15, [], []]]

### 2.3 Видалення лівої гілки дерева


In [25]:
def deleteLeftSubtree(tree):
    tree[1] = []
    return tree

deleteLeftSubtree(tree)


[10, [], [15, [], []]]

### 2.4 Асимптотична складність операцій з деревом

Нехай $n$ — кількість вузлів дерева.

- Пошук:
$$
T_{\text{avg}}(n) = O(\log n), \quad T_{\text{worst}}(n) = O(n)
$$

- Вставка:
$$
T_{\text{avg}}(n) = O(\log n), \quad T_{\text{worst}}(n) = O(n)
$$

- Видалення:
$$
T_{\text{avg}}(n) = O(\log n), \quad T_{\text{worst}}(n) = O(n)
$$


## 3.Купа

### 3.1 Реалізація MAX-HEAP



In [26]:
class MaxHeap:
    def __init__(self):
        self.heap = []

    def _parent(self, i):
        return (i - 1) // 2

    def _left(self, i):
        return 2 * i + 1

    def _right(self, i):
        return 2 * i + 2

    def _heapify_up(self, i):
        while i > 0 and self.heap[self._parent(i)] < self.heap[i]:
            self.heap[self._parent(i)], self.heap[i] = self.heap[i], self.heap[self._parent(i)]
            i = self._parent(i)

    def _heapify_down(self, i):
        size = len(self.heap)
        largest = i

        left = self._left(i)
        right = self._right(i)

        if left < size and self.heap[left] > self.heap[largest]:
            largest = left
        if right < size and self.heap[right] > self.heap[largest]:
            largest = right

        if largest != i:
            self.heap[i], self.heap[largest] = self.heap[largest], self.heap[i]
            self._heapify_down(largest)

    def insert(self, value):
        self.heap.append(value)
        self._heapify_up(len(self.heap) - 1)

    def extract_max(self):
        if not self.heap:
            return None
        if len(self.heap) == 1:
            return self.heap.pop()

        root = self.heap[0]
        self.heap[0] = self.heap.pop()
        self._heapify_down(0)
        return root

    def __str__(self):
        return f"MaxHeap: {self.heap}"



### 3.2 Генерація купи з випадкового масиву


In [27]:
import random

data = random.sample(range(1, 50), 10)

heap = MaxHeap()
for x in data:
    heap.insert(x)

print("Початковий масив:", data)
print("Купа після побудови:")
print(heap)



Початковий масив: [49, 28, 30, 11, 44, 8, 23, 26, 36, 18]
Купа після побудови:
MaxHeap: [49, 44, 30, 36, 28, 8, 23, 11, 26, 18]


### 3.3 Додавання елемента  
Номер у списку групи = **5**


In [28]:
heap.insert(5)
print("Купа після додавання елемента 5:")
print(heap)


Купа після додавання елемента 5:
MaxHeap: [49, 44, 30, 36, 28, 8, 23, 11, 26, 18, 5]


### 3.4 Вилучення максимального елемента з купи


In [29]:
max_element = heap.extract_max()
print("Вилучений максимальний елемент:", max_element)
print("Купа після вилучення максимального елемента:")
print(heap)


Вилучений максимальний елемент: 49
Купа після вилучення максимального елемента:
MaxHeap: [44, 36, 30, 26, 28, 8, 23, 11, 5, 18]


### 3.5 Пояснення результатів

Після додавання елемента зі значенням $5$ купа автоматично
перебудовується з урахуванням властивості **max-heap**.
Під час вилучення максимального елемента з купи видаляється
кореневий вузол, після чого структура купи знову відновлюється.


### 3.6 Асимптотична складність операцій з купою

Нехай $n$ — кількість елементів у купі.

- **Отримання максимального елемента**:
$$
T(n) = O(1)
$$

- **Вставка елемента**:
$$
T_{\text{avg}}(n) = O(\log n), \quad
T_{\text{worst}}(n) = O(\log n)
$$

- **Видалення максимального елемента**:
$$
T_{\text{avg}}(n) = O(\log n), \quad
T_{\text{worst}}(n) = O(\log n)
$$


## 4. Геш-Таблиця

### 4.1 Методи розв’язання колізій

Колізії виникають, коли:
$$
h(k_1) = h(k_2), \quad k_1 \neq k_2
$$

Основні методи:
- ланцюжкове гешування;
- відкрита адресація;
- подвійне гешування.


### 4.2 Реалізація геш-таблиці з ланцюжковим гешуванням


In [30]:
class HashTable:
    def __init__(self, size=2000):
        self.size = size
        self.table = [[] for _ in range(size)]

    def hash_function(self, key):
        return hash(key) % self.size

    def insert(self, key, value):
        idx = self.hash_function(key)
        self.table[idx].append((key, value))

    def search(self, key):
        idx = self.hash_function(key)
        for k, v in self.table[idx]:
            if k == key:
                return v
        return None

    def delete(self, key):
        idx = self.hash_function(key)
        self.table[idx] = [(k, v) for k, v in self.table[idx] if k != key]


### 4.3 Тестування з різними типами даних


In [31]:
import time

int_keys = list(range(1000))
str_keys = [f"key{i}" for i in range(1000)]
tuple_keys = [(i, i+1) for i in range(1000)]

def test_hash(keys):
    ht = HashTable()
    t0 = time.perf_counter()
    for k in keys:
        ht.insert(k, "val")
    insert_t = time.perf_counter() - t0

    t0 = time.perf_counter()
    for k in keys:
        ht.search(k)
    search_t = time.perf_counter() - t0

    t0 = time.perf_counter()
    for k in keys:
        ht.delete(k)
    delete_t = time.perf_counter() - t0

    return insert_t, search_t, delete_t


In [32]:
results = {
    "Цілі числа": test_hash(int_keys),
    "Рядки": test_hash(str_keys),
    "Кортежі": test_hash(tuple_keys)
}

results


{'Цілі числа': (0.0007086000114213675,
  0.0004073000163771212,
  0.001587499980814755),
 'Рядки': (0.0008525000012014061,
  0.0009688999853096902,
  0.0012965000059921294),
 'Кортежі': (0.0008699999889358878,
  0.001174200006062165,
  0.002215099986642599)}

### 4.4 Порівняння та аналіз результатів

Експеримент підтверджує, що для різних типів даних
час виконання операцій відрізняється незначно.

У середньому:
$$
T_{\text{avg}}(n) = O(1)
$$

У найгіршому випадку:
$$
T_{\text{worst}}(n) = O(n)
$$

Збільшення часу пояснюється складністю обчислення геш-функції
для різних типів даних.


## 5.Контрольні питання

### 1. Чим відрізняється структура бінарне дерево від бінарного дерева пошуку?

**Бінарне дерево** — це ієрархічна структура даних, у якій кожен вузол
може мати не більше двох нащадків (лівого та правого).  
Для бінарного дерева **не накладається жодних обмежень** на значення,
що зберігаються у вузлах.

**Бінарне дерево пошуку (Binary Search Tree, BST)** — це спеціальний
випадок бінарного дерева, для якого виконується впорядковуюча умова:

$$
\forall\, v:\quad
\text{value(left subtree)} < \text{value}(v) < \text{value(right subtree)}
$$

Завдяки цій властивості бінарне дерево пошуку дозволяє виконувати
пошук, вставку та видалення елементів у середньому за логарифмічний час.

Основна відмінність полягає в тому, що:
- у звичайному бінарному дереві структура не впорядкована;
- у бінарному дереві пошуку структура організована за значеннями ключів.


### 2. Чим відрізняється структура бінарне дерево від бінарної купи?

**Бінарне дерево** не має строгих обмежень на форму або значення вузлів.
Воно може бути неповним і не обов’язково впорядкованим.

**Бінарна купа** — це повне бінарне дерево, яке задовольняє
властивість купи.

Для **max-heap**:
$$
\text{value(parent)} \ge \text{value(children)}
$$

Для **min-heap**:
$$
\text{value(parent)} \le \text{value(children)}
$$

Основні відмінності:
- купа завжди є **повним бінарним деревом**;
- купа підтримує доступ лише до мінімального або максимального елемента;
- бінарне дерево може використовуватись для ієрархій, а купа — для
  пріоритетної обробки даних.

  ### 3. Які існують типи дерев? Опишіть їхні основні характеристики та переваги.

Основні типи дерев:

1. **Бінарне дерево**  
   Кожен вузол має не більше двох нащадків.  
   Перевага — простота структури та реалізації.

2. **Бінарне дерево пошуку (BST)**  
   Значення вузлів впорядковані.  
   Перевага — ефективний пошук у середньому випадку.

3. **Збалансовані дерева (AVL, червоно-чорні)**  
   Підтримують баланс висоти дерева.  
   Перевага — гарантована складність операцій:
   $$
   T(n) = O(\log n)
   $$

4. **B-дерева**  
   Використовуються у файлових системах та базах даних.  
   Перевага — мінімальна кількість звернень до пам’яті.

5. **N-арні дерева**  
   Кожен вузол може мати більше двох нащадків.  
   Перевага — зручне представлення складних ієрархій.

### 4. Наведіть приклади задач, які ефективно вирішуються за допомогою дерев.

Дерева ефективно використовуються для розв’язання таких задач:
- представлення файлових систем;
- зберігання ієрархічних даних (XML, HTML, JSON);
- побудова синтаксичних дерев у компіляторах;
- реалізація індексів у базах даних;
- пошук та сортування даних (BST, AVL-дерева).

Перевага дерев полягає у логарифмічній складності доступу до даних
у середньому випадку.

### 5. Як організована купа? Опишіть алгоритми додавання та вилучення елементів з купи.

Купа організована як **повне бінарне дерево**, яке зазвичай зберігається
у вигляді масиву.

Для елемента з індексом $i$:
- батьківський вузол: $\lfloor (i - 1) / 2 \rfloor$;
- лівий нащадок: $2i + 1$;
- правий нащадок: $2i + 2$.

**Додавання елемента**:
1. елемент додається в кінець масиву;
2. виконується підйом елемента (heapify up) для відновлення властивості купи.

**Вилучення максимального елемента**:
1. кореневий елемент зберігається як результат;
2. останній елемент переміщується в корінь;
3. виконується опускання елемента (heapify down).

Складність обох операцій:
$$
T(n) = O(\log n)
$$

### 6. Які задачі можна ефективно вирішити за допомогою купи? Наведіть приклади.

Купи ефективно використовуються для:
- реалізації черг з пріоритетом;
- алгоритму Дейкстри;
- алгоритму Прима;
- сортування методом купи (Heap Sort);
- планування задач у операційних системах.

Основна перевага купи — швидкий доступ до елемента з найвищим
(або найнижчим) пріоритетом.

### 7. Як геш-функція використовується для зберігання та пошуку даних у геш-таблиці?

Геш-функція перетворює ключ у числове значення — індекс таблиці:

$$
h(key) \rightarrow index
$$

Під час **зберігання** даних ключ обробляється геш-функцією, і значення
записується у відповідну комірку таблиці.

Під час **пошуку** за ключем знову обчислюється геш-значення,
що дозволяє безпосередньо перейти до потрібної комірки.

У середньому складність операцій:
$$
T_{\text{avg}}(n) = O(1)
$$

У найгіршому випадку (колізії):
$$
T_{\text{worst}}(n) = O(n)
$$
