## Лабораторна робота № 7 Структури даних дерево, купа, геш-таблиця.
## Мета: засвоїти основні функції та алгоритми роботи з деревами та купою засобами Python.
### Виконав: Яцентюк Євгеній, група: КІ-24-1 

**[GitHub](https://github.com/kefir4ikk)**

## 1. Реалізація бінарного дерева на списках
Використовуємо базові функції для роботи з деревом, які подані в методичних вказівках. Дерево представляється як список списків: `[root, left_child, right_child]`.

In [6]:
def BinaryTree(r):
    return [r, [], []]

def insertLeft(root, newBranch):
    t = root.pop(1)
    if len(t) > 1:
        root.insert(1, [newBranch, t, []])
    else:
        root.insert(1, [newBranch, [], []])
    return root

def insertRight(root, newBranch):
    t = root.pop(2)
    if len(t) > 1:
        root.insert(2, [newBranch, [], t])
    else:
        root.insert(2, [newBranch, [], []])
    return root

def getRootVal(root):
    return root[0]

def getLeftChild(root):
    return root[1]

def getRightChild(root):
    return root[2]



my_tree = BinaryTree(10)
insertLeft(my_tree, 5)
insertRight(my_tree, 15)
insertLeft(getLeftChild(my_tree), 2)
insertRight(getLeftChild(my_tree), 7)
insertRight(getRightChild(my_tree), 20)

print("Початкове дерево:", my_tree)


def delete_branch(root, val):
   
    if not root:
        return

    left = getLeftChild(root)
    right = getRightChild(root)

    
    if len(left) > 0 and left[0] == val:
        print(f"Знайшли {val} зліва. Видаляємо.")
        root[1] = []
        return

    
    if len(right) > 0 and right[0] == val:
        print(f"Знайшли {val} справа. Видаляємо.")
        root[2] = [] 
        return

   
    if len(left) > 0:
        delete_branch(left, val)
    if len(right) > 0:
        delete_branch(right, val)


print("\nВидаляємо гілку, що починається з 5...")
delete_branch(my_tree, 5)
print("Дерево після видалення:", my_tree)

Початкове дерево: [10, [5, [2, [], []], [7, [], []]], [15, [], [20, [], []]]]

Видаляємо гілку, що починається з 5...
Знайшли 5 зліва. Видаляємо.
Дерево після видалення: [10, [], [15, [], [20, [], []]]]


**Оцінка асимптотичної складності (Дерева)**
* **Search:** У середньому $O(\log n)$, але якщо дерево вироджене (в лінію) — $O(n)$.
* **Insert:** Якщо знаємо куди вставляти — $O(1)$, якщо треба шукати місце — $O(n)$.
* **Delete:** Пошук елемента займає $O(n)$ у найгіршому випадку, саме видалення посилання — $O(1)$.

## 2. Робота зі структурою Max-Heap
Купа реалізується на базі звичайного списку, де індексація починається з 1 

In [7]:
import random


heap_list = [0]
current_size = 0


def swap(i, j):
    temp = heap_list[i]
    heap_list[i] = heap_list[j]
    heap_list[j] = temp


def float_up(i):
    while i // 2 > 0:
      
        if heap_list[i] > heap_list[i // 2]:
            swap(i, i // 2)
        i = i // 2


def sink_down(i):
    while (i * 2) <= current_size:
        mc = max_child(i)
        if heap_list[i] < heap_list[mc]:
            swap(i, mc)
            i = mc
        else:
            break


def max_child(i):
    if i * 2 + 1 > current_size:
        return i * 2
    else:
        if heap_list[i*2] > heap_list[i*2+1]:
            return i * 2
        else:
            return i * 2 + 1


def insert_heap(k):
    global current_size
    heap_list.append(k)
    current_size += 1
    float_up(current_size)


def delete_max():
    global current_size
    if current_size == 0:
        return None
    retval = heap_list[1]
    heap_list[1] = heap_list[current_size]
    current_size -= 1
    heap_list.pop()
    sink_down(1)
    return retval


def build_heap(alist):
    global current_size, heap_list
    current_size = len(alist)
    heap_list = [0] + alist[:]
    i = len(alist) // 2
    while (i > 0):
        sink_down(i)
        i -= 1


random_nums = [random.randint(1, 100) for _ in range(8)]
print("Випадкові числа:", random_nums)

build_heap(random_nums)
print("Побудована Max-Heap:", heap_list)


my_variant = 12
print(f"Вставляємо {my_variant}...")
insert_heap(my_variant)
print("Купа після вставки:", heap_list)


removed = delete_max()
print(f"Вилучено максимум: {removed}")
print("Купа після вилучення:", heap_list)

Випадкові числа: [4, 17, 24, 79, 24, 53, 94, 2]
Побудована Max-Heap: [0, 94, 79, 53, 17, 24, 4, 24, 2]
Вставляємо 12...
Купа після вставки: [0, 94, 79, 53, 17, 24, 4, 24, 2, 12]
Вилучено максимум: 94
Купа після вилучення: [0, 79, 24, 53, 17, 12, 4, 24, 2]


**Оцінка асимптотичної складності**
* **Insert:** $O(\log n)$ — елемент може піднятися від низу до кореня (висота дерева).
* **Delete Max:** $O(\log n)$ — після заміни кореня треба опустити елемент вниз.
* **Search Max:** $O(1)$ — завжди перший елемент.

## 3. Реалізація Геш-таблиці методом ланцюжків
Колізії вирішуються методом ланцюжків: якщо індекси збігаються, елементи зберігаються у списку всередині комірки.

In [8]:
import time

class MyHashTable:
    def __init__(self, size):
        self.size = size
        
        self.table = []
        for _ in range(size):
            self.table.append([])

    
    def _hash(self, key):
        return hash(key) % self.size

   
    def insert(self, key, value):
        index = self._hash(key)
        bucket = self.table[index]
        
       
        for i in range(len(bucket)):
            if bucket[i][0] == key:
                bucket[i][1] = value
                return
        
       
        bucket.append([key, value])

  
    def search(self, key):
        index = self._hash(key)
        bucket = self.table[index]
        for k, v in bucket:
            if k == key:
                return v
        return None

   
    def delete(self, key):
        index = self._hash(key)
        bucket = self.table[index]
        for i in range(len(bucket)):
            if bucket[i][0] == key:
                bucket.pop(i)
                return True
        return False


ht = MyHashTable(10)


ht.insert(100, "Сто")           
ht.insert("apple", "Яблуко")    
ht.insert(110, "Сто десять")   

print("Пошук 'apple':", ht.search("apple"))
print("Пошук 100:", ht.search(100))
print("Пошук 110 (колізія):", ht.search(110))


start = time.time()
for i in range(1000):
    ht.insert(i, i*2)
end = time.time()
print(f"Час вставки 1000 елементів: {end - start:.5f} сек")

start = time.time()
ht.search(500)
end = time.time()
print(f"Час пошуку елемента: {end - start:.6f} сек")

Пошук 'apple': Яблуко
Пошук 100: Сто
Пошук 110 (колізія): Сто десять
Час вставки 1000 елементів: 0.00299 сек
Час пошуку елемента: 0.000000 сек


## Відповіді на контрольні запитання

**1. Чим відрізняється структура бінарне дерево від бінарного дерева пошуку?**
*Бінарне дерево* — це структура, де кожен вузол має не більше двох нащадків, але немає строгих правил щодо розміщення значень.
*Бінарне дерево пошуку (BST)* — це впорядковане бінарне дерево. У ньому для кожного вузла виконується правило: всі значення в лівому піддереві менші за значення вузла, а всі значення в правому — більші (або рівні). Це дозволяє швидко знаходити елементи.

**2. Чим відрізняється структура бінарне дерево від бінарної купи?**
* **Впорядкованість:** У купі (Heap) батьківський елемент завжди має пріоритет над нащадками (наприклад, у `max-heap` батько завжди більший за дітей).У звичайному бінарному дереві такого правила немає.
* **Форма:** Купа завжди є *повним* бінарним деревом (заповнюється зліва направо, без пропусків), що дозволяє зберігати її у вигляді масиву. Звичайне дерево може мати довільну форму.

**3. Які існують типи дерев? Опишіть їхні основні характеристики та переваги.**
* **Бінарні дерева:** Кожен вузол має до 2 нащадків. *Перевага:* простота реалізації.
* **Бінарні дерева пошуку (BST):** Впорядковані бінарні дерева.*Перевага:* швидкий пошук ($O(\log n)$ у збалансованому вигляді).
* **Купи (Heaps):** Дерева з властивістю пріоритету. *Перевага:* миттєвий доступ до мінімального або максимального елемента ($O(1)$).
* **Збалансовані дерева (AVL, Червоно-чорні):** Автоматично підтримують мінімальну висоту. *Перевага:* гарантують логарифмічний час пошуку навіть у найгіршому випадку.

**4. Наведіть приклади задач, які ефективно вирішуються за допомогою дерев.**
* Зберігання ієрархічних даних (файлова система комп'ютера, структура HTML-сторінки).
* Швидкий пошук і сортування даних (BST).
* Організація баз даних (індекси).
* Синтаксичний аналіз коду (компілятори будують дерево розбору).

**5. Як організована купа? Опишіть алгоритми додавання та вилучення елементів з купи.**
Купа організована як повне бінарне дерево, але зберігається у вигляді масиву. Для елемента з індексом $i$: лівий нащадок — $2i$, правий — $2i+1$, батько — $i//2$ .
* **Додавання (Insert):** Елемент додається в кінець масиву (на дно купи). Далі він порівнюється з батьком: якщо порядок порушено, вони міняються місцями. Це повторюється, доки елемент не стане на своє місце (процес "спливання").
* **Вилучення (Extract Max/Min):** Видаляється корінь (верхівка). На його місце ставиться останній елемент масиву. Потім цей елемент порівнюється з нащадками і міняється місцями з більшим/меншим із них, "просіюючись" вниз, доки структура не відновиться.

**6. Які задачі можна ефективно вирішити за допомогою купи? Наведіть приклади.**
* **Черги з пріоритетом:** Планування задач в операційній системі, де важливіші процеси виконуються першими.
* **Сортування (Heapsort):** Ефективний алгоритм сортування масиву без використання додаткової пам'яті.
* **Пошук шляху:** Алгоритм Дейкстри використовує купу для вибору найближчої вершини графа.

**7. Як геш-функція використовується для зберігання та пошуку даних в хеш-таблиці?**
Геш-функція перетворює вхідний ключ (наприклад, рядок чи ім'я) у число — індекс масиву.
* **Зберігання:** Обчислюється індекс, і дані кладуться в масив за цим індексом.
* **Пошук:** Знову обчислюється індекс для ключа, і програма одразу звертається до потрібної комірки пам'яті, не перебираючи весь список. Це забезпечує швидкість $O(1)$.

**8. Опишіть методи вирішення колізій в хеш-таблицях. Які їхні переваги та недоліки?**
*Колізія* — це ситуація, коли два різних ключі дають однаковий хеш-індекс.
* **Метод ланцюжків (Chaining):** У кожній комірці таблиці зберігається список. При колізії новий елемент додається в цей список.
    * *Перевага:* Таблиця може зберігати більше елементів, ніж її розмір; просте видалення.
    * *Недолік:* Витрати пам'яті на списки; при багатьох колізіях швидкість падає.
* **Відкрита адресація (Open Addressing):** Якщо комірка зайнята, алгоритм шукає іншу вільну комірку за певним правилом (наприклад, наступну).
    * *Перевага:* Не потребує додаткової пам'яті (списків).
    * *Недолік:* Складне видалення; може виникати кластеризація (скупчення даних), що сповільнює роботу.
