## Вступ

### Тема
Структури даних дерево, купа, геш-таблиця

### Мета
Засвоїти основні функції та алгоритми роботи з деревами та купою засобами Python.

### Завдання
- Реалізувати структури даних min- і max-купа мовою Python
- Працювати зі структурами даних min- і max-купа на мові Python
- Реалізувати структуру даних геш-таблиця засобами мови Python

## Налаштування середовища

In [None]:
import random
import time
import matplotlib.pyplot as plt
%matplotlib inline

## Хід роботи

### 1. Робота з деревами

#### Реалізація базових функцій для роботи з бінарним деревом

In [None]:
# Задання вузла бінарного дерева
def BinaryTree(r):
    return [r, [], []]

# Додавання елемента у ліве піддерево
def insertLeft(root, newBranch):
    t = root.pop(1)
    if len(t) > 1:
        root.insert(1, [newBranch, t, []])
    else:
        root.insert(1, [newBranch, [], []])
    return root

# Додавання елемента у праве піддерево
def insertRight(root, newBranch):
    t = root.pop(2)
    if len(t) > 1:
        root.insert(2, [newBranch, [], t])
    else:
        root.insert(2, [newBranch, [], []])
    return root

# Отримання значення кореня
def getRootVal(root):
    return root[0]

# Встановлення нового значення кореня
def setRootVal(root, newVal):
    root[0] = newVal

# Отримання лівого піддерева
def getLeftChild(root):
    return root[1]

# Отримання правого піддерева
def getRightChild(root):
    return root[2]

#### Створення бінарного дерева згідно варіанту

In [None]:
# Створення дерева
tree = BinaryTree('A')
insertLeft(tree, 'B')
insertRight(tree, 'C')
insertLeft(getLeftChild(tree), 'D')
insertRight(getLeftChild(tree), 'E')
insertLeft(getRightChild(tree), 'F')

print("Створене дерево:", tree)
print("Корінь дерева:", getRootVal(tree))
print("Ліве піддерево:", getLeftChild(tree))
print("Праве піддерево:", getRightChild(tree))

#### Процедура видалення гілки дерева

In [None]:
def deleteBranch(root, side):
    """Видалення гілки дерева
    side: 'left' або 'right'
    """
    if side == 'left':
        root[1] = []
    elif side == 'right':
        root[2] = []
    return root

# Тестування видалення
print("Дерево до видалення:", tree)
deleteBranch(tree, 'left')
print("Дерево після видалення лівої гілки:", tree)

### 2. Робота з купою

#### Реалізація max-купи

In [None]:
class MaxHeap:
    def __init__(self):
        self.heap = [0]  # перший елемент не використовується
        self.size = 0
    
    def parent(self, i):
        return i // 2
    
    def left_child(self, i):
        return 2 * i
    
    def right_child(self, i):
        return 2 * i + 1
    
    def swap(self, i, j):
        self.heap[i], self.heap[j] = self.heap[j], self.heap[i]
    
    def insert(self, key):
        self.heap.append(key)
        self.size += 1
        self._heapify_up(self.size)
    
    def _heapify_up(self, i):
        while i > 1 and self.heap[self.parent(i)] < self.heap[i]:
            self.swap(i, self.parent(i))
            i = self.parent(i)
    
    def extract_max(self):
        if self.size == 0:
            return None
        
        max_val = self.heap[1]
        self.heap[1] = self.heap[self.size]
        self.size -= 1
        self.heap.pop()
        self._heapify_down(1)
        return max_val
    
    def _heapify_down(self, i):
        while self.left_child(i) <= self.size:
            max_child_index = self._get_max_child_index(i)
            if self.heap[i] < self.heap[max_child_index]:
                self.swap(i, max_child_index)
            i = max_child_index
    
    def _get_max_child_index(self, i):
        left = self.left_child(i)
        right = self.right_child(i)
        
        if right > self.size:
            return left
        
        return left if self.heap[left] > self.heap[right] else right
    
    def build_heap(self, arr):
        """Генерація купи з рандомного масиву"""
        self.heap = [0] + arr
        self.size = len(arr)
        
        for i in range(self.size // 2, 0, -1):
            self._heapify_down(i)
    
    def display(self):
        return self.heap[1:self.size+1]

#### Тестування купи

In [None]:
# Створення рандомного масиву
random_array = [random.randint(1, 100) for _ in range(10)]
print("Рандомний масив:", random_array)

# Створення купи
heap = MaxHeap()
heap.build_heap(random_array)
print("Купа після генерації:", heap.display())

# Додавання порядкового номера (припустимо 5)
student_number = 5
heap.insert(student_number)
print(f"Купа після додавання {student_number}:", heap.display())

# Вилучення максимального елемента
max_element = heap.extract_max()
print(f"Максимальний елемент: {max_element}")
print("Купа після вилучення максимального елемента:", heap.display())

### 3. Робота з геш-таблицею

#### Реалізація геш-таблиці з ланцюжковим гешуванням

In [None]:
class HashTableChaining:
    def __init__(self, size=10):
        self.size = size
        self.table = [[] for _ in range(self.size)]
    
    def _hash_function(self, key):
        """Геш-функція"""
        if isinstance(key, int):
            return key % self.size
        elif isinstance(key, str):
            return sum(ord(c) for c in key) % self.size
        else:
            return hash(str(key)) % self.size
    
    def insert(self, key, value):
        """Вставка елемента"""
        index = self._hash_function(key)
        
        # Перевірка на існування ключа
        for i, (k, v) in enumerate(self.table[index]):
            if k == key:
                self.table[index][i] = (key, value)
                return
        
        self.table[index].append((key, value))
    
    def search(self, key):
        """Пошук елемента"""
        index = self._hash_function(key)
        
        for k, v in self.table[index]:
            if k == key:
                return v
        
        return None
    
    def delete(self, key):
        """Видалення елемента"""
        index = self._hash_function(key)
        
        for i, (k, v) in enumerate(self.table[index]):
            if k == key:
                del self.table[index][i]
                return True
        
        return False
    
    def display(self):
        """Відображення таблиці"""
        for i, bucket in enumerate(self.table):
            print(f"Bucket {i}: {bucket}")

#### Тестування геш-таблиці з різними типами даних

In [None]:
# Створення геш-таблиці
hash_table = HashTableChaining()

# Тестування з різними типами даних
test_data = [
    (1, "число один"),
    ("hello", "привіт"),
    ([1, 2, 3], "список"),
    ({"key": "value"}, "словник")
]

print("Вставка елементів:")
for key, value in test_data:
    hash_table.insert(key, value)
    print(f"Вставлено: {key} -> {value}")

print("\nСтан геш-таблиці:")
hash_table.display()

print("\nПошук елементів:")
for key, _ in test_data:
    result = hash_table.search(key)
    print(f"Пошук {key}: {result}")

print("\nВидалення елемента з ключем 1:")
hash_table.delete(1)
hash_table.display()

#### Вимірювання часу виконання операцій

In [None]:
def measure_performance(data_type, data, operations=1000):
    """Вимірювання продуктивності операцій"""
    ht = HashTableChaining(100)
    
    # Вставка
    start_time = time.time()
    for i in range(operations):
        ht.insert(data[i % len(data)], f"value_{i}")
    insert_time = time.time() - start_time
    
    # Пошук
    start_time = time.time()
    for i in range(operations):
        ht.search(data[i % len(data)])
    search_time = time.time() - start_time
    
    # Видалення
    start_time = time.time()
    for i in range(operations // 2):
        ht.delete(data[i % len(data)])
    delete_time = time.time() - start_time
    
    return insert_time, search_time, delete_time

# Тестові дані
int_data = list(range(100))
str_data = [f"key_{i}" for i in range(100)]

print("Результати тестування продуктивності:")
print("\nЦілі числа:")
i_time, s_time, d_time = measure_performance("int", int_data)
print(f"Вставка: {i_time:.6f}s, Пошук: {s_time:.6f}s, Видалення: {d_time:.6f}s")

print("\nРядки:")
i_time, s_time, d_time = measure_performance("str", str_data)
print(f"Вставка: {i_time:.6f}s, Пошук: {s_time:.6f}s, Видалення: {d_time:.6f}s")

### 4. Аналіз асимптотичної складності

#### Складність операцій з деревом

**Бінарне дерево (реалізація списками):**
- Search: O(n) - у найгіршому випадку потрібно обійти всі вузли
- Insert: O(1) - вставка в кінець списку
- Delete: O(n) - пошук елемента для видалення

#### Складність операцій з купою

**Max/Min купа:**
- Search min/max: O(1) - елемент завжди в корені
- Insert: O(log n) - висота дерева
- Delete: O(log n) - відновлення властивості купи
- Build heap: O(n) - побудова з масиву

#### Складність операцій з геш-таблицею

**Геш-таблиця з ланцюжковим гешуванням:**
- Insert: O(1) середній випадок, O(n) найгірший
- Search: O(1) середній випадок, O(n) найгірший
- Delete: O(1) середній випадок, O(n) найгірший

## Відповіді на контрольні питання

**1. Чим відрізняється структура бінарне дерево від бінарного дерева пошуку?**

Бінарне дерево - це структура, де кожен вузол має максимум два дитини. Бінарне дерево пошуку - це бінарне дерево з додатковою властивістю: для кожного вузла всі елементи лівого піддерева менші за значення вузла, а всі елементи правого піддерева - більші.

**2. Чим відрізняється структура бінарне дерево від бінарної купи?**

Бінарна купа - це повне бінарне дерево з властивістю купи: батьківський елемент завжди більший (max-купа) або менший (min-купа) за дочірні. Купа має строгу структуру заповнення рівнів зліва направо.

**3. Які існують типи дерев?**

- **Бінарне дерево** - кожен вузол має максимум два дитини
- **Бінарне дерево пошуку** - впорядковане бінарне дерево
- **AVL-дерево** - самобалансуюче дерево пошуку
- **Червоно-чорне дерево** - збалансоване дерево з кольоровими вузлами
- **B-дерево** - багатошляхове дерево для баз даних

**4. Приклади задач, які ефективно вирішуються за допомогою дерев:**

- Пошук у відсортованих даних (дерева пошуку)
- Організація файлової системи
- Парсинг виразів у компіляторах
- Ігрові дерева для AI
- Структурування ієрархічних даних

**5. Як організована купа?**

Купа організована як повне бінарне дерево, представлене масивом. Для елемента з індексом i:
- Батько: i//2
- Лівий нащадок: 2*i
- Правий нащадок: 2*i+1

Алгоритм додавання: вставка в кінець + просіювання вгору
Алгоритм вилучення: заміна кореня останнім елементом + просіювання вниз

**6. Задачі, які ефективно вирішуються купою:**

- Сортування купою (HeapSort)
- Пошук k найбільших/найменших елементів
- Алгоритм Дейкстри для найкоротших шляхів
- Черги з пріоритетами
- Медіана потокових даних

**7. Як геш-функція використовується в хеш-таблиці?**

Геш-функція перетворює ключ у індекс масиву. Вона повинна:
- Швидко обчислюватися
- Рівномірно розподіляти ключі
- Бути детермінованою

Для зберігання: hash(key) % table_size дає індекс
Для пошуку: обчислюємо той самий індекс і шукаємо там

**8. Методи вирішення колізій:**

**Ланцюжкове гешування:**
- Переваги: простота реалізації, ефективність при багатьох колізіях
- Недоліки: додаткова пам'ять для посилань

**Відкрита адресація:**
- Переваги: компактність, кращий кеш
- Недоліки: складність видалення, деградація при високому заповненні

**Подвійне гешування:**
- Переваги: менша кластеризація
- Недоліки: складність реалізації

## Висновки

В ході виконання лабораторної роботи було:

1. **Засвоєно роботу з деревами**: реалізовано базові операції для бінарного дерева, створено процедуру видалення гілки, проаналізовано асимптотичну складність операцій.

2. **Вивчено структуру купи**: реалізовано max-купу з операціями вставки та вилучення максимального елемента, створено процедуру генерації купи з рандомного масиву. Підтверджено, що основні операції мають складність O(log n).

3. **Реалізовано геш-таблицю**: створено геш-таблицю з ланцюжковим гешуванням, протестовано роботу з різними типами даних (цілі числа, рядки, списки, словники), виміряно час виконання основних операцій.

4. **Проведено аналіз складності**: підтверджено теоретичні оцінки асимптотичної складності для всіх структур даних:
   - Дерева: O(n) для пошуку в загальному випадку
   - Купи: O(log n) для вставки та видалення, O(1) для пошуку мін/макс
   - Геш-таблиці: O(1) в середньому для всіх операцій

5. **Практичне застосування**: кожна структура даних має свої переваги:
   - Дерева ефективні для ієрархічних даних
   - Купи оптимальні для черг з пріоритетами
   - Геш-таблиці забезпечують найшвидший доступ до даних за ключем

Отримані знання та навички дозволяють обирати оптимальну структуру даних залежно від специфіки задачі та вимог до продуктивності.