# Завдання на самостійну роботу: Кодування Гаффмена

## Варіант: Повідомлення для стиснення

Нехай задане повідомлення (варіант, виданий викладачем):
`MESSAGE_TO_ENCODE = "THIS IS A TEST MESSAGE"`

---

## 1. Побудова та візуалізація дерева кодів Гаффмена

### Функція для обчислення частот символів:

```python
from collections import Counter
import heapq
import networkx as nx
import matplotlib.pyplot as plt

def calculate_char_freq(message):
    """
    Обчислює список унікальних символів та список їх частот у повідомленні.
    """
    freq_map = Counter(message)
    chars = list(freq_map.keys())
    freqs = list(freq_map.values())
    return chars, freqs

# Приклад використання
message = "THIS IS A TEST MESSAGE"
chars_list, freqs_list = calculate_char_freq(message)
print(f"Символи: {chars_list}")
print(f"Частоти: {freqs_list}")

import heapq
import networkx as nx
import matplotlib.pyplot as plt
from collections import Counter

# Клас для вузла дерева Гаффмена
class MinHeapNode:
    def __init__(self, char, freq):
        self.char = char
        self.freq = freq
        self.left = None
        self.right = None

    # Оператори порівняння для MinHeap
    def __lt__(self, other):
        return self.freq < other.freq

    def __eq__(self, other):
        if not isinstance(other, MinHeapNode):
            return NotImplemented
        return self.freq == other.freq and self.char == other.char

# Функції для побудови, зберігання та друку кодів
codes = {}
def store_codes(root, str_code):
    if root is None:
        return
    if root.char != '<span class="math-inline">'\: \# '</span>' - внутрішній вузол
        codes[root.char] = str_code
    store_codes(root.left, str_code + "0")
    store_codes(root.right, str_code + "1")

# Функція для побудови дерева Гаффмена
def build_huffman_tree(chars, freqs):
    min_heap = []
    for i in range(len(chars)):
        heapq.heappush(min_heap, MinHeapNode(chars[i], freqs[i]))

    while len(min_heap) > 1:
        left = heapq.heappop(min_heap)
        right = heapq.heappop(min_heap)

        # Створення нового внутрішнього вузла
        top = MinHeapNode('<span class="math-inline">', left\.freq \+ right\.freq\)
top\.left \= left
top\.right \= right
heapq\.heappush\(min\_heap, top\)
return min\_heap\[0\] \# Повернути корінь дерева Гаффмена
\# Функція для візуалізації дерева Гаффмена
def visualize\_huffman\_tree\(root\)\:
G \= nx\.DiGraph\(\)
pos \= \{\}
q \= \[\(root, None, None, 0\)\] \# \(node, parent, edge\_label, depth\)
node\_id\_counter \= 0
while q\:
current\_node, parent\_id, edge\_label, depth \= q\.pop\(0\)
node\_id \= node\_id\_counter
node\_id\_counter \+\= 1
node\_label \= f"\{current\_node\.char\}\(\{current\_node\.freq\}\)" if current\_node\.char \!\= '</span>' else f"({current_node.freq})"
        G.add_node(node_id, label=node_label, pos=(depth, -node_id)) # Для кращої візуалізації
        pos[node_id] = (depth, -node_id) # Змінив вісь Y для чіткості

        if parent_id is not None:
            G.add_edge(parent_id, node_id, label=edge_label)

        if current_node.left:
            q.append((current_node.left, node_id, '0', depth + 1))
        if current_node.right:
            q.append((current_node.right, node_id, '1', depth + 1))

    # Для кращого візуального відображення, перераховуємо позиції
    # nx.drawing.nx_pydot.write_dot(G, 'huffman_tree.dot')
    # pos = nx.graphviz_layout(G, prog='dot') # Потребує Graphviz

    plt.figure(figsize=(12, 8))
    nx.draw(G, pos, with_labels=True, labels=nx.get_node_attributes(G, 'label'),
            node_size=4000, node_color="lightblue", font_size=10, font_weight="bold",
            arrowsize=20)
    edge_labels = nx.get_edge_attributes(G, 'label')
    nx.draw_edge_labels(G, pos, edge_labels=edge_labels, font_color='red', font_size=10)
    plt.title("Дерево кодів Гаффмена")
    plt.axis('off')
    plt.show()

# Головна частина для побудови та візуалізації
message_to_encode = "THIS IS A TEST MESSAGE"
chars, freqs = calculate_char_freq(message_to_encode)
huffman_root = build_huffman_tree(chars, freqs)
store_codes(huffman_root, "")

print("\n--- Коди Гаффмена ---")
for char, code in sorted(codes.items()):
    print(f"'{char}': {code}")

visualize_huffman_tree(huffman_root)

# Використання раніше отриманих кодів
encoded_string = "".join(codes[char] for char in message_to_encode)
print(f"\n--- Закодоване повідомлення ---")
print(f"Оригінальне повідомлення: '{message_to_encode}'")
print(f"Закодований рядок: {encoded_string}")

from collections import Counter

def calculate_char_freq(message):
    """
    Обчислює список унікальних символів та список їх частот у повідомленні.
    Повертає два списки: один для символів (chars) і один для їх частот (freq).
    """
    freq_map = Counter(message)
    chars = list(freq_map.keys())
    freqs = list(freq_map.values())
    return chars, freqs

# Приклад використання
test_message = "HELLO WORLD"
chars, freqs = calculate_char_freq(test_message)
print(f"Символи для '{test_message}': {chars}")
print(f"Частоти для '{test_message}': {freqs}")

def decode_huffman(root, encoded_string):
    """
    Декодує закодований рядок, використовуючи дерево Гаффмена.
    """
    ans = []
    curr = root
    for bit in encoded_string:
        if bit == '0':
            curr = curr.left
        else: # bit == '1'
            curr = curr.right

        # Якщо досягли листового вузла
        if curr.left is None and curr.right is None:
            ans.append(curr.char)
            curr = root # Повертаємося до кореня для наступного символу
    return "".join(ans)

# Декодування раніше закодованого повідомлення
decoded_string = decode_huffman(huffman_root, encoded_string)
print(f"\n--- Декодоване повідомлення ---")
print(f"Декодований рядок: '{decoded_string}'")

# Перевірка:
if message_to_encode == decoded_string:
    print("Декодування успішне: оригінальне повідомлення збігається з декодованим.")
else:
    print("Помилка декодування: оригінальне повідомлення не збігається з декодованим.")

# Відповіді на теоретичні запитання з теорії графів та алгоритмів на рядках

---

## 1. Що таке граф у термінах теорії графів? Наведіть приклади реальних ситуацій, де можна застосовувати графи.

**Граф** у термінах теорії графів — це абстрактна структура, що складається з множини **вершин** (або вузлів) та множини **ребер** (або зв'язків), що з'єднують ці вершини. Граф позначається як $G = (V, E)$, де $V$ — це множина вершин, а $E$ — множина ребер.

**Приклади реальних ситуацій, де застосовуються графи:**

* **Соціальні мережі:** Вершини — це користувачі, ребра — дружні зв'язки. Дозволяє аналізувати зв'язки, знаходити спільноти, поширювати інформацію.
* **Дорожні мережі:** Вершини — це перехрестя або міста, ребра — дороги. Використовується для побудови маршрутів, навігації, оптимізації трафіку.
* **Комп'ютерні мережі (Інтернет):** Вершини — це комп'ютери або сервери, ребра — мережеві з'єднання. Застосовується для маршрутизації даних, виявлення вразливостей.
* **Проєкти та залежності завдань:** Вершини — завдання проєкту, ребра — залежності між завданнями. Використовується для планування та управління проєктами.

---

## 2. Які основні види графів існують? Наведіть відмінності між орієнтованими і неорієнтованими графами.

**Основні види графів:**

* **Неорієнтовані графи:** Ребра не мають напрямку. Якщо ребро з'єднує A і B, зв'язок двосторонній.
* **Орієнтовані графи (діграфи):** Ребра мають напрямок. Ребро від A до B означає зв'язок лише від A до B.
* **Зважені графи:** Кожне ребро має числове значення ("вагу"), що представляє відстань, час, вартість тощо.
* **Незважені графи:** Ребра не мають ваг.
* **Циклічні/Ациклічні графи:** Містять/не містять цикли (шлях, що починається і закінчується в одній вершині).
* **Зв'язні графи:** Між будь-якими двома вершинами існує шлях.
* **Повні графи:** Кожна пара вершин з'єднана ребром.

**Відмінності між орієнтованими і неорієнтованими графами:**

| Характеристика           | **Неорієнтований граф** | **Орієнтований граф (Діграф)** |
| :----------------------- | :-------------------------------------------------------- | :------------------------------------------------------------------- |
| **Ребра** | Не мають напрямку. Позначаються як $\{u, v\}$.           | Мають напрямок. Позначаються як $(u, v)$, де $u \to v$.             |
| **Зв'язок** | Симетричний: якщо $u$ з'єднаний з $v$, то $v$ з'єднаний з $u$. | Асиметричний: якщо є ребро $(u, v)$, не означає, що є $(v, u)$.    |
| **Матриця суміжності** | Симетрична відносно головної діагоналі ($A_{ij} = A_{ji}$) | Несиметрична.                                                        |
| **Ступінь вершини** | Ступінь = кількість інцидентних ребер.                    | Є вхідний ступінь (кількість ребер, що входять) та вихідний ступінь. |

---

## 3. Як можна представити граф у пам’яті комп'ютера? Опишіть структури даних, які використовуються для зберігання графів.

У пам'яті комп'ютера графи можна представити різними способами:

1.  **Матриця суміжності (Adjacency Matrix):**
    * **Опис:** Двовимірний масив розміром $V \times V$. Елемент $A[i][j]$ = 1 (або вазі ребра), якщо є ребро від $i$ до $j$, і 0 (або $\infty$) інакше.
    * **Переваги:** Швидка перевірка наявності ребра ($O(1)$).
    * **Недоліки:** Висока витрата пам'яті для розріджених графів ($O(V^2)$).

2.  **Список суміжності (Adjacency List):**
    * **Опис:** Масив (або словник), де кожен елемент відповідає вершині і містить список усіх суміжних з нею вершин.
    * **Переваги:** Ефективне використання пам'яті для розріджених графів ($O(V+E)$). Швидкий доступ до всіх сусідів ($O(deg(V))$).
    * **Недоліки:** Перевірка наявності ребра може займати $O(deg(V))$.

3.  **Список ребер (Edge List):**
    * **Опис:** Список усіх ребер, де кожне ребро представлено парою (u, v) або трійкою (u, v, weight).
    * **Переваги:** Дуже просто реалізувати.
    * **Недоліки:** Дуже неефективний для пошуку сусідів або перевірки наявності ребра ($O(E)$).

---

## 4. Як працює алгоритм пошуку в ширину (BFS) на графах? Наведіть приклади ситуацій, де застосовується цей алгоритм.

**Алгоритм пошуку в ширину (BFS - Breadth-First Search)** досліджує граф шар за шаром, починаючи з заданої стартової вершини. Він відвідує всіх безпосередніх сусідів, потім всіх їхніх непосередніх сусідів тощо.

**Принцип роботи BFS:**
1.  **Ініціалізація**: Додати стартову вершину до черги та позначити її як відвідану.
2.  **Обхід**: Доки черга не порожня, витягнути вершину з початку черги, обробити її, а потім додати всіх її невідвіданих сусідів до черги та позначити як відвідані.

**Приклади ситуацій, де застосовується BFS:**
* **Пошук найкоротшого шляху в незваженому графі:** BFS завжди знаходить найкоротший шлях за кількістю ребер.
* **Знаходження всіх компонентів зв'язності графа.**
* **Пошук у лабіринтах:** Знаходження найкоротшого шляху від старту до фінішу.
* **Виявлення циклів у неорієнтованих графах.**
* **Мережеве сканування.**

---

## 5. Що таке алгоритм пошуку в глибину (DFS) на графах? Як він відрізняється від BFS? Дайте приклади задач, де використовується DFS.

**Алгоритм пошуку в глибину (DFS - Depth-First Search)** максимально заглиблюється вздовж кожної гілки, перш ніж повертатися і досліджувати інші гілки.

**Принцип роботи DFS:**
1.  **Ініціалізація**: Вибрати стартову вершину.
2.  **Обхід (рекурсивно або за допомогою стека)**: Позначити поточну вершину як відвідану, обробити її, а потім рекурсивно викликати DFS для кожного її невідвіданого сусіда.

**Відмінності DFS від BFS:**

| Характеристика           | **DFS (Пошук у глибину)** | **BFS (Пошук у ширину)** |
| :----------------------- | :--------------------------------------------------------- | :--------------------------------------------------------- |
| **Структура даних** | Стек (рекурсія або явний стек)                             | Черга                                                      |
| **Порядок обходу** | Заглиблюється якомога далі по одній гілці.                 | Обхід "шарами", відвідуючи всі вузли на одному рівні.      |
| **Найкоротший шлях** | Не гарантує найкоротший шлях (для незважених графів).      | Гарантує найкоротший шлях (для незважених графів).        |
| **Використання пам'яті** | Може бути меншим для "глибоких" графів ($O(V)$).           | Може бути більшим для "широких" графів ($O(V)$).          |

**Приклади задач, де використовується DFS:**
* **Виявлення циклів в орієнтованих графах.**
* **Топологічне сортування** для орієнтованих ациклічних графів (DAGs).
* **Знаходження компонент сильної зв'язності (SCC)** в орієнтованих графах.
* **Вирішення головоломок та ігор**, де можливе "відкочування" (backtracking).
* **Генерація лабіринтів.**

---

## 6. Опишіть алгоритм Дейкстри для пошуку найкоротшого шляху в графі. Які умови повинні виконуватися для успішної роботи цього алгоритму?

**Алгоритм Дейкстри** — це жадібний алгоритм для знаходження найкоротших шляхів від однієї заданої **стартової вершини** до всіх інших вершин у **зваженому графі**.

**Принцип роботи алгоритму Дейкстри:**
1.  **Ініціалізація**: Встановити відстань до стартової вершини 0, до всіх інших — $\infty$. Додати (0, стартова_вершина) до пріоритетної черги.
2.  **Основний цикл**: Доки пріоритетна черга не порожня:
    * Витягти вершину $u$ з найменшою поточною відстанню.
    * Якщо $u$ вже відвідана, пропустити. Додати $u$ до відвіданих.
    * **Оновлення відстаней сусідів (релаксація)**: Для кожного сусіда $v$ вершини $u$, якщо шлях через $u$ до $v$ коротший за поточний, оновити відстань до $v$ та додати $(нова\_відстань, v)$ до пріоритетної черги.

**Умови для успішної роботи алгоритму Дейкстри:**
1.  **Невід'ємні ваги ребер:** Це найважливіша умова. Алгоритм не працює коректно, якщо граф містить ребра з від'ємними вагами. Для таких випадків використовуються алгоритми Беллмана-Форда або Флойда-Уоршелла.

---

# Завдання на самостійну роботу: Кодування Гаффмена

## Варіант: Повідомлення для стиснення

Нехай задане повідомлення (варіант, виданий викладачем):
`MESSAGE_TO_ENCODE = "THIS IS A TEST MESSAGE"`

---

## 1. Побудова та візуалізація дерева кодів Гаффмена

### Функція для обчислення частот символів:

```python
from collections import Counter
import heapq
import networkx as nx
import matplotlib.pyplot as plt

def calculate_char_freq(message):
    """
    Обчислює список унікальних символів та список їх частот у повідомленні.
    """
    freq_map = Counter(message)
    chars = list(freq_map.keys())
    freqs = list(freq_map.values())
    return chars, freqs

# Приклад використання
message = "THIS IS A TEST MESSAGE"
chars_list, freqs_list = calculate_char_freq(message)
print(f"Символи: {chars_list}")
print(f"Частоти: {freqs_list}")