# Теория по бинарным деревьям

Бинарные деревья являются одной из фундаментальных структур данных в информатике. Они широко используются в алгоритмах и приложениях, связанных с поиском, сортировкой, управлением данными и многим другим.

#### Определение бинарного дерева

Бинарное дерево — это структура данных, состоящая из узлов. Каждый узел имеет не более двух дочерних узлов, которые обычно называют левым и правым дочерними узлами. Бинарное дерево начинается с корневого узла и разветвляется рекурсивно на два поддерева: левое и правое.

#### Основные термины

- **Узел**: Элемент бинарного дерева, содержащий данные и указатели на дочерние узлы.
- **Корень**: Самый верхний узел дерева.
- **Лист**: Узел, не имеющий дочерних узлов.
- **Внутренний узел**: Узел, имеющий хотя бы одного дочернего узла.
- **Высота дерева**: Длина пути от корня до самого глубокого узла.
- **Глубина узла**: Длина пути от корня до данного узла.

#### Виды бинарных деревьев

1. **Полное бинарное дерево**: Все уровни дерева, за исключением, возможно, последнего, полностью заполнены, и все узлы на последнем уровне расположены как можно левее.
2. **Совершенное бинарное дерево**: Все уровни полностью заполнены.
3. **Дегenerate (вырожденное) дерево**: Каждый узел имеет только одного дочернего узла, дерево фактически становится линейным списком.
4. **Сбалансированное бинарное дерево**: Разница в высоте левого и правого поддеревьев любого узла не превышает одного.

#### Бинарное дерево поиска (Binary Search Tree, BST)

Бинарное дерево поиска — это вид бинарного дерева, где для каждого узла выполняется следующее правило: все узлы в левом поддереве меньше данного узла, а все узлы в правом поддереве больше данного узла. Это позволяет эффективно выполнять операции поиска, вставки и удаления.

#### Операции с бинарным деревом

1. **Поиск**: В бинарном дереве поиска операция поиска выполняется за O(h) времени, где h — высота дерева.
2. **Вставка**: Добавление нового узла в бинарное дерево поиска также выполняется за O(h) времени.
3. **Удаление**: Удаление узла требует дополнительных шагов для перестройки дерева и выполняется за O(h) времени.
4. **Обходы дерева**:
    - **Прямой обход (Pre-order traversal)**: Посетить корень, затем левое поддерево, затем правое поддерево.
    - **Симметричный обход (In-order traversal)**: Посетить левое поддерево, затем корень, затем правое поддерево. В BST это дает отсортированный порядок узлов.
    - **Обратный обход (Post-order traversal)**: Посетить левое поддерево, затем правое поддерево, затем корень.
    - **Уровневый обход (Level-order traversal)**: Посетить узлы уровня за уровнем.

#### Примеры использования бинарных деревьев

1. **Поисковые системы**: Индексирование и поиск по ключевым словам.
2. **Базы данных**: Построение индексов для быстрого доступа к данным.
3. **Алгоритмы сортировки**: Быстрая сортировка (Quick Sort) и пирамидальная сортировка (Heap Sort).
4. **Выражения и компиляторы**: Построение синтаксических деревьев для математических выражений.

Бинарные деревья являются мощным инструментом в программировании и алгоритмах, и их понимание важно для эффективного решения многих задач.

# Теория: Сериализация дерева Хаффмана

Алгоритм Хаффмана является эффективным методом для сжатия данных без потерь. Он позволяет сопоставить более часто встречающимся символам более короткие коды, тем самым уменьшая общий объем данных. Вот основные шаги и концепции, связанные с построением и сериализацией дерева Хаффмана:

#### Основные понятия

1. **Частота символов**: Вначале подсчитывается частота каждого символа в исходных данных. Чем чаще встречается символ, тем короче будет его код Хаффмана.

2. **Построение дерева Хаффмана**:
   - **Шаг 1**: Каждому символу соответствует лист дерева с весом, равным частоте его появления.
   - **Шаг 2**: Два узла с наименьшими весами объединяются в новый узел, вес которого равен сумме весов объединяемых узлов.
   - **Шаг 3**: Новый узел добавляется в список узлов. Этот процесс повторяется до тех пор, пока не останется только один узел — корень дерева Хаффмана.

3. **Кодирование символов**:
   - Символы кодируются путем обхода дерева Хаффмана от корня к листьям.
   - Переход в левый дочерний узел кодируется как `0`, переход в правый дочерний узел — как `1`.
   - Код символа состоит из последовательности `0` и `1`, полученной на пути от корня до соответствующего листа.

#### Пример

Рассмотрим пример, приведенный на изображении:
- Символ `а` встречается 4 раза.
- Символ `б` встречается 3 раза.
- Символы `в` и `г` встречаются по 1 разу.

**Построение дерева**:
1. Создаем узлы для каждого символа:
   - `а` (4), `б` (3), `в` (1), `г` (1).
2. Объединяем два узла с наименьшими весами:
   - Объединяем `в` (1) и `г` (1) в новый узел весом 2.
3. Повторяем процесс:
   - Объединяем узел весом 2 и `б` (3) в новый узел весом 5.
   - Объединяем узел весом 5 и `а` (4) в корень дерева весом 9.

**Кодирование символов**:
- Символ `а`: путь от корня (влево) = `0`.
- Символ `б`: путь от корня (вправо-вправо) = `11`.
- Символ `в`: путь от корня (вправо-влево-влево) = `100`.
- Символ `г`: путь от корня (вправо-влево-вправо) = `101`.

#### Преимущества алгоритма Хаффмана

1. **Оптимальное кодирование**: Алгоритм Хаффмана обеспечивает минимальную среднюю длину кода для символов, что делает его чрезвычайно эффективным для сжатия данных.
2. **Простота реализации**: Несмотря на высокую эффективность, алгоритм достаточно прост для реализации.
3. **Гибкость**: Алгоритм можно применять к любым данным, для которых можно подсчитать частоту появления символов.

#### Заключение

Алгоритм Хаффмана является мощным инструментом для сжатия данных, который широко используется в различных приложениях, включая сжатие текстов, изображений и звуков. Сериализация дерева Хаффмана и построение эффективных кодов позволяет значительно уменьшить объем данных без потери информации, что важно для эффективного хранения и передачи данных.

# Задачи

### Менеджмент памяти

Задача менеджмента памяти заключается в том, чтобы эффективно выделять и освобождать память для структур данных. В данном случае рассматривается управление памятью для структур с двумя ссылками на другие структуры.

Мы будем использовать массив для хранения наших структур и список свободных ячеек для управления выделением и освобождением памяти.

#### Описание кода

1. **Инициализация памяти** (`initmemory`):
   - Создаётся массив `memory`, где каждая ячейка представляет структуру.
   - Каждая структура состоит из трёх элементов:
     - `0` (может использоваться для хранения данных),
     - индекс следующей свободной ячейки,
     - `0` (может использоваться для хранения дополнительных данных).
   - Возвращается массив `memory` и индекс первой свободной ячейки.

2. **Выделение новой структуры** (`newnode`):
   - Извлекается первая свободная ячейка.
   - Обновляется индекс первой свободной ячейки на следующий свободный индекс.
   - Возвращается индекс выделенной ячейки.

3. **Освобождение структуры** (`delnode`):
   - Освобождаемая ячейка добавляется в начало списка свободных ячеек.
   - Обновляется индекс первой свободной ячейки на освобождаемую ячейку.


In [4]:
def initmemory(maxn):
    memory = []
    for i in range(maxn):
        memory.append([0, i + 1, 0])  # Инициализация каждой ячейки
    memory[-1][1] = -1  # Последняя ячейка указывает на конец списка свободных ячеек
    return [memory, 0]

def newnode(memstruct):
    memory, firstfree = memstruct
    if firstfree == -1:
        raise Exception("Нет свободной памяти")
    new_index = firstfree
    firstfree = memory[firstfree][1]
    memstruct[1] = firstfree
    return new_index

def delnode(memstruct, index):
    memory, firstfree = memstruct
    memory[index][1] = firstfree
    memstruct[1] = index

# Пример использования
maxn = 5
memstruct = initmemory(maxn)
print("Инициализация памяти:", memstruct)

# Выделение новых узлов
index1 = newnode(memstruct)
print("Выделение нового узла 1:", index1, memstruct)

index2 = newnode(memstruct)
print("Выделение нового узла 2:", index2, memstruct)

# Освобождение узла
delnode(memstruct, index1)
print("Освобождение узла 1:", memstruct)

# Выделение нового узла после освобождения
index3 = newnode(memstruct)
print("Выделение нового узла 3:", index3, memstruct)

Инициализация памяти: [[[0, 1, 0], [0, 2, 0], [0, 3, 0], [0, 4, 0], [0, -1, 0]], 0]
Выделение нового узла 1: 0 [[[0, 1, 0], [0, 2, 0], [0, 3, 0], [0, 4, 0], [0, -1, 0]], 1]
Выделение нового узла 2: 1 [[[0, 1, 0], [0, 2, 0], [0, 3, 0], [0, 4, 0], [0, -1, 0]], 2]
Освобождение узла 1: [[[0, 2, 0], [0, 2, 0], [0, 3, 0], [0, 4, 0], [0, -1, 0]], 0]
Выделение нового узла 3: 0 [[[0, 2, 0], [0, 2, 0], [0, 3, 0], [0, 4, 0], [0, -1, 0]], 2]


### Условие задачи
Необходимо реализовать функцию поиска элемента в бинарном дереве, которое хранится в виде массива структур памяти. Каждая структура памяти содержит ключ и два указателя на дочерние элементы (левый и правый). Если элемент найден, функция должна возвращать индекс найденного элемента. Если элемент не найден, функция должна возвращать `-1`.

### Описание кода
Функция поиска `find` реализует рекурсивный алгоритм для поиска элемента в бинарном дереве поиска, хранящемся в массиве структур памяти.

1. **Параметры функции**:
   - `memstruct`: структура данных, представляющая память. Это список, где первый элемент (`memstruct[0]`) — это массив структур, а второй элемент — индекс первой свободной ячейки.
   - `root`: индекс корневого узла дерева.
   - `x`: ключ, который необходимо найти.

2. **Логика функции**:
   - Сначала функция извлекает ключ текущего узла.
   - Если ключ текущего узла совпадает с искомым ключом, возвращается индекс текущего узла.
   - Если искомый ключ меньше ключа текущего узла, функция рекурсивно ищет в левом поддереве.
     - Если левый дочерний узел отсутствует (индекс равен `-1`), возвращается `-1`.
   - Если искомый ключ больше ключа текущего узла, функция рекурсивно ищет в правом поддереве.
     - Если правый дочерний узел отсутствует (индекс равен `-1`), возвращается `-1`.

In [5]:
def find(memstruct, root, x):
    key = memstruct[0][root][0]
    if x == key:
        return root
    elif x < key:
        left = memstruct[0][root][1]
        if left == -1:
            return -1
        else:
            return find(memstruct, left, x)
    elif x > key:
        right = memstruct[0][root][2]
        if right == -1:
            return -1
        else:
            return find(memstruct, right, x)

# Пример использования
maxn = 10
memstruct = initmemory(maxn)

# Добавим несколько узлов для теста
index1 = newnode(memstruct)
index2 = newnode(memstruct)
index3 = newnode(memstruct)

# Пример бинарного дерева:
#        10
#       /  \
#      5    20
memstruct[0][index1] = [10, index2, index3]
memstruct[0][index2] = [5, -1, -1]
memstruct[0][index3] = [20, -1, -1]

# Поиск элементов
print("Поиск элемента 10:", find(memstruct, index1, 10))  # Должно вернуть index1
print("Поиск элемента 5:", find(memstruct, index1, 5))    # Должно вернуть index2
print("Поиск элемента 20:", find(memstruct, index1, 20))  # Должно вернуть index3
print("Поиск элемента 15:", find(memstruct, index1, 15))  # Должно вернуть -1

Поиск элемента 10: 0
Поиск элемента 5: 1
Поиск элемента 20: 2
Поиск элемента 15: -1


**Описание работы примера**

1. **Инициализация памяти**: Выделяется память для максимального количества структур (`maxn = 10`).
2. **Добавление узлов**: В память добавляются три узла, образующие простое бинарное дерево поиска.
3. **Структура дерева**:
   - Корневой узел (`index1`) имеет ключ `10` и дочерние узлы `index2` и `index3`.
   - Левый дочерний узел (`index2`) имеет ключ `5`.
   - Правый дочерний узел (`index3`) имеет ключ `20`.
4. **Поиск элементов**:
   - Поиск ключа `10` возвращает `index1`.
   - Поиск ключа `5` возвращает `index2`.
   - Поиск ключа `20` возвращает `index3`.
   - Поиск ключа `15`, которого нет в дереве, возвращает `-1`.


### Условие задачи
Необходимо реализовать функцию добавления элемента в бинарное дерево поиска, которое хранится в виде массива структур памяти. Каждая структура памяти содержит ключ и два указателя на дочерние элементы (левый и правый). Если элемент добавляется в дерево, необходимо корректно обновлять указатели и значения в узлах.

### Описание кода
Код включает две функции:
1. **`createandfillnode`**: Создаёт новый узел и инициализирует его ключом, а также устанавливает указатели на дочерние узлы в `-1`.
2. **`add`**: Рекурсивно добавляет новый узел в правильное место в бинарном дереве поиска.

1. **`createandfillnode`**:
   - Создаёт новый узел, используя `newnode`.
   - Инициализирует ключ узла, а также устанавливает указатели на дочерние узлы в `-1`.
   - Возвращает индекс нового узла.

2. **`add`**:
   - Сравнивает ключ добавляемого элемента с ключом текущего узла.
   - Если ключ меньше, рекурсивно добавляет элемент в левое поддерево.
   - Если ключ больше, рекурсивно добавляет элемент в правое поддерево.
   - Если указатель на поддерево равен `-1`, создаёт новый узел и устанавливает его как дочерний узел текущего узла.


In [6]:
def createandfillnode(memstruct, key):
    index = newnode(memstruct)
    memstruct[0][index][0] = key
    memstruct[0][index][1] = -1
    memstruct[0][index][2] = -1
    return index

def add(memstruct, root, x):
    key = memstruct[0][root][0]
    if x < key:
        left = memstruct[0][root][1]
        if left == -1:
            memstruct[0][root][1] = createandfillnode(memstruct, x)
        else:
            add(memstruct, left, x)
    elif x > key:
        right = memstruct[0][root][2]
        if right == -1:
            memstruct[0][root][2] = createandfillnode(memstruct, x)
        else:
            add(memstruct, right, x)

# Пример использования
memstruct = initmemory(20)
root = createandfillnode(memstruct, 8)
add(memstruct, root, 10)
add(memstruct, root, 9)
add(memstruct, root, 14)
add(memstruct, root, 3)
add(memstruct, root, 1)
add(memstruct, root, 6)
add(memstruct, root, 4)
add(memstruct, root, 7)

# Печать структуры памяти для проверки
for i in range(len(memstruct[0])):
    print(f"Индекс {i}: {memstruct[0][i]}")

Индекс 0: [8, 4, 1]
Индекс 1: [10, 2, 3]
Индекс 2: [9, -1, -1]
Индекс 3: [14, -1, -1]
Индекс 4: [3, 5, 6]
Индекс 5: [1, -1, -1]
Индекс 6: [6, 7, 8]
Индекс 7: [4, -1, -1]
Индекс 8: [7, -1, -1]
Индекс 9: [0, 10, 0]
Индекс 10: [0, 11, 0]
Индекс 11: [0, 12, 0]
Индекс 12: [0, 13, 0]
Индекс 13: [0, 14, 0]
Индекс 14: [0, 15, 0]
Индекс 15: [0, 16, 0]
Индекс 16: [0, 17, 0]
Индекс 17: [0, 18, 0]
Индекс 18: [0, 19, 0]
Индекс 19: [0, -1, 0]


**Описание работы примера**

1. **Инициализация памяти**: Функция `initmemory` инициализирует память для 20 структур.
2. **Создание корневого узла**: Функция `createandfillnode` создаёт корневой узел с ключом `8`.
3. **Добавление узлов**:
   - Узел с ключом `10` добавляется как правый дочерний узел корневого узла.
   - Узел с ключом `9` добавляется как левый дочерний узел узла с ключом `10`.
   - Узел с ключом `14` добавляется как правый дочерний узел узла с ключом `10`.
   - Узел с ключом `3` добавляется как левый дочерний узел корневого узла.
   - Узел с ключом `1` добавляется как левый дочерний узел узла с ключом `3`.
   - Узел с ключом `6` добавляется как правый дочерний узел узла с ключом `3`.
   - Узел с ключом `4` добавляется как левый дочерний узел узла с ключом `6`.
   - Узел с ключом `7` добавляется как правый дочерний узел узла с ключом `6`.

### Условие задачи
Необходимо реализовать функции для создания дерева из сериализованной строки и функции для обхода дерева. Дерево должно быть построено на основе символов 'D' (движение вниз) и 'U' (движение вверх). Затем необходимо реализовать обход дерева с использованием префикса и возвращение всех возможных путей в виде списка строк.

### Описание кода
1. **Функция создания дерева (`maketree`)**:
   - Создаёт корневой узел.
   - Перебирает символы сериализованной строки:
     - Если символ 'D', создаётся новый узел, добавляется как левый дочерний элемент текущего узла и текущий узел перемещается вниз.
     - Если символ 'U', текущий узел перемещается вверх, создаётся новый узел, добавляется как правый дочерний элемент и текущий узел перемещается вниз.

2. **Функция обхода дерева (`traverse`)**:
   - Рекурсивно обходит дерево:
     - Если узел является листом, добавляет текущий префикс в результат.
     - Если узел имеет левый дочерний элемент, добавляет '0' в префикс и продолжает обход.
     - Если узел имеет правый дочерний элемент, добавляет '1' в префикс и продолжает обход.


In [8]:
def maketree(serialized):
    tree = {'left': None, 'right': None, 'up': None, 'type': 'root'}
    nownode = tree
    for sym in serialized:
        if sym == 'D':
            newnode = {'left': None, 'right': None, 'up': nownode, 'type': 'left'}
            nownode['left'] = newnode
            nownode = newnode
        elif sym == 'U':
            while nownode['type'] == 'right' and nownode['up'] is not None:
                nownode = nownode['up']
            if nownode['up'] is not None:
                nownode = nownode['up']
            newnode = {'left': None, 'right': None, 'up': nownode, 'type': 'right'}
            nownode['right'] = newnode
            nownode = newnode
    return tree

def traverse(root, prefix):
    if root is None:
        return []
    if root['left'] is None and root['right'] is None:
        return [''.join(prefix)]
    prefix.append('0')
    ans = traverse(root['left'], prefix)
    prefix.pop()
    prefix.append('1')
    ans.extend(traverse(root['right'], prefix))
    prefix.pop()
    return ans

# Пример использования
serialized = "DDUUDD"
tree = maketree(serialized)
prefix = []
paths = traverse(tree, prefix)
print("Все возможные пути:", paths)

Все возможные пути: ['00', '01', '100']


**Описание работы примера**

1. **Создание дерева**:
   - Вызов `maketree("DDUUDD")` создаёт дерево на основе заданной сериализованной строки.
   - Дерево создаётся путём добавления узлов и движения вниз ('D') или вверх ('U').

2. **Обход дерева**:
   - Вызов `traverse(tree, [])` выполняет обход дерева и собирает все возможные пути от корня до листьев.
   - Для каждого пути добавляется префикс '0' при переходе в левый дочерний элемент и '1' при переходе в правый дочерний элемент.
