# Лабораторная работа  7. Построение бинарного дерева поиска. Подсчет количества элементов в дереве

Четверикова Вера Борисовна, 27.04.2025

## Задание 7.1. Определение классов

<span style="color:red;">Напишите</span> базовое определение классов `BinaryTree`, `BinaryNode`, `EmptyNode`
на основе лекционных материалов.

<span style="color:red;">Напишите</span> комментарии для каждой строки кода в определении классов
`BinaryTree`, `BinaryNode`, `EmptyNode`.

In [13]:
class BinaryTree:
    """Бинарное дерево, управляющее корневым узлом"""
    def __init__(self):
        self.root = EmptyNode()  # пустое дерево
        
    def __repr__(self):
        """Строковое представление дерева"""
        return repr(self.root)
        
    def insert(self, value):
        """Вставка значения в дерево"""
        self.root = self.root.insert(value)  # делегируем вставку узлу

    def build_from_list(self, data):
        """Построение дерева из списка значений"""
        for value in data:
            self.insert(value)
        return self

class BinaryNode:
    """Узел дерева"""
    def __init__(self, left, value, right):
        self.left = left    # левый узел (BinaryNode или EmptyNode)
        self.value = value  # значение узла
        self.right = right  # правый узел (BinaryNode или EmptyNode)
        
    def __repr__(self):
        """Вывод узла в виде (левый, значение, правый)"""
        return f'({self.left}, {self.value}, {self.right})'


class EmptyNode:
    """Пустой узел"""
    def __repr__(self):
        """Вывод пустого узла"""
        return '*'
    
    def insert(self, value):
        """Создаёт новый узел при вставке значения"""
        return BinaryNode(self, value, self)

## Задание 7.2. Метод вставки элемента в бинарное дерево поиска

<span style="color:red;">Переопределите</span> класс `BinaryNode` за счет определения метода вставки
`insert(self, value)`. Рекомендации по выполнению представлены в лекции к
теме Бинарное дерево поиска. Реализация на основе ООП.

In [14]:
class BinaryNode:
    """Узел бинарного дерева поиска (BST)"""
    def __init__(self, left, value, right):
        self.left = left    # левый потомок (BinaryNode или EmptyNode)
        self.value = value  # значение узла
        self.right = right  # правый потомок (BinaryNode или EmptyNode)
        
    def __repr__(self):
        return f'({self.left}, {self.value}, {self.right})'
    
    def insert(self, value):
        """Рекурсивная вставка значения согласно правилам BST"""
        if value < self.value:
            self.left = self.left.insert(value)  # влево, если значение меньше
        else:
            self.right = self.right.insert(value) # вправо, если >=
        return self

<span style="color:red;">Приведите три примера</span> построения бинарного дерева поиска на
основе итерируемых объектов различных типов (например, `str`, `range`, `list`).

Пример 1: Числа (тип `int`)

In [15]:
nums = [5, 3, 7, 2, 4]
tree = BinaryTree()
for num in nums:
    tree.insert(num)

print(tree)

(((*, 2, *), 3, (*, 4, *)), 5, (*, 7, *))


Пример 2: Объекты `range`

In [16]:
tree = BinaryTree()
for i in range(1, 6):
    tree.insert(i)

print(tree)

(*, 1, (*, 2, (*, 3, (*, 4, (*, 5, *)))))


Пример 3: Строки (тип `str`)

In [17]:
tree = BinaryTree()
for char in "banana":
    tree.insert(char)

print(tree)

((*, a, (*, a, (*, a, *))), b, (*, n, (*, n, *)))


<span style="color:red;">Протестируйте</span> корректность построения бинарного дерева поиска на основе
вставки в дерево элементов некоторого итерируемого объекта. При этом важно,
чтобы для элементов итерируемого объекта были определены операции
сравнения. 

Тест 1: Вставка дубликатов

In [18]:
tree = BinaryTree()
tree.insert(5)
tree.insert(5)
print(tree) 

(*, 5, (*, 5, *))


Тест 2: Сравнение строк

In [19]:
tree = BinaryTree()
tree.insert("apple")
tree.insert("banana")
print(tree)

(*, apple, (*, banana, *))


## Задание 7.3. Построение бинарного дерева поиска

<span style="color:red;">Прочитайте</span> числовые данные, записанные в файлы, и <span style="color:red;">постройте </span> на основании
этих данных бинарные деревья поиска.

<span style="color:red;">Рассмотрите</span> четыре варианта хранения данных в файлах:
1. числовые данные хранятся в текстовом файле и записаны в столбец;
2. числовые данные хранятся в текстовом файле, записаны в строки, разделены
пробелами, в каждой строке расположено одинаковое количество числовых
значений;
3. числовые данные хранятся в текстовом файле, записаны в строки, разделены
пробелами, в каждой строке расположено различное количество числовых
значений;
4. числовые данные хранятся в файле формата `json`. 

Рекомендации по выполнению:
- cтроковый метод `split` разбирает строку на список подстрок по разделителю;
- строковые объекты нужно преобразовывать в числовые объекты перед их
записью в бинарное дерево поиска;
- функция `loadtxt` из расширения numpy читает числовые даннные из
текстового файла без предварительного создания файлового объекта; в каждой
строке файла должно быть расположено одинаковое количество числовых
значений;
- для работы с файлами в формате json используйте, например, функции
`load` и `values` из модуля `json`. Для используемых функций модуля <span style="color:red;">сформулируйте спецификации</span>.

In [20]:
import json
import numpy as np

def read_column_file(filename):
    """Чтение данных из файла с числами в столбец"""
    data = []
    try:
        with open(filename, 'r') as file:
            for line in file:
                stripped = line.strip()
                if stripped:
                    try:
                        data.append(float(stripped))
                    except ValueError:
                        continue
    except FileNotFoundError:
        print(f"Файл {filename} не найден.")
    return data

def read_grid_file(filename):
    """Чтение данных из файла с сеткой чисел (одинаковое количество в строках)"""
    try:
        return np.loadtxt(filename).flatten().tolist()
    except Exception as e:
        print(f"Ошибка: {e}")
        return []

def read_arbitrary_file(filename):
    """Чтение данных из файла с произвольными строками"""
    data = []
    try:
        with open(filename, 'r') as file:
            for line in file:
                try:
                    nums = list(map(float, line.strip().split()))
                    data.extend(nums)
                except ValueError:
                    continue
    except FileNotFoundError:
        print(f"Файл {filename} не найден.")
    return data

def read_json_file(filename):
    """Чтение данных из JSON-файла"""
    try:
        with open(filename, 'r') as file:
            data = json.load(file)
        flattened = []
        def flatten(lst):
            for item in lst:
                if isinstance(item, list):
                    flatten(item)
                else:
                    flattened.append(float(item))
        flatten(data)
        return flattened
    except Exception as e:
        print(f"Ошибка: {e}")
        return []

Пример 1. Файл `column.txt` (Столбец чисел)

In [23]:
tree = BinaryTree()
data = read_column_file("column.txt")
tree.build_from_list(data)
print(tree)

((((*, 1.0, *), 2.0, *), 3.0, (*, 3.0, *)), 4.0, ((*, 4.0, (((*, 5.0, *), 7.0, *), 8.0, *)), 9.0, *))


Пример 2. Файл `grid.txt` (Сетка чисел)

In [24]:
tree = BinaryTree()
data = read_grid_file("grid.txt") 
tree.build_from_list(data)
print(tree)

(*, 10.0, (*, 20.0, (*, 30.0, (*, 40.0, (*, 50.0, (*, 60.0, (*, 70.0, (*, 80.0, (*, 90.0, *)))))))))


Пример 3. JSON-файл `data.json`

In [25]:
tree = BinaryTree()
data = read_json_file("data.json")
tree.build_from_list(data)
print(tree)

(*, 1.0, (*, 2.0, (*, 3.0, (*, 4.0, (*, 5.0, (*, 6.0, *))))))


Пример 4. Файл с произвольными строками `arbitrary.txt` (Произвольные строки)

In [28]:
tree = BinaryTree()
data = read_arbitrary_file("arbitrary.txt")  
tree.build_from_list(data)
print(tree)

(*, 1.0, (*, 2.5, (*, 3.0, (*, 4.0, (*, 5.0, ((*, 7.0, *), 8.0, *))))))


*Спецификации функций для работы с JSON*

- `json.load(file)`

Назначение: Чтение JSON-данных из файла.

Параметры:
    
    - `file`: файловый объект, открытый в режиме чтения.

Возвращает: структуру данных Python (списки, словари и т.д.).

- Рекурсивная функция `_flatten`

Назначение: Преобразование вложенных списков в плоский список чисел.

Параметры:
    
    - `lst`: вложенная структура (списки, числа).

Возвращает: одномерный список чисел.

## Задание 7.4. Перегрузка операции принадлежности `in`

<span style="color:red;">Переопределите</span> классы `BinaryTree`, `BinaryNode`, `EmptyNode` за счет
определения нового метода `__contains__(self, value)` для перегрузки
операции принадлежности `in`. Рекомендации по выполнению представлены в
лекции к теме Бинарное дерево поиска. Реализация на основе ООП.

In [29]:
class EmptyNode:
    """Пустой узел"""
    def __repr__(self):
        return '*'
    
    def insert(self, value):
        return BinaryNode(EmptyNode(), value, EmptyNode())
    
    def __contains__(self, value):
        """Пустой узел никогда не содержит значений"""
        return False

class BinaryNode:
    """Узел бинарного дерева поиска"""
    def __init__(self, left, value, right):
        self.left = left    
        self.value = value  
        self.right = right  
        
    def __repr__(self):
        return f'({self.left}, {self.value}, {self.right})'
    
    def insert(self, value):
        if value < self.value:
            self.left = self.left.insert(value)
        else:
            self.right = self.right.insert(value)
        return self
    
    def __contains__(self, value):
        """Проверка наличия значения в узле или его потомках"""
        if value == self.value:
            return True
        elif value < self.value:
            return value in self.left  # рекурсивный поиск в левом поддереве
        else:
            return value in self.right # рекурсивный поиск в правом поддереве

class BinaryTree:
    """Бинарное дерево поиска"""
    def __init__(self):
        self.root = EmptyNode()
        
    def __repr__(self):
        return repr(self.root)
    
    def insert(self, value):
        self.root = self.root.insert(value)
    
    def __contains__(self, value):
        """Проверка наличия значения в дереве"""
        return value in self.root

<span style="color:red;">Протестируйте</span> корректность выполнения операции `in` на трех примерах.

In [34]:
source_data = [5,1,10,3,4]
tree = BinaryTree()
for i in source_data:
    tree.insert(i)
    print(tree)
for i in range(10):
    print((i, i in tree), end = ' ')


(*, 5, *)
((*, 1, *), 5, *)
((*, 1, *), 5, (*, 10, *))
((*, 1, (*, 3, *)), 5, (*, 10, *))
((*, 1, (*, 3, (*, 4, *))), 5, (*, 10, *))
(0, False) (1, True) (2, False) (3, True) (4, True) (5, True) (6, False) (7, False) (8, False) (9, False) 

Пример 1: Простое дерево с числами

In [30]:
tree = BinaryTree()
data = [5, 3, 7, 2, 4]
for num in data:
    tree.insert(num)

print(3 in tree) 
print(6 in tree)

True
False


Пример 2: Дерево с одним элементом

In [31]:
tree = BinaryTree()
tree.insert(10)

print(10 in tree)  
print(5 in tree)

True
False


Пример 3: Пустое дерево

In [32]:
tree = BinaryTree()

print(5 in tree)

False


## Задание 7.5. Перегрузка встроенной функции `len`

<span style="color:red;">Переопределите </span>классы `BinaryTree`, `BinaryNode`, `EmptyNode` за счет
определения нового метода `__len__(self)` для перегрузки встроенной функции
`len`, которая возвращает количество вершин в бинарном дереве поиска.
Рекомендации по выполнению представлены в лекции к теме Бинарное дерево
поиска. Реализация на основе ООП.

In [35]:
class EmptyNode:
    """Пустой узел"""
    def __repr__(self):
        return '*'
    
    def insert(self, value):
        return BinaryNode(EmptyNode(), value, EmptyNode())
    
    def __len__(self):
        """Пустой узел имеет длину 0"""
        return 0

class BinaryNode:
    """Узел бинарного дерева поиска"""
    def __init__(self, left, value, right):
        self.left = left    
        self.value = value  
        self.right = right  
        
    def __repr__(self):
        return f'({self.left}, {self.value}, {self.right})'
    
    def insert(self, value):
        if value < self.value:
            self.left = self.left.insert(value)
        else:
            self.right = self.right.insert(value)
        return self
    
    def __len__(self):
        """Количество узлов: текущий узел + левое поддерево + правое поддерево"""
        return 1 + len(self.left) + len(self.right)

class BinaryTree:
    """Бинарное дерево поиска"""
    def __init__(self):
        self.root = EmptyNode()
        
    def __repr__(self):
        return repr(self.root)
    
    def insert(self, value):
        self.root = self.root.insert(value)
    
    def __len__(self):
        """Общее количество узлов в дереве"""
        return len(self.root)

<span style="color:red;">Протестируйте </span> корректность выполнения функции `len` на трех примерах.

In [36]:
tree = BinaryTree()
for i in source_data:
    tree.insert(i)
len(tree)

5

Пример 1: Пустое дерево

In [37]:
tree = BinaryTree()
print(len(tree))

0


Пример 2: Дерево с одним элементом

In [38]:
tree.insert(10)
print(len(tree))

1


Пример 3: Дерево с несколькими элементами

In [42]:
tree = BinaryTree()
values = [5, 3, 7, 2, 4]
for v in values:
    tree.insert(v)
print(len(tree))

5
