# 🧠 Урок 30: Алгоритмы и структуры данных — деревья, графы, хэш-таблицы, поиск и сортировка
**Цель урока:** Понять основные структуры данных (деревья, графы, хэш-таблицы) и алгоритмы (поиск, сортировка) на уровне теории и практики. Подходит для новичков.

## 📌 Почему структуры данных важны?
- **Деревья** — эффективный способ поиска и хранения иерархических данных.
- **Графы** — моделируют связи между объектами (например, социальные сети).
- **Хэш-таблицы** — обеспечивают мгновенный доступ к данным.
- **Аналогия:** Структуры данных — это как коробки для хранения вещей. Деревья — как упорядоченные полки, графы — как карты метро, хэш-таблицы — как справочник с индексами.

## 🌳 Деревья: иерархия и поиск
- **Что такое дерево?** Структура, где каждый узел имеет родителя и детей (кроме корня и листьев).
- **Бинарное дерево:** Каждый узел имеет не более двух детей.
- **Сбалансированное дерево:** Высота левого и правого поддеревьев отличается не более чем на 1 (например, AVL-дерево, красно-черное дерево).
- **Преимущества:**
  - Поиск за $O(\log n)$, если дерево сбалансировано.
  - Подходит для хранения данных с естественной иерархией (например, файловая система).
- **Ограничения:**
  - Сложность поддержания баланса.
  - Неэффективны для случайного доступа.
- **Пример:**
  ```python
  class Node:
      def __init__(self, value):
          self.value = value
          self.left = None
          self.right = None
  
  root = Node(10)
  root.left = Node(5)
  root.right = Node(15)
  ```
- **Аналогия:** Дерево — как генеалогическое древо: каждый человек имеет родителей и детей [[2]].

## 📐 Графы: связи и маршруты
- **Что такое граф?** Набор узлов (вершин) и ребер (связей между ними).
- **Типы графов:**
  - **Направленные:** Ребра имеют направление (например, ссылки в соцсетях).
  - **Невзвешенные:** Все ребра равны.
  - **Взвешенные:** Ребра имеют вес (например, расстояние между городами).
- **Как представлять графы?**
  - **Матрица смежности:** $n \times n$ матрица, где $M[i][j]$ — вес между $i$ и $j$.
  - **Список смежности:** Каждый узел хранит список соседей.
- **Пример (список смежности):**
  ```python
  graph = {
      'A': ['B', 'C'],
      'B': ['A', 'D'],
      'C': ['A', 'E'],
      'D': ['B'],
      'E': ['C']
  }
  ```
- **Аналогия:** Граф — как карта метро, где станции — узлы, а линии — ребра [[4]].

## 🧮 Хэш-таблицы: мгновенный доступ
- **Что это?** Структура данных, которая сопоставляет ключи с значениями через функцию хэширования.
- **Как работает?**
  1. Ключ преобразуется в число (хэш).
  2. Хэш используется как индекс в массиве.
  3. При коллизиях (одинаковые хэши) используются методы разрешения (цепочки, открытая адресация).
- **Преимущества:**
  - Вставка, удаление и поиск за $O(1)$ в среднем случае.
  - Используется в ассоциативных массивах (например, словари в Python).
- **Ограничения:**
  - Коллизии могут замедлять работу.
  - Не сохраняют порядок (в старых версиях Python).
- **Пример (Python):**
  ```python
  my_dict = {'name': 'Alice', 'age': 30}
  print(my_dict['name'])  # 'Alice'
  ```
- **Аналогия:** Хэш-таблица — как телефонная книга: вы знаете имя — быстро находите номер [[5]].

## 🔍 Алгоритмы поиска
- **Линейный поиск:** Перебор всех элементов ($O(n)$).
- **Бинарный поиск:** Для отсортированных данных ($O(\log n)$).
- **Поиск в глубину (DFS):** Для графов и деревьев.
- **Поиск в ширину (BFS):** Для графов, находит кратчайший путь.
- **Пример: Бинарный поиск**
  ```python
  def binary_search(arr, target):
      low, high = 0, len(arr) - 1
      while low <= high:
          mid = (low + high) // 2
          if arr[mid] == target:
              return mid
          elif arr[mid] < target:
              low = mid + 1
          else:
              high = mid - 1
      return -1
  ```
- **Аналогия:** Бинарный поиск — как поиск слова в словаре: вы открываете середину и двигаетесь в нужную половину [[6]].

## 🧱 Алгоритмы сортировки
- **Сортировка пузырьком:** Сравнивает соседние элементы и меняет местами ($O(n^2)$).
- **Сортировка слиянием:** Разделение на части и объединение ($O(n \log n)$).
- **Быстрая сортировка (QuickSort):** Разделение по опорному элементу ($O(n \log n)$ в среднем).
- **Сортировка кучей (HeapSort):** Использует двоичную кучу ($O(n \log n)$).
- **Пример: Сортировка пузырьком**
  ```python
  def bubble_sort(arr):
      n = len(arr)
      for i in range(n):
          for j in range(0, n-i-1):
              if arr[j] > arr[j+1]:
                  arr[j], arr[j+1] = arr[j+1], arr[j]
      return arr
  ```
- **Аналогия:** Сортировка пузырьком — как поднимать самые легкие элементы (пузырьки) наверх [[6]].

## 🧪 Практика: Реализация деревьев
### Шаг 1: Бинарное дерево поиска

In [None]:
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

class BST:
    def __init__(self):
        self.root = None

    def insert(self, value):
        if not self.root:
            self.root = Node(value)
        else:
            self._insert_recursive(self.root, value)

    def _insert_recursive(self, node, value):
        if value < node.value:
            if node.left is None:
                node.left = Node(value)
            else:
                self._insert_recursive(node.left, value)
        else:
            if node.right is None:
                node.right = Node(value)
            else:
                self._insert_recursive(node.right, value)

### Шаг 2: Поиск в дереве

In [None]:
    def search(self, value):
        return self._search_recursive(self.root, value)

    def _search_recursive(self, node, value):
        if not node or node.value == value:
            return node
        if value < node.value:
            return self._search_recursive(node.left, value)
        return self._search_recursive(node.right, value)

### Шаг 3: Тестирование дерева

In [None]:
bst = BST()
bst.insert(10)
bst.insert(5)
bst.insert(15)

print(bst.search(5).value)  # 5
print(bst.search(20))  # None

## 📊 Практика: Алгоритмы поиска в графе
### Шаг 1: Граф с поиском в глубину (DFS)

In [None]:
def dfs(graph, start, visited=None):
    if visited is None:
        visited = set()
    visited.add(start)
    print(start)
    for neighbor in graph[start]:
        if neighbor not in visited:
            dfs(graph, neighbor, visited)

# Тестирование
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D'],
    'C': ['A', 'E'],
    'D': ['B'],
    'E': ['C']
}
dfs(graph, 'A')

### Шаг 2: Поиск в ширину (BFS)

In [None]:
from collections import deque

def bfs(graph, start):
    visited = set()
    queue = deque([start])
    while queue:
        node = queue.popleft()
        if node not in visited:
            print(node)
            visited.add(node)
            for neighbor in graph[node]:
                if neighbor not in visited:
                    queue.append(neighbor)

bfs(graph, 'A')

## 📈 Практика: Хэш-таблицы и коллизии
### Шаг 1: Реализация хэш-таблицы

In [None]:
class HashTable:
    def __init__(self, size=10):
        self.size = size
        self.table = [[] for _ in range(size)]  # Список списков для разрешения коллизий

    def _hash(self, key):
        return hash(key) % self.size

    def insert(self, key, value):
        index = self._hash(key)
        for pair in self.table[index]:
            if pair[0] == key:
                pair[1] = value
                return
        self.table[index].append([key, value])

### Шаг 2: Использование хэш-таблицы

In [None]:
ht = HashTable()
ht.insert('name', 'Alice')
ht.insert('age', 30)
print(ht.table)  # Отображение хэш-таблицы

## 📊 Сравнение алгоритмов сортировки
- **Сортировка пузырьком:** Простая, но медленная.
- **Сортировка слиянием:** Всегда $O(n \log n)$, но требует дополнительной памяти.
- **Быстрая сортировка:** В среднем $O(n \log n)$, но худший случай $O(n^2)$.
- **Сортировка кучей:** Хороша для больших данных, но сложна для понимания.
- **Пример: Быстрая сортировка**
  ```python
  def quicksort(arr):
      if len(arr) <= 1:
          return arr
      pivot = arr[len(arr)//2]
      left = [x for x in arr if x < pivot]
      middle = [x for x in arr if x == pivot]
      right = [x for x in arr if x > pivot]
      return quicksort(left) + middle + quicksort(right)
  ```
- **Аналогия:** Быстрая сортировка — как разделение людей по росту: сначала выбирается "опорный" человек, остальные делятся на выше и ниже его.

## 📝 Домашнее задание
**Задача 1:** Реализуйте бинарное дерево поиска с методами `insert` и `search`.
**Задача 2:** Напишите функцию `bfs` для поиска кратчайшего пути в графе.
**Задача 3:** Создайте хэш-таблицу с разрешением коллизий через открытую адресацию (линейное пробирование).
**Задача 4:** Напишите отчет (200–300 слов), где:
- Объясните, как работают деревья и графы.
- Сравните сортировки по скорости и сложности.
- Объясните, почему хэш-таблицы работают быстро.
- Приведите примеры, где эти структуры полезны (например, графы — для соцсетей, хэш-таблицы — для кэширования).

In [None]:
# Ваш код здесь
class HashTableOpenAddressing:
    def __init__(self, size=10):
        self.size = size
        self.table = [None] * size

    def _hash(self, key):
        return hash(key) % self.size

    def insert(self, key, value):
        index = self._hash(key)
        while self.table[index] is not None and self.table[index] != (key, value):
            index = (index + 1) % self.size  # Линейное пробирование
        self.table[index] = (key, value)

In [None]:
# Реализация BFS
def bfs_shortest_path(graph, start, goal):
    visited = set()
    queue = deque([(start, [start])])
    while queue:
        node, path = queue.popleft()
        if node == goal:
            return path
        for neighbor in graph[node]:
            if neighbor not in visited:
                visited.add(neighbor)
                queue.append((neighbor, path + [neighbor]))
    return None  # Путь не найден

In [None]:
# Тестирование BFS
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D'],
    'C': ['A', 'E'],
    'D': ['B'],
    'E': ['C']
}
print(bfs_shortest_path(graph, 'A', 'E'))  # ['A', 'C', 'E']

## ✅ Рекомендации по выполнению домашнего задания
- **Задача 1:** Используйте рекурсию для `insert` и `search`.
- **Задача 2:** Для BFS используйте `deque` для очереди.
- **Задача 3:** Линейное пробирование — простой способ разрешения коллизий.
- **Подсказка:** Используйте `hasattr()` для проверки наличия узла в дереве.