# binary trees

<img src="public/binary-trees.webp" width="100%" />

**binary trees** ou **árvores binárias** são simples árvores e possuem somente um componente — o `node` ou **nó**.

você como programador recebe somente a parte mais superior da árvore, o topo dela, comumente chamado de `HEAD`, que também é um nó comum. e cada um dos nós tem somente dois ponteiros, um ponteiro `left` que aponta para o nó à esquerda, e um ponteiro `right` que aponta para o nó a direita.

e olhando para essas características, é possível inferir essa estrutura de dados não é muito diferente de uma singly linked list.  
só que ao invés de apontar para um próximo elemento, se aponta para dois outros.

# min heap e max heap

é um modelo especializado de uma binary tree em que os números inseridos são ordenados com base no tamanho.  
sendo assim, dado o conjunto de números:

```
{2 3 6 8 10 15 18}
```

em uma **min heap**, ele seria ordenado do menor para o maior, aonde o filho é sempre maior que o pai.

já em uma **max heap**, ele seria ordenado do maior para o menor, aonde o pai sempre será maior que o filho.

<img src="public/min-heap-and-max-heap.png" width="100%" />

# tree

só que não existe somente binary trees no mundo das árvores de estruturas de dados.  
um bom exemplo é simplemente a **árvore** ou somente _**tree**_.

que pode conter múltiplos nós sob um único nó.

<img src="public/tree.png" width="100%" />

# trees existentes

existem diversos tipos de árvores, e aqui estão os principais.

## trees básicas

- **binary tree** - cada nó tem no máximo dois filhos (esquerdo e direito)
- **ternary tree** - cada nó tem no máximo três filhos
- **n-ary tree (generic tree)** - cada nó pode ter qualquer número de filhos

## variantes da binary tree

- **binary search tree (bst)** - árvore binária onde filho esquerdo < pai < filho direito
- **avl tree** - árvore binária de busca auto-balanceada que mantém diferença de altura ≤ 1
- **red-black tree** - árvore binária de busca auto-balanceada usando propriedades de cor para balanceamento
- **splay tree** - árvore binária de busca auto-ajustável que move elementos acessados para a raiz
- **treap** - combina árvore binária de busca com propriedades de heap (baseada em prioridade)
- **scapegoat tree** - usa balanceamento por peso ao invés de altura

## binary trees especializadas

- **complete binary tree** - todos os níveis preenchidos exceto possivelmente o último, preenchido da esquerda para direita
- **full binary tree** - cada nó tem 0 ou 2 filhos
- **perfect binary tree** - todos os nós internos têm dois filhos, todas as folhas no mesmo nível
- **balanced binary tree** - diferença de altura entre subárvores é mínima
- **skewed binary tree** - todos os nós têm apenas filhos esquerdos ou apenas direitos
- **threaded binary tree** - ponteiros nulos substituídos por predecessor/sucessor em ordem

## heap trees

- **binary heap** - árvore binária completa com propriedade de heap (min-heap ou max-heap)
- **binomial heap** - coleção de árvores binomiais
- **fibonacci heap** - coleção de árvores com melhores limites de tempo amortizado
- **leftist heap** - heap com estrutura pesada à esquerda
- **skew heap** - variante de heap auto-ajustável

## b-trees e variantes

- **b-tree** - árvore auto-balanceada para armazenamento em disco, múltiplas chaves por nó
- **b+ tree** - variante de b-tree onde dados estão apenas nos nós folha
- **b\* tree** - b-tree com maior ocupação mínima
- **2-3 tree** - b-tree onde cada nó tem 2 ou 3 filhos
- **2-3-4 tree** - b-tree onde cada nó tem 2, 3 ou 4 filhos

## spacial trees

- **quadtree** - cada nó tem exatamente quatro filhos (particionamento de espaço 2d)
- **octree** - cada nó tem exatamente oito filhos (particionamento de espaço 3d)
- **k-d tree** - árvore binária para organizar pontos k-dimensionais
- **r-tree** - para indexação de informação espacial (retângulos delimitadores)
- **segment tree** - para armazenar intervalos ou segmentos

## trees de prefixos/sufixos

- **trie (prefix tree)** - armazena strings com prefixos compartilhados
- **radix tree (patricia tree)** - trie comprimida
- **suffix tree** - contém todos os sufixos de uma string
- **ternary search tree** - combina características de trie e árvore binária de busca

## trees avançadas/especializadas

- **fenwick tree (binary indexed tree)** - para tabelas de frequência cumulativa
- **cartesian tree** - combina propriedades de árvore binária de busca e heap
- **aa tree** - árvore rubro-negra simplificada
- **merkle tree** - árvore hash para verificação (usada em blockchain)
- **van emde boas tree** - para chaves inteiras com operações o(log log n)
- **fusion tree** - ordenação de inteiros com operações sublogarítmicas
- **interval tree** - armazena intervalos para consultas eficientes de sobreposição
- **range tree** - para busca de alcance ortogonal
- **spanning tree** - subgrafo que inclui todos os vértices com arestas mínimas
- **decision tree** - usada em aprendizado de máquina e teoria dos jogos
- **parse tree (syntax tree)** - representa estrutura sintática
- **expression tree** - representa expressões matemáticas

cada tipo de árvore é otimizado para diferentes casos de uso, desde busca e ordenação até indexação espacial e operações com strings.


# implementação: binary tree

a estrutura básica de um nó de árvore binária.

In [1]:
from __future__ import annotations


class TreeNode:
    def __init__(self, val: int):
        self.val = val
        self.left: TreeNode | None = None
        self.right: TreeNode | None = None


# criando uma árvore manualmente
#       1
#      / \
#     2   3
#    / \
#   4   5
root = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)
root.left.left = TreeNode(4)
root.left.right = TreeNode(5)

print("árvore criada!")

árvore criada!


# travessias (tree traversals)

existem três formas principais de percorrer uma árvore binária:

1. **inorder** (esquerda → raiz → direita): visita em ordem crescente para BST
2. **preorder** (raiz → esquerda → direita): útil para copiar/serializar a árvore
3. **postorder** (esquerda → direita → raiz): útil para deletar a árvore

e também:

4. **level order** (BFS): visita nível por nível

In [2]:
from collections import deque


def inorder(node: TreeNode | None) -> list[int]:
    """esquerda → raiz → direita"""
    if node is None:
        return []

    return inorder(node.left) + [node.val] + inorder(node.right)


def preorder(node: TreeNode | None) -> list[int]:
    """raiz → esquerda → direita"""
    if node is None:
        return []

    return [node.val] + preorder(node.left) + preorder(node.right)


def postorder(node: TreeNode | None) -> list[int]:
    """esquerda → direita → raiz"""
    if node is None:
        return []

    return postorder(node.left) + postorder(node.right) + [node.val]


def level_order(root: TreeNode | None) -> list[list[int]]:
    """BFS — nível por nível"""
    if root is None:
        return []

    resultado: list[list[int]] = []
    fila: deque[TreeNode] = deque([root])

    while fila:
        nivel: list[int] = []
        tamanho = len(fila)

        for _ in range(tamanho):
            node = fila.popleft()
            nivel.append(node.val)

            if node.left:
                fila.append(node.left)
            if node.right:
                fila.append(node.right)

        resultado.append(nivel)

    return resultado


#       1
#      / \
#     2   3
#    / \
#   4   5
print(f"inorder:     {inorder(root)}")  # [4, 2, 5, 1, 3]
print(f"preorder:    {preorder(root)}")  # [1, 2, 4, 5, 3]
print(f"postorder:   {postorder(root)}")  # [4, 5, 2, 3, 1]
print(f"level order: {level_order(root)}")  # [[1], [2, 3], [4, 5]]

inorder:     [4, 2, 5, 1, 3]
preorder:    [1, 2, 4, 5, 3]
postorder:   [4, 5, 2, 3, 1]
level order: [[1], [2, 3], [4, 5]]


# binary search tree (BST)

uma BST é uma árvore binária onde:
- todos os nós à esquerda têm valores **menores** que o nó atual
- todos os nós à direita têm valores **maiores** que o nó atual

isso permite busca, inserção e remoção em O(log n) para árvores balanceadas.

In [3]:
class BST:
    def __init__(self):
        self.root: TreeNode | None = None

    def inserir(self, val: int):
        """insere um valor na BST — O(log n) média, O(n) pior caso"""
        self.root = self._inserir(self.root, val)

    def _inserir(self, node: TreeNode | None, val: int) -> TreeNode:
        if node is None:
            return TreeNode(val)

        if val < node.val:
            node.left = self._inserir(node.left, val)
        else:
            node.right = self._inserir(node.right, val)

        return node

    def buscar(self, val: int) -> bool:
        """busca um valor na BST — O(log n) média, O(n) pior caso"""
        return self._buscar(self.root, val)

    def _buscar(self, node: TreeNode | None, val: int) -> bool:
        if node is None:
            return False
        if val == node.val:
            return True
        if val < node.val:
            return self._buscar(node.left, val)

        return self._buscar(node.right, val)

    def inorder(self) -> list[int]:
        """retorna elementos em ordem crescente"""
        return inorder(self.root)


# criando uma BST
bst = BST()

for val in [5, 3, 7, 1, 4, 6, 8]:
    bst.inserir(val)

#       5
#      / \
#     3   7
#    / \ / \
#   1  4 6  8

print(f"BST inorder (ordenado): {bst.inorder()}")
print(f"buscar 4: {bst.buscar(4)}")
print(f"buscar 9: {bst.buscar(9)}")

BST inorder (ordenado): [1, 3, 4, 5, 6, 7, 8]
buscar 4: True
buscar 9: False


# heap em python

python tem o módulo `heapq` para heaps.  
é uma **min heap** por padrão — o menor elemento está no topo.

In [4]:
import heapq

# criar uma heap a partir de uma lista
nums = [3, 1, 4, 1, 5, 9, 2, 6]
heapq.heapify(nums)  # transforma em heap in-place — O(n)
print(f"heap: {nums}")

# inserir — O(log n)
heapq.heappush(nums, 0)
print(f"após push(0): {nums}")

# remover menor — O(log n)
menor = heapq.heappop(nums)
print(f"pop retornou: {menor}")
print(f"após pop: {nums}")

# n menores/maiores elementos
nums = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]
print(f"\n3 menores de {nums}: {heapq.nsmallest(3, nums)}")
print(f"3 maiores de {nums}: {heapq.nlargest(3, nums)}")

heap: [1, 1, 2, 3, 5, 9, 4, 6]
após push(0): [0, 1, 2, 1, 5, 9, 4, 6, 3]
pop retornou: 0
após pop: [1, 1, 2, 3, 5, 9, 4, 6]

3 menores de [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]: [1, 1, 2]
3 maiores de [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]: [9, 6, 5]


# operações comuns em árvores

## altura da árvore

In [5]:
def altura(node: TreeNode | None) -> int:
    """calcula a altura da árvore — O(n)"""
    if node is None:
        return 0

    return 1 + max(altura(node.left), altura(node.right))


def contar_nos(node: TreeNode | None) -> int:
    """conta o número total de nós — O(n)"""
    if node is None:
        return 0

    return 1 + contar_nos(node.left) + contar_nos(node.right)


def eh_balanceada(node: TreeNode | None) -> bool:
    """verifica se a árvore é balanceada (diferença de altura ≤ 1) — O(n)"""
    if node is None:
        return True

    diff = abs(altura(node.left) - altura(node.right))

    return diff <= 1 and eh_balanceada(node.left) and eh_balanceada(node.right)


# usando a BST criada anteriormente
print(f"altura: {altura(bst.root)}")
print(f"número de nós: {contar_nos(bst.root)}")
print(f"é balanceada? {eh_balanceada(bst.root)}")

altura: 3
número de nós: 7
é balanceada? True


# resumo de complexidade

| operação                  | BST (balanceada) | BST (pior caso) | Heap        |
| ------------------------- | ---------------- | --------------- | ----------- |
| busca                     | O(log n)         | O(n)            | O(n)        |
| inserção                  | O(log n)         | O(n)            | O(log n)    |
| remoção                   | O(log n)         | O(n)            | O(log n)    |
| mínimo/máximo             | O(log n)         | O(n)            | O(1)*       |
| construir a partir de n   | O(n log n)       | O(n²)           | O(n)        |

\* heap dá acesso O(1) apenas ao mínimo (min heap) ou máximo (max heap), não ambos