# Árvore 2-3-4

## Introdução

A árvore 2-3-4 é uma estrutura de dados de árvore de busca auto-balanceada onde cada nó interno pode ter 2, 3 ou 4 filhos. É um caso especial da B-tree com ordem 4, garantindo que todas as folhas estejam no mesmo nível, mantendo o balanceamento perfeito.

## Estrutura da Árvore 2-3-4

### Tipos de Nós:

**Nó 2 (2-node)**:
- 1 chave
- 2 filhos (esquerdo e direito)
- Estrutura: [chave] com filhos [menor] [maior]

**Nó 3 (3-node)**:
- 2 chaves ordenadas
- 3 filhos (esquerdo, meio, direito)
- Estrutura: [chave1, chave2] com filhos [menor] [meio] [maior]

**Nó 4 (4-node)**:
- 3 chaves ordenadas  
- 4 filhos (esquerdo, meio-esquerdo, meio-direito, direito)
- Estrutura: [chave1, chave2, chave3] com filhos [menor] [meio1] [meio2] [maior]

### Propriedades Estruturais:
- Todas as folhas estão no mesmo nível
- Chaves são mantidas em ordem crescente dentro de cada nó
- Cada caminho da raiz até uma folha tem o mesmo comprimento

## Operações Principais

### Propriedades de Busca:
- As chaves no filho esquerdo são menores que a primeira chave do nó
- As chaves entre filhos estão entre as chaves correspondentes do nó  
- As chaves no filho direito são maiores que a última chave do nó

### Invariantes da Árvore:
- Nenhum nó 4 pode ter um pai nó 4
- Todas as folhas estão na mesma profundidade
- A árvore cresce apenas pela raiz (divisão bottom-up)

### 1. Inserção seguida de Balanceamento

#### Processo de Inserção:
1. **Localização**: Navegar até a folha apropriada seguindo as regras de ordenação
2. **Inserção Direta**: Se a folha não é um nó 4, inserir diretamente
3. **Divisão de Nó**: Se a folha é um nó 4, dividir antes da inserção

#### Divisão de Nós (Split):

**Divisão de Nó 4**:
- Nó original: [a, b, c] com 4 filhos
- Resultado: 
  - Nó esquerdo: [a] com 2 filhos
  - Nó direito: [c] com 2 filhos  
  - Chave média [b] sobe para o pai

**Casos de Divisão**:

1. **Divisão na Raiz**: 
   - Criar nova raiz com chave média
   - Altura da árvore aumenta em 1

2. **Divisão em Nó Interno**:
   - Chave média sobe para o nó pai
   - Se pai também é nó 4, divisão propaga para cima

3. **Estratégia Proativa**:
   - Dividir nós 4 durante a descida
   - Garantir que nunca haja inserção em nó 4

### 2. Busca de Dados

#### Processo de Busca:
1. **Início na Raiz**: Começar na raiz da árvore
2. **Comparação de Chaves**: 
   - Comparar valor procurado com chaves do nó atual
   - Determinar posição (antes da primeira, entre chaves, após a última)
3. **Navegação**: 
   - Se valor encontrado: retornar sucesso
   - Se não encontrado: navegar para filho apropriado
4. **Repetição**: Continuar até encontrar o valor ou chegar a NIL

#### Características da Busca:
- Complexidade: O(log n) garantida
- Número de comparações por nó: no máximo 3
- Caminho sempre balanceado devido à estrutura
- Profundidade máxima: log₄(n) ≤ profundidade ≤ log₂(n)

### 3. Exclusão seguida de Balanceamento

#### Processo de Exclusão:
1. **Localização**: Encontrar o nó contendo a chave a ser removida
2. **Tipo de Remoção**:
   - **Nó Folha**: Remover chave diretamente
   - **Nó Interno**: Substituir por predecessor ou sucessor, depois remover da folha
3. **Balanceamento**: Aplicar operações de merge ou redistribuição se necessário

#### Casos de Balanceamento:

**Remoção Simples**:
- Nó tem mais de 1 chave: remover diretamente
- Não requer balanceamento

**Remoção com Underflow** (nó fica vazio):
- **Redistribuição**: Se irmão adjacente tem chaves extras
- **Merge (Fusão)**: Se irmão também tem apenas 1 chave

#### Operações de Balanceamento na Exclusão:

**Redistribuição (Transfer)**:
- Mover chave do nó irmão através do pai
- Pai desce, chave do irmão sobe para o pai
- Mantém propriedades da árvore sem reduzir altura

**Fusão (Merge)**:
- Combinar nó com deficiência + chave do pai + nó irmão
- Criar um novo nó com todas as chaves combinadas
- Pode propagar underflow para o nível superior

**Casos Especiais**:
1. **Fusão na Raiz**: Se raiz fica vazia, nova raiz é o nó fusionado
2. **Propagação**: Underflow pode subir até a raiz
3. **Redução de Altura**: Árvore diminui altura quando raiz é removida

## Algoritmos de Balanceamento Detalhados

### Estratégias de Inserção:

**Método Top-Down (Proativo)**:
- Dividir todos os nós 4 encontrados durante a descida
- Garantir que inserção sempre ocorre em nó não-4
- Vantagem: uma única passada
- Desvantagem: podem ocorrer divisões desnecessárias

**Método Bottom-Up (Reativo)**:
- Inserir primeiro, depois propagar divisões para cima
- Dividir apenas quando necessário  
- Vantagem: divisões mínimas
- Desvantagem: pode requerer múltiplas passadas

### Estratégias de Exclusão:

**Método Proativo**:
- Garantir que nó atual sempre tenha chaves extras antes da descida
- Aplicar redistribute/merge preventivamente
- Simplifica lógica de remoção

**Método Reativo**:
- Remover primeiro, corrigir underflows depois
- Pode requerer múltiplas operações de reparo

## Complexidade das Operações

### Análise Temporal:
- **Inserção**: O(log n)
- **Busca**: O(log n)  
- **Exclusão**: O(log n)

### Análise Detalhada:
- **Altura da Árvore**: Entre log₄(n) e log₂(n)
- **Número de Comparações**: No máximo 3 por nó visitado
- **Operações de Divisão/Merge**: O(log n) no pior caso
- **Acesso a Disco**: O(log n) - importante para B-trees

### Análise Espacial:
- **Utilização de Espaço**: 50-100% (melhor que árvores binárias)
- **Overhead**: Pequeno (apenas tipo de nó e chaves)
- **Fragmentação**: Mínima devido ao balanceamento

## Aplicações e Casos de Uso

### Aplicações Diretas:
- **Sistemas de Arquivo**: Base para B-trees em sistemas de arquivo
- **Bancos de Dados**: Índices e estruturas de armazenamento
- **Compiladores**: Análise sintática e tabelas de símbolos
- **Sistemas Embarcados**: Quando múltiplas chaves por nó são vantajosas

### Vantagens Específicas:
- **Cache Efficiency**: Menos níveis para percorrer
- **Disk Access**: Reduz número de acessos ao disco
- **Balanceamento**: Automaticamente mantido
- **Utilização de Espaço**: Alta ocupação dos nós

### Limitações:
- **Complexidade de Implementação**: Mais casos para gerenciar
- **Overhead**: Múltiplas chaves por nó requerem mais lógica
- **Memória**: Pode desperdiçar espaço em nós pequenos