<a href="https://colab.research.google.com/github/tiagopessoalima/ED2/blob/main/Semana_02_(ED2).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Introdução a Árvores**

Este documento apresenta uma exploração técnica de árvores em Python, abordando desde os fundamentos teóricos até implementações. O material cobre conceitos essenciais, algoritmos, análise de complexidade e exercícios práticos.

## **Conceitos Fundamentais**

### **O que são Árvores?**

Em Ciência da Computação, uma **árvore** é uma Estrutura de Dados Abstrata (TAD) hierárquica e não linear, composta por nós (ou vértices) conectados por arestas (ou links). Cada nó, exceto a **raiz**, possui exatamente **um pai** e pode ter **zero ou mais filhos**. Diferentemente das listas ligadas, que representam sequências lineares, as árvores modelam relações hierárquicas, permitindo operações como busca, inserção e remoção com maior eficiência em muitos cenários. Em árvores **balanceadas**, a complexidade média e no pior caso dessas operações é **O(log n)**, onde *n* é o número de nós.

### **Exemplo de Árvore**

```
        A
      /   \
     B     C          
    / \     \
   D   E     F        
        \
         G            
```

### **Definição Matemática Formal**

Uma árvore $T$ é um grafo finito, **não direcionado**, **conexo** e **acíclico**, representado pelo par ordenado $(V, E)$, onde:

- $V$ é o conjunto finito de **vértices** (nós);
- $E$ é o conjunto finito de **arestas** (conexões entre nós);

satisfazendo a propriedade fundamental:

**Número de arestas** = **Número de vértices** − 1  
ou seja:  
$$|E| = |V| − 1$$

### **Observações Importantes**

- Em uma árvore genérica (não necessariamente balanceada), o pior caso para busca, inserção e remoção pode ser **O(n)** — situação típica de uma árvore degenerada (equivalente a uma lista encadeada).
- A eficiência **O(log n)** é obtida em estruturas balanceadas, como **árvores AVL**, **árvores rubro-negras**, **árvores B** e **árvores binárias de busca balanceadas**.

### **Terminologia Básica**

- **Raiz**: O nó inicial da árvore, que não possui pai.
  - A é a raiz da árvore.

- **Nó Pai**: Um nó que possui um ou mais filhos.  
  - A é pai de B e C.
  - B é pai de D e E.
  - E é pai de G.

- **Nó Filho**: Um nó que possui um pai.  
  - B e C são filhos de A.  
  - D e E são filhos de B.  
  - G é filho de E.

- **Irmãos**: Nós que compartilham o mesmo pai.
  - D e E são irmãos (ambos filhos de B).

- **Folha (ou nó terminal)**: Nó que não possuem filhos.
  - D, F, e G são folhas.

- **Subárvore**: Árvore formada por um nó e seus descendentes.
  - A subárvore enraizada em B:

```
    B
   / \
  D   E
       \
        G
```

- **Nível (ou camada)**: Distância em número de arestas da raiz até o nó.
  - Nível 0: A  
  - Nível 1: B, C  
  - Nível 2: D, E, F  
  - Nível 3: G

- **Altura**: O maior nível (ou profundidade máxima) atingido por qualquer nó na árvore.  
Equivale ao número de arestas no caminho mais longo da raiz até uma folha.
  - A altura da árvore é **3** (caminho A → B → E → G).

- **Profundidade**: Número de arestas do caminho da raiz até o nó.
  - G possui profundidade **3**.

- **Grau**: Número de filhos de um nó.
  - Grau de A = 2 (filhos: B e C)  
  - Grau de B = 2 (filhos: D e E)  
  - Grau de E = 1 (filho: G)  
  - Grau de D, F e G = 0 (são folhas)

### **Principais Aplicações Práticas**

As árvores são estruturas de dados amplamente utilizadas em diversas áreas da Ciência da Computação e da Tecnologia da Informação, devido à sua capacidade de representar relações hierárquicas de forma eficiente. Entre as principais aplicações destacam-se:

- **Sistemas de arquivos**  
  Representação de diretórios e subdiretórios em sistemas operacionais (ex.: Windows, Linux, macOS), onde cada diretório é um nó e os arquivos/diretórios contidos são seus filhos.

- **Bancos de dados relacionais e NoSQL**  
  Construção de índices (ex.: índices B+, B-árvores, árvores de busca) para acelerar consultas, ordenação e recuperação de dados.

- **Compiladores e interpretadores**  
  Representação da estrutura sintática de programas por meio de **árvores sintáticas** (parse trees) e **árvores de sintaxe abstrata** (AST – Abstract Syntax Tree).

- **Compressão de dados**  
  Construção de códigos de comprimento variável ótimos, como os utilizados no algoritmo de **Huffman** (árvores de Huffman) e em técnicas de codificação prefixada.

- **Algoritmos de roteamento e redes**  
  Estruturas como árvores de spanning (spanning trees) em protocolos de roteamento (ex.: Spanning Tree Protocol – STP) e árvores de decisão em sistemas de roteamento multicast.

- **Inteligência Artificial e Aprendizado de Máquina**  
  **Árvores de decisão**, florestas aleatórias (Random Forests) e métodos baseados em gradient boosting (ex.: XGBoost, LightGBM, CatBoost).

- **Estruturas de dados balanceadas e autoajustáveis**  
  Implementação de dicionários, conjuntos e mapas eficientes por meio de:  
  - Árvores AVL  
  - Árvores rubro-negras (red-black trees)  
  - Árvores B e B+  
  - Árvores de busca binária balanceadas (ex.: treaps, splay trees)

- **Outras aplicações relevantes**  
  - Hierarquias organizacionais e estruturas de gerenciamento  
  - Representação de expressões matemáticas  
  - Jogos e algoritmos de busca com poda (ex.: minimax com alpha-beta pruning)  
  - Indexação espacial (ex.: quadtrees, octrees, R-trees)

A versatilidade das árvores decorre de sua capacidade de oferecer operações eficientes (muitas vezes O(log n) em estruturas balanceadas) em cenários que envolvem ordenação, busca, hierarquia e prefixos.

### **Árvores Binárias**

É um tipo especial de árvore em que cada nó pode ter no máximo dois filhos, geralmente referidos como filho esquerdo e filho direito. Essa restrição de grau máximo igual a 2 simplifica significativamente a implementação das operações e permite o desenvolvimento de algoritmos eficientes para busca, inserção, remoção, travessias e balanceamento.

#### **Propriedades Matemáticas**

Apresentam relações matemáticas importantes que caracterizam seu tamanho, densidade e altura. As mais relevantes são:

- **Número máximo de nós no nível** $i$  
  Em uma árvore binária completa, o nível $i$ (considerando a raiz no nível 0) pode conter no máximo: $2^i$ nós. Isso ocorre porque, a cada nível, o número máximo de nós dobra em relação ao anterior.

- **Número máximo de nós em uma árvore de altura** $h$  
  Para uma árvore binária completa (cheia) de altura $h$ (raiz na altura 0):
   
   - No nível $0$ há $2^0=1$ nó
   - No nível $1$ há $2^1=2$ nós
   - No nível $2$ há $2^2=4$ nós
   - ...
   - No nível $h$ há $2^h$ nós

   Isto acontece porque cada nó tem exatamente dois filhos, logo o número de nós duplica de um nível para o seguinte. Assim, o número total máximo de nós é a soma dos nós em todos os níveis:

   $$2^0 + 2^1 + 2^2 + ... + 2^h$$
   
   Esta soma é uma progressão geométrica de razão $2$. Usando a fórmula da soma de uma PG finita,

   $$S = \frac{a(r^n - 1)}{r - 1}$$

   onde

   - $a = 1$ (primeiro termo, $2^0$)
   - $r = 2$
   - $n = h + 1$ (quantidade de termos)

   Substituindo:

   $$S = \frac{1(2^{h+1} - 1)}{2 - 1}$$

   Logo,

   $$S = (2^{h+1} - 1)$$

  Para uma árvore binária completa (ou cheia), o número total máximo de nós é dado pela soma de uma progressão geométrica: $2^0 + 2^1 + ... + 2^h = 2^{(h+1)} − 1$.

  Portanto, o número máximo de nós em uma árvore binária completa de altura $h$ é:

  $$2^{h+1} - 1$$

- **Altura mínima de uma árvore binária com** $n$ **nós**  
  A menor altura possível para acomodar $n$ nós ocorre quando a árvore é completa (ou quase completa).

  Sabemos que:

  $$n \leq 2^{h+1} - 1$$

  Então:

  $$n + 1 \leq 2^{h+1}$$
  
  Aplicando logaritmo base 2:

  $$log_2(n+1) \leq h+1$$

  Isolando $h$:

  $$h \geq log_2(n+1)-1$$

  Como a altura deve ser um número inteiro:

  $$h_{min} = [log_2(n+1)]-1$$


#### **Tipos de Árvores Binárias**

Podem ser classificadas de acordo com características estruturais. Abaixo estão os principais tipos, com definições e exemplos:

1. **Árvore Binária Completa**

    Uma árvore binária é dita **completa** quando:  
     - Todos os níveis, exceto possivelmente o último, estão completamente preenchidos;  
     - Todos os nós do último nível estão posicionados o mais à esquerda possível.
  
```
        1
      /   \
     2     3
    / \   /
   4   5 6
```

2. **Árvore Binária Cheia** (ou **estrita**):
  
    Uma árvore binária é dita **cheia** quando **cada nó possui exatamente 0 ou 2 filhos** (nunca possui apenas um filho).

```
        1
      /   \
     2     3
    / \   / \
   4   5 6   7

```

3. **Árvore Binária Perfeita**:

    Uma árvore binária é dita **perfeita** quando:  
      - É ao mesmo tempo **cheia** e **completa**;  
      - Todos os níveis estão completamente preenchidos;  
      - Todas as folhas estão localizadas no mesmo nível (o último).

```
        1
      /   \
     2     3
    / \   / \
   4   5 6   7

```

> **Observação**: Toda árvore perfeita é simultaneamente completa e cheia, mas o inverso não é verdadeiro.

4. **Árvore Binária de Busca (BST – Binary Search Tree)**:

    Uma árvore binária de busca é uma árvore binária que satisfaz a **propriedade de ordem** (ou propriedade de busca):

      - Para cada nó, todos os valores armazenados na **subárvore esquerda** são **menores** que o valor do nó;  
      - Todos os valores na **subárvore direita** são **maiores** que o valor do nó.  
      - Opcionalmente, em algumas definições, valores iguais podem ser permitidos em um dos lados.

```
        8
      /   \
     3     10
    / \      \
   1   6      14
      / \     /
     4   7   13

```

5. **Árvore Binária Balanceada**:

    Uma árvore binária é dita **balanceada** (no sentido amplo) quando a diferença entre as alturas das subárvores esquerda e direita de qualquer nó é **no máximo 1** (ou, em algumas definições, no máximo uma constante pequena). Esse conceito é especialmente importante em estruturas auto-balanceáveis, como:

      - Árvores **AVL** (diferença máxima = 1)  
      - Árvores **rubro-negras** (altura negra balanceada)

```
        5
      /   \
     3     8
    / \   / \
   1   4 6   9

```

## **Implementação**

### **Classe No**

Representa um nó genérico de uma árvore binária, contendo um valor e referências para os filhos esquerdo e direito.

In [3]:
class No:
    """
    Classe que representa um nó em uma árvore binária.

    Atributos:
        valor: O valor armazenado no nó.
        esquerda: Referência ao filho esquerdo (None se não existir).
        direita: Referência ao filho direito (None se não existir).
    """
    def __init__(self, valor):
        self.valor = valor
        self.esquerda = None
        self.direita = None

    def __repr__(self):
        """Representação técnica do nó para depuração."""
        return str(self.valor)

### **Classe ArvoreBinaria**


Classe principal que gerencia a estrutura da árvore binária, oferecendo operações básicas como verificação de vazio, cálculo de altura, contagem de nós e visualização textual.

In [4]:
class ArvoreBinaria:
    """
    Implementação de uma árvore binária genérica.

    Métodos principais:
    - esta_vazia()
    - altura()
    - __len__()          → número de nós
    - __str__()          → visualização textual bonita
    - __repr__()         → representação para depuração
    """
    def __init__(self, raiz=None):
        """
        Inicializa a árvore binária.

        Args:
            raiz (No | None): Nó raiz da árvore (opcional)
        """
        self.raiz = raiz

    def esta_vazia(self):
        """
        Verifica se a árvore não contém nenhum nó.

        Returns:
            bool: True se a árvore estiver vazia, False caso contrário.

        Complexidade: O(1)
        """
        return self.raiz is None

    def altura(self):
        """
        Calcula a altura da árvore.

        Returns:
            int: Altura da árvore (-1 se vazia, 0 para árvore com apenas raiz).

        Complexidade: O(n), onde n é o número de nós.
        """
        return self._altura_recursiva(self.raiz)

    def _altura_recursiva(self, no):
        """Método auxiliar recursivo para cálculo da altura."""
        if no is None:
            return -1  # Altura de árvore vazia
        return 1 + max(self._altura_recursiva(no.esquerda),
                       self._altura_recursiva(no.direita))

    def __len__(self):
        """
        Retorna o número total de nós na árvore.

        Returns:
            int: Quantidade de nós na árvore.

        Complexidade: O(n)
        """
        return self._tamanho_recursivo(self.raiz)

    def _tamanho_recursivo(self, no):
        """Método auxiliar recursivo para contagem de nós."""
        if no is None:
            return 0
        return 1 + self._tamanho_recursivo(no.esquerda) + self._tamanho_recursivo(no.direita)

    def __repr__(self):
        """Representação técnica da árvore (útil para depuração)."""
        return f"{self.__class__.__name__}(raiz={repr(self.raiz)})"

    def __str__(self):
        """
        Gera uma representação visual textual da árvore (visualização em pré-ordem invertida).

        Returns:
            str: Representação da árvore em formato de linhas indentadas.

        Complexidade: O(n)
        """
        if self.esta_vazia():
            return "<árvore vazia>"

        linhas = []
        self._coletar_linhas(self.raiz, "", linhas)
        return "\n".join(linhas)

    def _coletar_linhas(self, no, prefixo, linhas):
        """
        Método auxiliar recursivo para construção da representação textual.
        Exibe a subárvore direita primeiro (visualização "deitada" à direita).
        """
        if no is not None:
            # Visita primeiro o filho direito (para visualização mais natural)
            self._coletar_linhas(no.direita, prefixo + "   ", linhas)
            # Adiciona o nó atual
            linhas.append(prefixo + str(no.valor))
            # Visita o filho esquerdo
            self._coletar_linhas(no.esquerda, prefixo + "   ", linhas)


**Nota técnica:** A distinção entre `altura()` e `_altura_recursiva()` decorre de princípios formais de encapsulamento, separação de responsabilidades (SoC) e design orientado a interfaces públicas e privadas.

1. **Interface pública vs. implementação interna**

   `altura()` é o método público que o usuário da classe deve chamar. `_altura_recursiva()` é um método auxiliar privado (ou protegido), destinado apenas ao uso interno da classe. Exemplo de uso correto:


   ```Python
   arvore = ArvoreBinaria(...)
   print(arvore.altura())              # correto – interface pública
   print(arvore._altura(arvore.raiz))  # incorreto – implementação interna
   ```
2. **Assinatura mais simples e amigável para o usuário**
   
   O método público `altura()` não exige parâmetros:
   ```python
   def altura(self) -> int:
    return self._altura(self.raiz)
   ```
   Já o auxiliar recursivo precisa receber um nó qualquer:
   ```python
   def _altura(self, no: No | None) -> int:
    if no is None:
        return -1
    return 1 + max(self._altura(no.esquerda), self._altura(no.direita))
   ```
3. **Reutilização e extensibilidade**

   Ter o auxiliar separado permite que você reutilize a lógica em outros métodos no futuro, sem duplicação de código. Exemplos comuns:

   - Calcular a altura mínima de uma subárvore
   - Verificar se a árvore é balanceada (precisa da altura das subárvores esquerda e direita)
   - Encontrar o nó mais profundo
   - Calcular a soma dos níveis ponderada pela altura, etc.

### **Exemplo de Árvore**

Vamos construir e visualizar a seguinte árvore binária:

```
       10
      /  \
     5    15
    /
   3

```

In [5]:
# 1. Criação manual dos nós
raiz = No(10)
raiz.esquerda = No(5)
raiz.direita = No(15)
raiz.esquerda.esquerda = No(3)

# 2. Instanciação da árvore binária
arvore = ArvoreBinaria(raiz)

#### **Representações**

In [6]:
# Representação técnica (método __repr__)
print(repr(arvore))

ArvoreBinaria(raiz=10)


In [7]:
# Representação visual (método __str__)
print(arvore)

   15
10
   5
      3


#### **Consulta das propriedades básicas**


In [8]:
print(arvore.esta_vazia()) # Saída: False

False


In [9]:
print(arvore.altura())     # Saída: 2

2


O método `altura()` retorna $2$, que corresponde à maior distância (em número de arestas) da raiz até uma folha. A computação é realizada recursivamente:

```
altura(10)
├── altura(esquerda = 5)
│   ├── altura(esquerda = 3)
│   │   ├── esquerda = None  → -1
│   │   ├── direita  = None  → -1
│   │   └── retorna 1 + max(-1, -1) = 0
│   ├── direita = None → -1
│   └── retorna 1 + max(0, -1) = 1
├── altura(direita = 15)
│   ├── esquerda = None → -1
│   ├── direita  = None → -1
│   └── retorna 1 + max(-1, -1) = 0
└── retorna 1 + max(1, 0) = 2
```


In [10]:
print(len(arvore))         # Saída: 4

4


O método `__len__()` (ou `len(arvore)`) retorna $4$, que é o número total de nós na árvore.
A computação recursiva segue o seguinte percurso:

```
tamanho(10)
├── tamanho(esquerda = 5)
│   ├── tamanho(esquerda = 3)
│   │   ├── esquerda = None → 0
│   │   ├── direita  = None → 0
│   │   └── retorna 1 + 0 + 0 = 1
│   ├── direita = None → 0
│   └── retorna 1 + 1 + 0 = 2
├── tamanho(direita = 15)
│   ├── esquerda = None → 0
│   ├── direita  = None → 0
│   └── retorna 1 + 0 + 0 = 1
└── retorna 1 + 2 + 1 = 4
```

## **Percursos em Árvores Binárias**

Os percursos em árvores binárias consistem em visitar todos os nós da árvore seguindo uma ordem específica. Esses percursos são fundamentais em diversas aplicações, como:

- Avaliação de expressões aritméticas (árvores de expressão)
- Serialização e desserialização de árvores
- Geração de sequências ordenadas (em-ordem em BST)
- Impressão hierárquica, cópia de estruturas e algoritmos de busca

Existem quatro percursos clássicos em árvores binárias:

1. **Pré-ordem** (Pre-order): Raiz → Esquerda → Direita  
2. **Em-ordem** (In-order): Esquerda → Raiz → Direita  
3. **Pós-ordem** (Post-order): Esquerda → Direita → Raiz  
4. **Em largura** (Level-order / Breadth-first): Nível a nível, da esquerda para a direita

Consideraremos a seguinte árvore binária para os exemplos:

```
       10
      /  \
     5    15
    /
   3

```

### **Percursos em Profundidade (Depth-First Traversals)**

#### **Pré-ordem (Pre-order)**

Visita primeiro a raiz, depois recursivamente a subárvore esquerda e por fim a subárvore direita.

In [11]:
def pre_ordem(no):
    """
    Percorre a árvore em pré-ordem e retorna a lista de valores visitados.

    Args:
        no: Nó atual da subárvore

    Returns:
        list: Lista de valores na ordem pré-ordem
    """
    if no is None:
        return []

    resultado = [no.valor]                   # Visita o nó atual
    resultado.extend(pre_ordem(no.esquerda)) # Visita a subárvore esquerda
    resultado.extend(pre_ordem(no.direita))  # Visita a subárvore direita

    return resultado

# Testando os percurso
print(f"Percurso em pré-ordem: {pre_ordem(raiz)}")

Percurso em pré-ordem: [10, 5, 3, 15]


#### **Em-ordem (In-order)**

Visita primeiro a subárvore esquerda, depois a raiz e por fim a subárvore direita.

In [12]:
def em_ordem(no):
    """
    Percorre a árvore em ordem simétrica (in-order).

    Returns:
        list: Lista de valores na ordem em-ordem
    """
    if no is None:
        return []

    resultado = em_ordem(no.esquerda)      # Visita a subárvore esquerda
    resultado.append(no.valor)             # Visita o nó atual
    resultado.extend(em_ordem(no.direita)) # Visita a subárvore direita

    return resultado

# Testando os percurso
print(f"Percurso em em-ordem: {em_ordem(raiz)}")

Percurso em em-ordem: [3, 5, 10, 15]


> **Observação:** Em uma árvore binária de busca (BST), o percurso em-ordem retorna os valores em ordem crescente.

#### **Pós-ordem (Post-order)**

Visita primeiro a subárvore esquerda, depois a subárvore direita e por fim a raiz.

In [13]:
def pos_ordem(no):
    """
    Percorre a árvore em pós-ordem.

    Returns:
        list: Lista de valores na ordem pós-ordem
    """
    if no is None:
        return []

    resultado = pos_ordem(no.esquerda)      # Visita a subárvore esquerda
    resultado.extend(pos_ordem(no.direita)) # Visita a subárvore direita
    resultado.append(no.valor)              # Visita o nó atual

    return resultado

# Testando os percurso
print(f"Percurso em pós-ordem: {pos_ordem(raiz)}")

Percurso em pós-ordem: [3, 5, 15, 10]


> **Aplicação comum:** Útil para deletar uma árvore (liberar memória dos filhos antes do pai) e para avaliar expressões aritméticas.

### **Percursos em Largura (Level-order / Breadth-first)**

Visita os nós nível a nível, da esquerda para a direita, utilizando uma fila.

In [14]:
from collections import deque

def largura(raiz):
    """
    Realiza o percurso em largura (nível a nível) usando uma fila.

    Args:
        raiz: Nó raiz da árvore

    Returns:
        list: Lista de valores na ordem de nível
    """
    if raiz is None:
        return []

    fila = deque([raiz])
    resultado = []

    while fila:
        no = fila.popleft()          # Remove da frente da fila
        resultado.append(no.valor)   # Visita o nó atual

        if no.esquerda:
            fila.append(no.esquerda) # Adiciona filho esquerdo
        if no.direita:
            fila.append(no.direita)  # Adiciona filho direito

    return resultado

# Testando os percurso
print(f"Percurso em largura: {largura(raiz)}")  # [10, 5, 15, 3]

Percurso em largura: [10, 5, 15, 3]


## **Exercícios Práticos**

**Exercício 1:** Verificar se a Árvore é Estritamente Binária. Uma árvore é estritamente binária se cada nó tem 0 ou 2 filhos.

**Exercício 2:** Busca de Valor. Implemente um método `buscar(valor)` que retorne `True` se o valor estiver na árvore, ou `False` caso contrário.

**Exercício 3:** Contar Folhas. Implemente um método que conte o número de nós folha (nós que não têm filhos).

**Exercício 4:** Verificar Igualdade. Implemente um método `sao_identicas(outra_arvore)` que retorne `True` se a estrutura e os valores de ambas as árvores forem idênticos, ou `False` caso contrário.

**Exercício 5:** Caminho até um Valor. Implemente um método que retorne o caminho da raiz até um determinado valor como uma lista.


**Exercício 6:** Espelhar a Árvore. Implemente um método que modifique a árvore trocando os filhos esquerdo e direito de todos os nós.