# Árvores


## O que é uma árvore?

> Estrutura de dados definida por uma coleção de elementos (os nós) conectados entre si que modelam relações hierárquicas. Em outras palavras, mantendo as seguintes propriedades:

- Existe um nó específico, chamado raiz, que fica no topo da hierarquia
- Todo nó é conectado a raiz por um único caminho


> Uma árvore é um grafo sem ciclos, que possui ligação entre quaisquer 2 nós seus através de um único caminho e mantém uma noção de hierarquia entre seus membros.



&nbsp;

Árvores são aplicadas em diversas áreas além da matemática e da computação. Por exemplo, a [árvore filogenética](https://pt.wikipedia.org/wiki/%C3%81rvore_filogen%C3%A9tica) que agrupa espécies de acordo com suas relações evolutivas. 

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/7/70/Phylogenetic_tree.svg/langpt-1024px-Phylogenetic_tree.svg.png" width=600 style="background: white">

&nbsp;

Um organograma empresarial, que também é um exemplo de árvore:

<img src="https://www.nibo.com.br/wp-content/uploads/2014/12/organograma_tradicional-1024x554.jpg" width=600>

Há apenas **um caminho** entre o presidente (a raiz) e cada um dos demais nós.

O caminho do "presidente" até o "auxiliar de marketing", seria:

`"presidente"-> "diretor comercial"-> "gerente de marketing"-> "auxiliar de marketing".`


## Terminologia

Para falarmos desta estrutura, definir e analisar algoritmos sobre ela, é necessário nomearmos algumas partes específicas sobre as quais faremos referência posteriormente.

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/8dfbec82-e81b-43da-8867-0f27cf6cd44f.png" width=600>

Algumas definições tomando como exemplo a figura acima:

- Quando um nó A está diretamente acima de um nó B, dizemos que A é `pai` de B ou que B é `filho` de A.
- `Raiz` é o topo da hierarquia (A)
- `Folhas` são os nós na camada mais baixa da hierarquia, os nós que não têm filhos (H, I, F, G)
- `Nós internos` são os nós que não são folhas nem raiz (B, C, D, E)
- `Altura` da árvore (`h`): é a distância entre a raiz e a folha mais afastada
- De acordo com a definição, `um único nó, sozinho, também é uma árvore`
- Toda sub-árvore é árvore (estrutura recursiva)
- Todo nó, exceto a raiz, tem exatamente um nó pai




## Tipos de árvores

- Árvores básicas (genéricas)
  - Árvores genéricas
  - Árvores Binárias
  
&nbsp;

- Árvores Binárias de Busca
  - Árvores Binárias de Busca
  - Árvores Binárias de Partilha (versão melhorada da árvore binária de busca)

&nbsp;

- Árvores balanceadas
  - Árvores AVL
  - Árvores Graduadas / Rubro Negras
  - Árvores B

## Árvore Binária de Busca (Binary Search Tree)

Tipo específico de árvore. 
Além das propriedades básicas de uma árvore, também precisa satisfazer as seguintes:

- Todo nó tem no máximo `dois` filhos
- Para cada nó `n`, `n` é `maior` que todos os nós a sua `esquerda` e `menor` que todos os nós a sua `direita`.

&nbsp;

Abaixo um exemplo de árvore binária de pesquisa

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/61af9259-b2d0-444c-bef0-22ae71c0b9f2.png" width=600>

### Implementação

Para implementar ela, criamos primeiro uma classe nó com três atributos:

- conteúdo: o valor útil, qualquer valor ou dado, ou algo que faça referência a um objeto mais complexo. Neste caso, vamos armaenar um número `inteiro`.
- esquerda: referência ao filho à esquerda
- direita: referência ao filho à direita

Vamos implementar também os métodos mágicos `__repr__` e `__str__`.

O `__str__` deve imprimir uma string no formato `valor_esquerda | valor_no_atual | valor_direita` 

In [None]:
class No:
    pass

In [None]:
class ArvoreBinariaBusca:
    def __init__(self):
        self.raiz: No = None
    
    # Imprimir com a raiz no topo, e o corpo para baixo
    def imprimir(self):
        """
        Imprime a árvore na horizontal, com a raiz no topo e os filhos abaixo,
        de forma visualmente estruturada e espaçada.
        """
        if not self.raiz:
            print("Árvore vazia.")
            return

        # 1. Coleta todos os nós, organizados por nível, incluindo espaços vazios (None)
        niveis, max_largura_valor = self._coletar_niveis_e_largura()
        
        profundidade = len(niveis)
        # Largura de cada "célula" que conterá um número
        largura_celula = max_largura_valor + 2 # Adiciona 2 para um espaço em cada lado

        # 2. Itera pelos níveis e imprime cada um com o espaçamento correto
        for i, nivel in enumerate(niveis):
            # O espaço entre os centros dos nós em um determinado nível
            intervalo = (2**(profundidade - i - 1)) * largura_celula
            
            # Preenchimento inicial para centralizar a linha inteira
            padding_inicial = (intervalo // 2) - (largura_celula // 2)
            
            linha = " " * padding_inicial

            for no in nivel:
                if no:
                    # Formata o valor do nó para estar centralizado na sua "célula"
                    valor_str = str(no.valor).center(largura_celula)
                else:
                    # Célula vazia para nós nulos
                    valor_str = " " * largura_celula
                
                # O espaço entre as células na linha atual
                espaco_entre = " " * (intervalo - largura_celula)
                linha += valor_str + espaco_entre

            print(linha)
            print() # Adiciona uma linha em branco para melhor visualização


    def _coletar_niveis_e_largura(self):
        """
        Método auxiliar que realiza uma busca em largura (BFS) para agrupar
        os nós por nível e também calcula a largura máxima dos valores.
        Retorna uma tupla: (lista_de_niveis, max_largura).
        """
        if not self.raiz:
            return [], 0

        niveis = []
        fila_atual = [self.raiz]
        max_largura = 0
        
        # Continua enquanto o nível atual tiver pelo menos um nó não-nulo
        while any(fila_atual):
            # Atualiza a largura máxima encontrada até agora
            for no in fila_atual:
                if no and len(str(no.valor)) > max_largura:
                    max_largura = len(str(no.valor))

            niveis.append(fila_atual)
            proxima_fila = []
            
            for no in fila_atual:
                if no:
                    proxima_fila.append(no.esquerda)
                    proxima_fila.append(no.direita)
                else:
                    # Adiciona placeholders para manter a estrutura
                    proxima_fila.append(None)
                    proxima_fila.append(None)
            
            fila_atual = proxima_fila
            
        return niveis, max_largura
    
    # Adicionar nós
    def adicionar(self, valor: int):
        self.raiz = self.__adicionar(self.raiz, valor)

    def __adicionar(self, no: No, valor: int) -> No:
        if no is None:
            return No(valor)
        
        if valor <= no.valor:
            no.esquerda = self.__adicionar(no.esquerda, valor)
        else:
            no.direita = self.__adicionar(no.direita, valor)
        return no

In [None]:
arvore = ArvoreBinariaBusca()

arvore.adicionar(15)
arvore.adicionar(6)
arvore.adicionar(3)
arvore.adicionar(2)
arvore.adicionar(4)
arvore.adicionar(7)
arvore.adicionar(13)
arvore.adicionar(18)
arvore.adicionar(17)
arvore.adicionar(20)

arvore.imprimir()

Agora, vamos implementar a busca binária

In [None]:
class ArvoreBinariaBusca:
    def __init__(self):
        self.raiz: No = None
    
    # Imprimir com a raiz no topo, e o corpo para baixo
    def imprimir(self):
        """
        Imprime a árvore na horizontal, com a raiz no topo e os filhos abaixo,
        de forma visualmente estruturada e espaçada.
        """
        if not self.raiz:
            print("Árvore vazia.")
            return

        # 1. Coleta todos os nós, organizados por nível, incluindo espaços vazios (None)
        niveis, max_largura_valor = self._coletar_niveis_e_largura()
        
        profundidade = len(niveis)
        # Largura de cada "célula" que conterá um número
        largura_celula = max_largura_valor + 2 # Adiciona 2 para um espaço em cada lado

        # 2. Itera pelos níveis e imprime cada um com o espaçamento correto
        for i, nivel in enumerate(niveis):
            # O espaço entre os centros dos nós em um determinado nível
            intervalo = (2**(profundidade - i - 1)) * largura_celula
            
            # Preenchimento inicial para centralizar a linha inteira
            padding_inicial = (intervalo // 2) - (largura_celula // 2)
            
            linha = " " * padding_inicial

            for no in nivel:
                if no:
                    # Formata o valor do nó para estar centralizado na sua "célula"
                    valor_str = str(no.valor).center(largura_celula)
                else:
                    # Célula vazia para nós nulos
                    valor_str = " " * largura_celula
                
                # O espaço entre as células na linha atual
                espaco_entre = " " * (intervalo - largura_celula)
                linha += valor_str + espaco_entre

            print(linha)
            print() # Adiciona uma linha em branco para melhor visualização


    def _coletar_niveis_e_largura(self):
        """
        Método auxiliar que realiza uma busca em largura (BFS) para agrupar
        os nós por nível e também calcula a largura máxima dos valores.
        Retorna uma tupla: (lista_de_niveis, max_largura).
        """
        if not self.raiz:
            return [], 0

        niveis = []
        fila_atual = [self.raiz]
        max_largura = 0
        
        # Continua enquanto o nível atual tiver pelo menos um nó não-nulo
        while any(fila_atual):
            # Atualiza a largura máxima encontrada até agora
            for no in fila_atual:
                if no and len(str(no.valor)) > max_largura:
                    max_largura = len(str(no.valor))

            niveis.append(fila_atual)
            proxima_fila = []
            
            for no in fila_atual:
                if no:
                    proxima_fila.append(no.esquerda)
                    proxima_fila.append(no.direita)
                else:
                    # Adiciona placeholders para manter a estrutura
                    proxima_fila.append(None)
                    proxima_fila.append(None)
            
            fila_atual = proxima_fila
            
        return niveis, max_largura
    
    # Adicionar nós
    def adicionar(self, valor: int):
        self.raiz = self.__adicionar(self.raiz, valor)

    def __adicionar(self, no: No, valor: int) -> No:
        if no is None:
            return No(valor)
        
        if valor <= no.valor:
            no.esquerda = self.__adicionar(no.esquerda, valor)
        else:
            no.direita = self.__adicionar(no.direita, valor)
        return no
    
    # método de busca binária

    # FUNÇÃO buscar(valor_alvo):
    #     RETORNAR __buscar(raiz_da_arvore, valor_alvo)
    # FIM FUNÇÃO

    # FUNÇÃO __buscar(no_atual, valor_alvo):
    #     SE no_atual É NULO:
    #         RETORNAR NULO

    #     SE valor_alvo É IGUAL A no_atual.valor:
    #         RETORNAR no_atual
    #     SENÃO SE valor_alvo É MENOR OU IGUAL A no_atual.valor:
    #         RETORNAR __buscar(no_atual.esquerda, valor_alvo)
    #     SENÃO:
    #         RETORNAR __buscar(no_atual.direita, valor_alvo)
    # FIM FUNÇÃO

In [None]:
arvore = ArvoreBinariaBusca()
arvore.imprimir()

arvore.adicionar(15)
arvore.adicionar(6)
arvore.adicionar(3)
arvore.adicionar(2)
arvore.adicionar(4)
arvore.adicionar(7)
arvore.adicionar(13)
arvore.adicionar(18)
arvore.adicionar(17)
arvore.adicionar(20)

arvore.imprimir()

encontrado = arvore.buscar(17)
print(encontrado)

encontrado = arvore.buscar(3)
print(encontrado)

encontrado = arvore.buscar(11)
print(encontrado)

### Percurso em árvore

As vezes pode ser necessário percorrer todos os nós da árvore: `percurso`.

Para isso é necessário `visitar` cada um de seus nós (visitar significa operar, de alguma forma, a informação existente no nó);. Passar de um nó pai para um filho não configura visitar o pai, por exemplo.

Para realizar o percurso na árvore, é necessário visitar o nó pai, seu filho da esquerda e seu filho da direita. É este o algoritmo.

A ordem da visita (primeiro o pai, o filho da direita ou da esquerda) é decidida pelo programador, dependendo da necessidade.

#### Percurso em ordem
 
A existência da propriedade de árvore de pesquisa binária permite que seja possível imprimir todos os valores da árvore em sequência ordenada. No percurso em ordem é impresso
1) O valor da subárvore à esquerda
2) O valor da raiz
3) O valor da subárvore à direita
 
&nbsp;
 
#### Percurso pré-ordem
No percurso pré-ordem é impresso
1) O valor da raiz
2) O valor da subárvore à esquerda
3) O valor da subárvore à direita
 
&nbsp;
 
#### Percurso pós-ordem
No percurso pós-ordem é impresso
1) O valor da subárvore à esquerda
2) O valor da subárvore à direita
3) O valor da raiz
 
&nbsp;
 
É importante mencionar que os percursos só definem o valor da raiz antes, entre ou depois dos nós, mas não obrigam a impressão do nó da esquerda antes do da direita. Isto depende do programador.

Agora vamos implementar o `percurso em ordem`

In [None]:
class ArvoreBinariaBusca:
    def __init__(self):
        self.raiz: No = None
    
    # Imprimir com a raiz no topo, e o corpo para baixo
    def imprimir(self):
        """
        Imprime a árvore na horizontal, com a raiz no topo e os filhos abaixo,
        de forma visualmente estruturada e espaçada.
        """
        if not self.raiz:
            print("Árvore vazia.")
            return

        # 1. Coleta todos os nós, organizados por nível, incluindo espaços vazios (None)
        niveis, max_largura_valor = self._coletar_niveis_e_largura()
        
        profundidade = len(niveis)
        # Largura de cada "célula" que conterá um número
        largura_celula = max_largura_valor + 2 # Adiciona 2 para um espaço em cada lado

        # 2. Itera pelos níveis e imprime cada um com o espaçamento correto
        for i, nivel in enumerate(niveis):
            # O espaço entre os centros dos nós em um determinado nível
            intervalo = (2**(profundidade - i - 1)) * largura_celula
            
            # Preenchimento inicial para centralizar a linha inteira
            padding_inicial = (intervalo // 2) - (largura_celula // 2)
            
            linha = " " * padding_inicial

            for no in nivel:
                if no:
                    # Formata o valor do nó para estar centralizado na sua "célula"
                    valor_str = str(no.valor).center(largura_celula)
                else:
                    # Célula vazia para nós nulos
                    valor_str = " " * largura_celula
                
                # O espaço entre as células na linha atual
                espaco_entre = " " * (intervalo - largura_celula)
                linha += valor_str + espaco_entre

            print(linha)
            print() # Adiciona uma linha em branco para melhor visualização


    def _coletar_niveis_e_largura(self):
        """
        Método auxiliar que realiza uma busca em largura (BFS) para agrupar
        os nós por nível e também calcula a largura máxima dos valores.
        Retorna uma tupla: (lista_de_niveis, max_largura).
        """
        if not self.raiz:
            return [], 0

        niveis = []
        fila_atual = [self.raiz]
        max_largura = 0
        
        # Continua enquanto o nível atual tiver pelo menos um nó não-nulo
        while any(fila_atual):
            # Atualiza a largura máxima encontrada até agora
            for no in fila_atual:
                if no and len(str(no.valor)) > max_largura:
                    max_largura = len(str(no.valor))

            niveis.append(fila_atual)
            proxima_fila = []
            
            for no in fila_atual:
                if no:
                    proxima_fila.append(no.esquerda)
                    proxima_fila.append(no.direita)
                else:
                    # Adiciona placeholders para manter a estrutura
                    proxima_fila.append(None)
                    proxima_fila.append(None)
            
            fila_atual = proxima_fila
            
        return niveis, max_largura
    
    # Adicionar nós
    def adicionar(self, valor: int):
        self.raiz = self.__adicionar(self.raiz, valor)

    def __adicionar(self, no: No, valor: int) -> No:
        if no is None:
            return No(valor)
        
        if valor <= no.valor:
            no.esquerda = self.__adicionar(no.esquerda, valor)
        else:
            no.direita = self.__adicionar(no.direita, valor)
        return no
    
    # Busca binária
    

    # Percurso em ordem

In [None]:
arvore = ArvoreBinariaBusca()
arvore.imprimir()

arvore.adicionar(15)
arvore.adicionar(6)
arvore.adicionar(3)
arvore.adicionar(2)
arvore.adicionar(4)
arvore.adicionar(7)
arvore.adicionar(13)
arvore.adicionar(18)
arvore.adicionar(17)
arvore.adicionar(20)

arvore.percurso_em_ordem()
print()

### Busca em Profundidade (DFS)

O percurso em árvore, da forma como descrito, é uma estratégia de busca conhecida como **Busca em Profundidade** (**DFS - Depth-First Search**). O nome "em profundidade" vem da natureza do algoritmo: ele explora um "galho" da árvore o mais fundo possível antes de voltar (fazer o *backtracking*) para explorar os outros galhos.

Imagine que você está explorando um labirinto: em vez de dar um passo em cada corredor disponível, você escolhe um corredor e vai até o final. Se não houver saída, você volta até a última encruzilhada e tenta o próximo corredor inexplorado. É exatamente assim que os algoritmos de percurso pré-ordem, em-ordem e pós-ordem funcionam.

**Por que a Busca em Profundidade é Importante?**

A Busca em Profundidade é fundamental porque permite utilizar a estrutura hierárquica da árvore para resolver problemas de forma eficiente. A ordem em que os nós são visitados não é arbitrária; cada tipo de percurso tem uma finalidade prática que depende da relação entre pais e filhos:

- Criar cópias ou salvar a árvore: O percurso **pré-ordem** (`Raiz -> Esquerda -> Direita`) é ideal para essa tarefa. Ao processar a raiz primeiro, podemos criar o nó pai antes de criar recursivamente seus filhos, resultando em uma cópia exata da estrutura original.

- Obter dados em ordem: Em uma Árvore Binária de Busca, o percurso **em-ordem** (`Esquerda -> Raiz -> Direita`) tem a propriedade especial de visitar os nós em ordem crescente de valor. Isso é extremamente útil para extrair os dados de forma ordenada sem a necessidade de um algoritmo de ordenação adicional.

- Liberar memória ou deletar nós: O percurso **pós-ordem** (`Esquerda -> Direita -> Raiz`) é usado quando precisamos operar nos filhos antes de operar no pai. O exemplo clássico é deletar uma árvore inteira: para evitar que os nós filhos fiquem "órfãos", deletamos primeiro os da esquerda, depois os da direita, e por último a raiz.