## Árvores


### O que é uma árvore?

Árvore é uma estrutura de dados definida por uma coleção de elementos, chamados nós, que são conectados entre si de maneira a modelar relações hierarquicas, mantendo as seguintes propriedades:

- Existe um nó específico, chamado raiz, que fica no topo da hierarquia
- Todo nó é conectado a raiz por um único caminho

Existem diversos exemplos em outras áreas, além da matemática e da ciência da computação, onde árvores são utilizadas.
Por exemplo, a [árvore filogenética](https://pt.wikipedia.org/wiki/%C3%81rvore_filogen%C3%A9tica) que agrupa espécies de acordo com suas relações evolutivas. 

A figura abaixo mostra um organograma empresarial, que também é um exemplo de árvore:

<img src="https://www.nibo.com.br/wp-content/uploads/2014/12/organograma_tradicional-1024x554.jpg" width=600>

Fazendo o paralelo com a nossa definição: o "presidente", que está no topo da hierarquia, é a raiz da árvore.

Note que há apenas **um caminho** entre o presidente e cada um dos demais nós.

Por exemplo, o caminho do "presidente" até o "auxiliar de marketing", seria:

`"presidente"-> "diretor comercial"-> "gerente de marketing"-> "auxiliar de marketing".`

_________

### Terminologia

Para falarmos desta estrutura, definir e analisar algoritmos sobre ela, é necessário nomearmos algumas partes específicas sobre as quais faremos referência posteriormente.

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/8dfbec82-e81b-43da-8867-0f27cf6cd44f.png" width=600>

Algumas definições tomando como exemplo a figura acima:

- Quando um nó A está diretamente acima de um nó B, dizemos que A é "pai" de B ou que B é "filho" de A.
- Raiz: é o topo da hierarquia (A)
- Folhas: são os nós na camada mais baixa da hierarquia, os nós que não têm filhos (H, I, F, G)
- Nós internos: são os nós que não são folhas nem raiz (B, C, D, E)
- Altura da árvore (`h`): é a distância entre a raiz e a folha mais afastada
- de acordo com a definição, um único nó, sozinho, também é uma árvore
- toda sub-árvore é árvore (estrutura recursiva)
- todo nó, exceto a raiz, tem exatamente um nó pai




_________

### Árvore Binária de Busca (Binary Search Tree)

Uma árvore binária de busca é um tipo mais específico de árvore. Além das propriedades básicas de uma árvore, também precisa satisfazer as seguintes:

- Todo nó tem no máximo dois filhos
- Para cada nó v, v é maior que todos os nós a sua esquerda e menor que todos os nós a sua direita

### Implementação

Para implementar uma estrutura de árvore binária de busca, criamos uma classe nó com três atributos:

- conteúdo: o valor útil, qualquer valor ou dado, ou algo que faça referência a um objeto mais complexo
- esquerda: referência ao filho à esquerda
- direita: referência ao filho à direita

2, 4, 2, 7, 6, 13, 15, 17, 18, 20

A figura abaixo mostra uma representação dessa implementação:

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/61af9259-b2d0-444c-bef0-22ae71c0b9f2.png" width=600>


In [None]:
class Arvore:
    class No:
        def __init__(self, valor: int):
            self.valor = valor
            self.esquerda = None
            self.direita = None    
        
        def __repr__(self):
            return self.__str__()

        def __str__(self):
            valor_esquerda = None if self.esquerda is None else self.esquerda.valor
            valor_direita = None if self.direita is None else self.direita.valor
            return f'{valor_esquerda} | {self.valor} | {valor_direita}'
    
    def __init__(self):
        self.raiz: No = None

In [None]:
arvore = Arvore()

In [None]:
arvore

O que faltou?

Vamos adicionar uma forma de imprimir os valores. A impressão não vai ser no sentido igual à representação acima, será feita de lado.

In [None]:
class Arvore:
    class No:
        def __init__(self, valor: int):
            self.valor = valor
            self.esquerda = None
            self.direita = None    
        
        def __repr__(self):
            return self.__str__()

        def __str__(self):
            valor_esquerda = None if self.esquerda is None else self.esquerda.valor
            valor_direita = None if self.direita is None else self.direita.valor
            return f'{valor_esquerda} | {self.valor} | {valor_direita}'
    
    def __init__(self):
        self.raiz: No = None

    def imprimir(self):
            print()
            self.__imprimir(self.raiz, 0)
            print()

    def __imprimir(self, no, espacos: int):
        if no is None:
            return
        self.__imprimir(no.direita, espacos + 3)
        i = 0
        while i < espacos:
            print("   ", end="")
            i += 1
        print(no.valor, "\n")
        self.__imprimir(no.esquerda, espacos + 3)

In [None]:
arvore = Arvore()

In [None]:
arvore.imprimir()

Mas vamos imprimir quem, se não adicionamos ninguém?

Alias, como vamos adicionar alguém?

In [1]:
class Arvore:
    class No:
        def __init__(self, valor: int):
            self.valor = valor
            self.esquerda = None
            self.direita = None    
        
        def __repr__(self):
            return self.__str__()

        def __str__(self):
            valor_esquerda = None if self.esquerda is None else self.esquerda.valor
            valor_direita = None if self.direita is None else self.direita.valor
            return f'{valor_esquerda} | {self.valor} | {valor_direita}'
    
    def __init__(self):
        self.raiz: No = None
    
    # método para imprimir a árvore
    def imprimir(self):
        print()
        self.__imprimir(self.raiz, 0)
        print()

    def __imprimir(self, no, espacos: int):
        if no is None:
            return
        self.__imprimir(no.direita, espacos + 3)
        i = 0
        while i < espacos:
            print("   ", end="")
            i += 1
        print(no.valor, "\n")
        self.__imprimir(no.esquerda, espacos + 3)

    def adicionar(self, valor: int):
        self.raiz = self.__adicionar(self.raiz, valor)

    def __adicionar(self, no: No, valor: int):
        if no is None:
            return self.No(valor)
        
        if valor <= no.valor:
            no.esquerda = self.__adicionar(no.esquerda, valor)
        else:
            no.direita = self.__adicionar(no.direita, valor)
        return no


In [2]:
arvore = Arvore()
arvore.imprimir()

arvore.adicionar(15)
arvore.adicionar(6)
arvore.adicionar(3)
arvore.adicionar(2)
arvore.adicionar(4)
arvore.adicionar(7)
arvore.adicionar(13)
arvore.adicionar(18)
arvore.adicionar(17)
arvore.adicionar(20)

arvore.imprimir()




                  20 

         18 

                  17 

15 

                           13 

                  7 

         6 

                           4 

                  3 

                           2 




Vamos implementar a busca binária:

In [None]:
class Arvore:
    class No:
        def __init__(self, valor: int):
            self.valor = valor
            self.esquerda = None
            self.direita = None
            
        def __repr__(self):
            return self.__str__()

        def __str__(self):
            valor_esquerda = None if self.esquerda is None else self.esquerda.valor
            valor_direita = None if self.direita is None else self.direita.valor
            return f'{valor_esquerda} | {self.valor} | {valor_direita}'
    
    def __init__(self):
        self.raiz: No = None
    
    # método para imprimir a árvore
    def imprimir(self):
        print()
        self.__imprimir(self.raiz, 0)
        print()

    def __imprimir(self, no, espacos: int):
        if no is None:
            return
        self.__imprimir(no.direita, espacos + 3)
        i = 0
        while i < espacos:
            print("   ", end="")
            i += 1
        print(no.valor, "\n")
        self.__imprimir(no.esquerda, espacos + 3)
        
    # método para adicionar nó
    def adicionar(self, valor: int):
        self.raiz = self.__adicionar(self.raiz, valor)

    def __adicionar(self, no: No, valor: int):
        if no is None:
            return self.No(valor)
        
        if valor <= no.valor:
            no.esquerda = self.__adicionar(no.esquerda, valor)
        else:
            no.direita = self.__adicionar(no.direita, valor)
        return no
    
    # método de busca binária
    def buscar(self, valor: int):
        return self.__buscar(self.raiz, valor)

    def __buscar(self, no: No, valor: int):
        if no is None:
            return None
        
        if valor == no.valor:
            return no
        elif valor <= no.valor:
            return self.__buscar(no.esquerda, valor)
        else:
            return self.__buscar(no.direita, valor)
    

In [None]:
arvore = Arvore()
arvore.imprimir()

arvore.adicionar(15)
arvore.adicionar(6)
arvore.adicionar(3)
arvore.adicionar(2)
arvore.adicionar(4)
arvore.adicionar(7)
arvore.adicionar(13)
arvore.adicionar(18)
arvore.adicionar(17)
arvore.adicionar(20)

arvore.imprimir()

encontrado = arvore.buscar(17)
print(encontrado)

encontrado = arvore.buscar(3)
print(encontrado)

In [None]:
encontrado

### Percurso em árvore

Em determinadas situações pode ser necessário percorrer todos os nós da árvore - esta ação é chamada de `percurso` na árvore. Para isto, é necessário `visitar` cada um de seus nós pelo menos uma vez. É importante ressaltar que visitar significa operar, de alguma forma, com a informação existente no nó. O simples percurso de um nó pai para chegar ao filho da esquerda, por exemplo, não configura visitar o pai.
 
Para realizar o percurso na árvore, ou em qualquer uma de suas subárvores, é necessário visitar o nó pai e seus dois filhos da esquerda e da direita. O algoritmo de percurso é este, visitar o nó pai e percorrer seus filhos da esquerda e da direita até acabarem-se todos os nós.
 
Porém, quando formos visitar, qual será visitado primeiro? Vamos primeiro no pai, no filho da direita ou da esquerda? Bem, podemos implementar todos, e o programador decide quando usar um ou outro de acordo com sua necessidade.

#### Percurso em ordem
 
A existência da propriedade de árvore de pesquisa binária permite que seja possível imprimir todos os valores da árvore em sequência ordenada. No percurso em ordem é impresso
1) O valor da subárvore à esquerda
2) O valor da raiz
3) O valor da subárvore à direita
 
&nbsp;
 
#### Percurso pré-ordem
No percurso pré-ordem é impresso
1) O valor da raiz
2) O valor da subárvore à esquerda
3) O valor da subárvore à direita
 
&nbsp;
 
#### Percurso pós-ordem
No percurso pós-ordem é impresso
1) O valor da subárvore à esquerda
2) O valor da subárvore à direita
3) O valor da raiz
 
&nbsp;
 
É importante mencionar que os percursos só definem o valor da raiz antes, entre ou depois dos nós, mas não obrigam a impressão do nó da esquerda antes do da direita. Isto depende do programador.

In [None]:
class Arvore:
    class No:
        def __init__(self, valor: int):
            self.valor = valor
            self.esquerda = None
            self.direita = None
            
        def __repr__(self):
            return self.__str__()

        def __str__(self):
            valor_esquerda = None if self.esquerda is None else self.esquerda.valor
            valor_direita = None if self.direita is None else self.direita.valor
            return f'{valor_esquerda} | {self.valor} | {valor_direita}'
    
    def __init__(self):
        self.raiz: No = None
    
    # método para imprimir a árvore
    def imprimir(self):
        print()
        self.__imprimir(self.raiz, 0)
        print()

    def __imprimir(self, no, espacos: int):
        if no is None:
            return
        self.__imprimir(no.direita, espacos + 3)
        i = 0
        while i < espacos:
            print("   ", end="")
            i += 1
        print(no.valor, "\n")
        self.__imprimir(no.esquerda, espacos + 3)
        
    # método para adicionar nó
    def adicionar(self, valor: int):
        self.raiz = self.__adicionar(self.raiz, valor)

    def __adicionar(self, no: No, valor: int):
        if no is None:
            return self.No(valor)
        
        if valor <= no.valor:
            no.esquerda = self.__adicionar(no.esquerda, valor)
        else:
            no.direita = self.__adicionar(no.direita, valor)
        return no
    
    # método de busca binária
    def buscar(self, valor: int):
        return self.__buscar(self.raiz, valor)

    def __buscar(self, no: No, valor: int):
        if no is None:
            return None
        
        if valor == no.valor:
            return no
        elif valor <= no.valor:
            return self.__buscar(no.esquerda, valor)
        else:
            return self.__buscar(no.direita, valor)
    
    # percurso em ordem
    def percurso_em_ordem(self):
        self.__percurso_em_ordem(self.raiz)
    
    def __percurso_em_ordem(self, no):
        if no is None:
            return
        
        self.__percurso_em_ordem(no.esquerda)
        print(f'{no.valor}', end=" ", sep=" ")
        self.__percurso_em_ordem(no.direita)

    # percurso pré-ordem
    def percurso_pre_ordem(self):
        self.__percurso_pre_ordem(self.raiz)
    
    def __percurso_pre_ordem(self, no):
        if no is None:
            return
        
        print(f'{no.valor}', end=" ", sep=" ")
        self.__percurso_pre_ordem(no.esquerda)
        self.__percurso_pre_ordem(no.direita)
    
    # percurso pos-ordem
    def percurso_pos_ordem(self):
        self.__percurso_pos_ordem(self.raiz)
    
    def __percurso_pos_ordem(self, no):
        if no is None:
            return
        
        self.__percurso_pos_ordem(no.esquerda)
        self.__percurso_pos_ordem(no.direita)
        print(f'{no.valor}', end=" ", sep=" ")

In [None]:
arvore = Arvore()
arvore.imprimir()

arvore.adicionar(15)
arvore.adicionar(6)
arvore.adicionar(3)
arvore.adicionar(2)
arvore.adicionar(4)
arvore.adicionar(7)
arvore.adicionar(13)
arvore.adicionar(18)
arvore.adicionar(17)
arvore.adicionar(20)

arvore.percurso_em_ordem()
print()

arvore.percurso_pre_ordem()
print()

arvore.percurso_pos_ordem()
print()

Abaixo podemos ver outra forma de representar a árvore

In [None]:
class Arvore2:
    def __init__(self, raiz, esquerda = None, direita = None):
        self.raiz = raiz
        self.esquerda = esquerda
        self.direita = direita
        
    def __repr__(self):
        if self.esquerda == None and self.direita == None:
            return f'Folha com valor {self.raiz}'
        else:
            return f'Árvore com raiz {self.raiz}'
        
    
    def __str__(self, level=0):
        ret = "   "*level + repr(self.raiz)+"\n"
        if self.esquerda:
            ret += f'{self.esquerda.__str__(level+1)}'
        if self.direita:
            ret += f'{self.direita.__str__(level+1)}'            
        return ret

    # método de busca binária
    def buscar(self, procurado):
        if self.raiz == procurado:
            return True
        
        # o nó atual é uma folha?
        elif self.esquerda == None and self.direita == None:
            return False
        elif procurado < self.raiz:
            return self.esquerda.buscar(procurado)
        elif procurado > self.raiz:
            return self.direita.buscar(procurado)

    # Percurso em ordem
    def em_ordem(self):
        self.__em_ordem(self)
    
    def __em_ordem(self, no):
        if no is None:
            return

        self.__em_ordem(no.esquerda)
        print(no.raiz, end=" ", sep="")
        self.__em_ordem(no.direita)

    # Percurso pré-ordem
    def pre_ordem(self):
        self.__pre_ordem(self)
    
    def __pre_ordem(self, no):
        if no is None:
            return

        print(no.raiz, end=" ", sep="")
        self.__pre_ordem(no.esquerda)
        self.__pre_ordem(no.direita)

    # Percurso pos-ordem
    def pos_ordem(self):
        self.__pos_ordem(self)
    
    def __pos_ordem(self, no):
        if no is None:
            return

        self.__pos_ordem(no.esquerda)
        self.__pos_ordem(no.direita)
        print(no.raiz, end=" ", sep="")


In [None]:
arvore2 = Arvore2(15,
                esquerda = Arvore2(6,
                                  esquerda = Arvore2(3,
                                                    esquerda = Arvore2(2),
                                                    direita = Arvore2(4)),
                                  direita = Arvore2(7,
                                                   direita = Arvore2(13))),
                direita = Arvore2(18,
                                 esquerda = Arvore2(17),
                                 direita = Arvore2(20)))

In [None]:
print(arvore2)

print(arvore2.buscar(3))
print(arvore2.buscar(58))

arvore2.em_ordem()
print()

arvore2.pre_ordem()
print()

arvore2.pos_ordem()
print()

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/61af9259-b2d0-444c-bef0-22ae71c0b9f2.png" width=600>

In [None]:
arvore2.find(15)

In [None]:
arvore2.find(13)

In [None]:
arvore2.find(14)

_________

### Árvores de decisão

Árvores podem ser usadas para criar um caminho lógico para uma decisão.

Em geral, utilizamos para resolver problemas de classificação **pesquisar para poder falar melhor**

Na figura, temos uma árvore que diagnosticará se uma pessoa está com algum problema de saúde.

<img src=https://s3-sa-east-1.amazonaws.com/lcpi/c7bfd1c3-f7dc-464a-ae25-6dcc6ce7672f.PNG width=600>

Crie uma árvore no Python que representa a árvore da imagem. 

Inserir método que percorre a árvore, fazendo perguntas, e ao final diz o problema de saúde de uma determinada pessoa.

In [None]:
# exercício: implementem a classe dá árvore! 

# construam também um método para o diagnóstico
# no método, deve haver um input perguntando sobre alguma das variáveis (sente mal estar? tem dor de cabeça?)
# a resposta deve ser de sim/nao, True/False
# com base na resposta, vc deve decidir por qual lado seguir, e assim, percorrer a árvore
# percorra a árvore, até chegar em alguma folha
# na folha, é retornado o diagnóstico.


In [None]:
class Arvore:
    def __init__(self, pergunta, esquerda  = None, direita = None):
        self.pergunta = pergunta
        self.esquerda  = esquerda
        self.direita = direita
        
    def __repr__(self):
        return "A pergunta da raiz é: {}".format(self.pergunta)
    
    def __str__(self, level=0):
        ret = "   "*level + repr(self.pergunta)+"\n"
        if self.esquerda:
            ret += f'{self.esquerda.__str__(level+1)}'
        if self.direita:
            ret += f'{self.direita.__str__(level+1)}'
        return ret
        
    def diagnostico(self):
        # a árvore é uma folha?
        if self.esquerda == None and self.direita == None:
            return f'Você está com {self.pergunta}' 
        else:
            resposta = input(f'Você está com {self.pergunta}? ')

            while resposta not in ["sim", "nao", "não"]:
                print("Não entendi! Responda novamente")
                resposta = input(f'Você está com {self.pergunta}? ')

            if resposta.lower() == 'sim':
                return self.direita.diagnostico()
            else:
                return self.esquerda.diagnostico()

# Pseudo código do diagnóstico
# def diagnostico(self):
#     se filho_esquerda = None e filho_direita = None então
#         retorna "você está com {pergunta}"
#     senao
#         resposta := input("Você está com {pergunta}?")

#         enquanto resposta não for [sim, nao]:
#             imprime("Não entendi. Responda novamente")
#             resposta := input("Você está com {pergunta}?")
        
#         se resposta = sim então
#             retorna filho_direita.diagnostico()
#         senão
#             retorna filho_esquerda.diagnostico()


In [None]:
t1 = Arvore('mal estar', 
            esquerda  = Arvore('febre',
                        esquerda  = Arvore('dor de cabeça',
                                    esquerda  = Arvore('saudável'),
                                    direita = Arvore('fadiga')
                                   ),
                        direita = Arvore('manchas no corpo',
                                    esquerda  = Arvore('virose'),
                                    direita = Arvore('sarampo')
                                   )
                       ),
            direita = Arvore('dor de cabeça',
                       esquerda  = Arvore('vontade de vomitar',
                                  esquerda  = Arvore('fome'),
                                  direita = Arvore('infecção intestinal')
                                  ),
                       direita = Arvore('boca seca',
                                   esquerda  = Arvore('falta de café'),
                                   direita = Arvore('ressaca')
                                  )
                       )
           )

In [None]:
t1

In [None]:
print(t1)

In [None]:
t1.diagnostico()

## Implementação de uma árvore binária de busca


In [None]:
class No:
    def __init__(self, chave=None, esquerda=None, direita=None):
        self.chave = chave
        self.esquerda = esquerda
        self.direita = direita

    def get_direita(self):
        return self.direita

    def get_esquerda(self):
        return self.esquerda

    def get_valor(self):
        return self.chave

    def __repr__(self):
        return '%s <- %s -> %s' % (self.esquerda and self.esquerda.chave,
                                   self.chave,
                                   self.direita and self.direita.chave)


class ArvoreBinaria:
    def __init__(self, raiz: No = None) -> None:
        self.raiz = raiz

    def get_raiz(self):
        return self.raiz

    def _insere(self, no:No=None, raiz=None):
        """Insere um nodo em uma árvore binária de pesquisa."""
        # Nodo deve ser inserido na raiz.
        if raiz is None:
            self.raiz = no
            return self

        # Nodo deve ser inserido na subárvore direita.
        elif raiz.chave < no.chave:
            if raiz.direita is None:
                raiz.direita = no
                return self
            else:
                self._insere(no, raiz.direita)

        # Nodo deve ser inserido na subárvore esquerda.
        else:
            if raiz.esquerda is None:
                raiz.esquerda = no
                return self
            else:
                self._insere(no, raiz.esquerda)

    def insere(self, no: No = None):
        self._insere(no, self.raiz)

    def __repr__(self) -> str:
        return self.get_raiz().__repr__()
    
    def _busca(self, no: No, valor: int, interacoes: int):
        if no is None:
            return [None, interacoes]
        if valor == no.chave:
            return no, interacoes
        elif valor <= no.chave:
            interacoes += 1
            return self._busca(no.esquerda, valor, interacoes)
        else:
            interacoes += 1
            return self._busca(no.direita, valor, interacoes)

    def busca(self, chave):
        raiz = self.raiz
        if not raiz:
            return [None, 0]
        resultado, contador = self._busca(no=raiz, valor=chave, interacoes=1)

        return [resultado, contador]
