# Aula 3 - Árvores

Na aula de hoje, vamos explorar os seguintes tópicos em Python:

- 1) Árvores

_________

## 1) Árvores


### 1.1) O que é uma árvore?

Árvore é uma estrutura de dados definida por uma coleção de elementos, chamados nós, que são conectados entre si de maneira a modelar relações hierarquicas, mantendo as seguintes propriedades:

- Existe um nó específico, chamado raiz, que fica no topo da hierarquia
- Todo nó é conectado a raiz por um único caminho

Existem diversos exemplos em outras áreas, além da matemática e da ciência da computação, onde árvores são utilizadas.
Por exemplo, a [árvore filogenética](https://pt.wikipedia.org/wiki/%C3%81rvore_filogen%C3%A9tica) que agrupa espécies de acordo com suas relações evolutivas. 

A figura abaixo mostra um organograma empresarial, que também é um exemplo de árvore:

<img src="https://www.nibo.com.br/wp-content/uploads/2014/12/organograma_tradicional-1024x554.jpg" width=600>

Fazendo o paralelo com a nossa definição: o "presidente", que está no topo da hierarquia, é a raiz da árvore.

Note que há apenas **um caminho** entre o presidente e cada um dos demais nós.

Por exemplo, o caminho do "presidente" até o "auxiliar de marketing", seria:

`"presidente"-> "diretor comercial"-> "gerente de marketing"-> "auxiliar de marketing".`

_________

### 1.2) Terminologia

Para falarmos desta estrutura, definir e analisar algoritmos sobre ela, é necessário nomearmos algumas partes específicas sobre as quais faremos referência posteriormente.

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/8dfbec82-e81b-43da-8867-0f27cf6cd44f.png" width=600>

Algumas definições tomando como exemplo a figura acima:

- Quando um nó A está diretamente acima de um nó B, dizemos que A é "pai" de B ou que B é "filho" de A.
- Raiz: é o topo da hierarquia (A)
- Folhas: são os nós na camada mais baixa da hierarquia, os nós que não têm filhos (C, H, I, F, G)
- Nós internos: são os nós que não são folhas nem raiz (B, D, E)
- Altura da árvore (`h`): é a distância entre a raiz e a folha mais afastada
- de acordo com a definição, um único nó, sozinho, também é uma árvore
- toda sub-árvore é árvore (estrutura recursiva)
- todo nó, exceto a raiz, tem exatamente um nó pai




_________

### 1.3) Árvore Binária de Busca (Binary Search Tree)

Uma árvode binária de busca, é um tipo mais específico de árvore.
Além das propriedades básicas de uma árvore, também precisa satisfazer as seguintes:

- Todo nó tem no máximo dois filhos
- Para cada nó v, v é maior que todos os nós a sua esquerda e menor que todos os nós a sua direita

### 1.4) Implementação

Para implementar uma estrutura de árvore binária de busca, criamos uma classe nó com três atributos:

- conteúdo: o valor útil, qualquer valor ou dado, ou algo que faça referência a um objeto mais complexo
- esquerda: referência ao filho à esquerda
- direita: referência ao filho à direita

[2, 4, 3, 7, 6, 13, 15, 17, 18, 20]

A figura abaixo mostra uma representação dessa implementação:

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/61af9259-b2d0-444c-bef0-22ae71c0b9f2.png" width=600>


In [5]:
class Arvore:
    '''
    classe pra representar uma árvore
    '''
    
    def __init__(self, root : int, right : Arvore, left : Arvore):
        '''
        root (int): o valor no nó;
        right (Arvore): objeto arvore, que representa a sub-arvore à direita
        left (Arvore): objeto arvore, que representa a sub-arvore à esquera
        '''
        
        # atributos: raiz, com maximo de 2 filhos, e definir quais são os filhos
        
        self.raiz = root

        self.direita = right
        
        self.esquerda = left

In [16]:
tree = Arvore(root = 15,
              right = Arvore(root = 18,
                             right = Arvore(root = 20,
                                            right = None,
                                            left = None),
                             left = Arvore(root = 17,
                                           right = None,
                                           left = None)),
              left = Arvore(root = 6,
                            right = Arvore(root = 7,
                                           right = Arvore(root = 13,
                                                          right = None,
                                                          left = None),
                                           left = None),
                            left = Arvore(root = 3,
                                          right = Arvore(root = 4,
                                                         right = None,
                                                         left = None),
                                          left = Arvore(root = 2,
                                                        right = None,
                                                        left = None))))

In [10]:
tree

<__main__.Arvore at 0x284e10b4670>

In [9]:
vars(tree)

{'raiz': 15,
 'direita': <__main__.Arvore at 0x284e10b43d0>,
 'esquerda': <__main__.Arvore at 0x284e10b4610>}

In [11]:
tree.raiz

15

In [12]:
tree.direita

<__main__.Arvore at 0x284e10b43d0>

In [13]:
vars(tree.direita)

{'raiz': 18,
 'direita': <__main__.Arvore at 0x284e10b4310>,
 'esquerda': <__main__.Arvore at 0x284e10b4370>}

In [14]:
vars(tree.direita.esquerda)

{'raiz': 17, 'direita': None, 'esquerda': None}

Vamos melhorar a representação...

In [24]:
class Arvore:
    '''
    classe pra representar uma árvore
    '''
    
    def __init__(self, root : int, right : Arvore, left : Arvore):
        '''
        root (int): o valor no nó;
        right (Arvore): objeto arvore, que representa a sub-arvore à direita
        left (Arvore): objeto arvore, que representa a sub-arvore à esquera
        '''
        
        # atributos: raiz, com maximo de 2 filhos, e definir quais são os filhos
        
        self.raiz = root

        self.direita = right
        
        self.esquerda = left
        
    
    def __repr__(self):
        
        # é uma folha?
        if self.esquerda == None and self.direita == None:
            
            return f"Folha com valor {self.raiz} no nó."
        
        # para todos os demais nós,
        else:
            
            return f"Árvore com valor {self.raiz} no nó."
            
        

In [25]:
# NAO PRECISA NOMEAR OS ARGUMENTOS NO __init__.. 
# fica mais clean, mas eu acho que fica mais confuso

tree = Arvore(15,
              Arvore(18,
                     Arvore(20,
                            None,
                            None),
                     Arvore(17,
                           None,
                           None)),
              Arvore(6,
                    Arvore(7,
                           Arvore(13,
                                  None,
                                  None),
                           None),
                    Arvore(3,
                          Arvore(4,
                                 None,
                                 None),
                          Arvore(2,
                                None,
                                None))))

In [26]:
tree = Arvore(root = 15,
              right = Arvore(root = 18,
                             right = Arvore(root = 20,
                                            right = None,
                                            left = None),
                             left = Arvore(root = 17,
                                           right = None,
                                           left = None)),
              left = Arvore(root = 6,
                            right = Arvore(root = 7,
                                           right = Arvore(root = 13,
                                                          right = None,
                                                          left = None),
                                           left = None),
                            left = Arvore(root = 3,
                                          right = Arvore(root = 4,
                                                         right = None,
                                                         left = None),
                                          left = Arvore(root = 2,
                                                        right = None,
                                                        left = None))))

In [32]:
tree.esquerda.esquerda.esquerda

Folha com valor 2 no nó.

In [28]:
tree

Árvore com valor 15 no nó.

In [29]:
tree.direita

Árvore com valor 18 no nó.

In [30]:
tree.direita.esquerda

Folha com valor 17 no nó.

In [40]:
class Arvore:
    '''
    classe pra representar uma árvore
    '''
    
    def __init__(self, root : int, right : Arvore, left : Arvore, level : int):
        '''
        root (int): o valor no nó;
        right (Arvore): objeto arvore, que representa a sub-arvore à direita
        left (Arvore): objeto arvore, que representa a sub-arvore à esquera
        '''
        
        # atributos: raiz, com maximo de 2 filhos, e definir quais são os filhos
        
        self.raiz = root

        self.direita = right
        self.esquerda = left
        
        # "profundidade", nivel hierárquivo do nó de uma arvore
        self.nivel = level
    
    def __repr__(self):
        
        # é uma folha?
        if self.esquerda == None and self.direita == None:
            
            return f"Folha com valor {self.raiz} no nó."
        
        elif self.nivel == 0:
            
            return f"Árvore com o nó raiz de valor {self.raiz}."
        
        # para todos os demais nós,
        else:
            
            return f"Nó interno da árvore, com valor {self.raiz} no nó."

In [41]:
tree = Arvore(root = 15,
              right = Arvore(root = 18,
                             right = Arvore(root = 20,
                                            right = None,
                                            left = None, 
                                            level = 2),
                             left = Arvore(root = 17,
                                           right = None,
                                           left = None, 
                                           level = 2),
                             level = 1),
              left = Arvore(root = 6,
                            right = Arvore(root = 7,
                                           right = Arvore(root = 13,
                                                          right = None,
                                                          left = None,
                                                          level = 3),
                                           left = None,
                                           level = 2),
                            left = Arvore(root = 3,
                                          right = Arvore(root = 4,
                                                         right = None,
                                                         left = None,
                                                         level = 3),
                                          left = Arvore(root = 2,
                                                        right = None,
                                                        left = None,
                                                        level = 3),
                                          level = 2),
                            level = 1),
             level = 0)

In [42]:
tree

Árvore com o nó raiz de valor 15.

In [43]:
tree.esquerda

Nó interno da árvore, com valor 6 no nó.

In [48]:
tree.esquerda.direita.direita

Folha com valor 13 no nó.

In [51]:
# esse é um caso onde tem "None", o __repr__ não retorna nada.

tree.esquerda.direita.esquerda

In [52]:
# SUPER DESAFIO: implementar o __str__ pra "plotar" a árvore.
# dica: o atributo self.nivel vai ser importante!
# dica2: dá trabalho!

Vamos implementar a busca binária:

In [61]:
class Arvore:
    '''
    classe pra representar uma árvore
    '''
    
    def __init__(self, 
                 root : int, 
                 right : Arvore,
                 left : Arvore,
                 level : int):
        '''
        root (int): o valor no nó;
        right (Arvore): objeto arvore, que representa a sub-arvore à direita
        left (Arvore): objeto arvore, que representa a sub-arvore à esquera
        '''
        
        # atributos: raiz, com maximo de 2 filhos, e definir quais são os filhos
        
        self.raiz = root

        self.direita = right
        self.esquerda = left
        
        # "profundidade", nivel hierárquivo do nó de uma arvore
        self.nivel = level
    
    def __repr__(self):
        
        # é uma folha?
        if self.esquerda == None and self.direita == None:
            
            return f"Folha com valor {self.raiz} no nó."
        
        elif self.nivel == 0:
            
            return f"Árvore com o nó raiz de valor {self.raiz}."
        
        # para todos os demais nós,
        else:
            
            return f"Nó interno da árvore, com valor {self.raiz} no nó."
        
        
    def busca_binaria(self, buscado):
        
        # se eu encontrei o buscado na raiz (que é onde estão os elementos)
        if buscado == self.raiz:
            
            return True, self.nivel
        
        # se eu tô numa folha e não retornei True até aqui, eu retorno False.
        elif self.esquerda == None and self.direita == None:
            
            return False
        
        # se eu não encontrei o elemento na raiz
        # E se eu ainda não cheguei numa folha,
        # eu percorro a árvore
        
        elif buscado < self.raiz:
            
            print("Vá pra esquerda")
            return self.esquerda.busca_binaria(buscado)
            
        elif buscado > self.raiz:
            
            print("Vá pra direita")
            return self.direita.busca_binaria(buscado)
        
        

In [62]:
tree = Arvore(root = 15,
              right = Arvore(root = 18,
                             right = Arvore(root = 20,
                                            right = None,
                                            left = None, 
                                            level = 2),
                             left = Arvore(root = 17,
                                           right = None,
                                           left = None, 
                                           level = 2),
                             level = 1),
              left = Arvore(root = 6,
                            right = Arvore(root = 7,
                                           right = Arvore(root = 13,
                                                          right = None,
                                                          left = None,
                                                          level = 3),
                                           left = None,
                                           level = 2),
                            left = Arvore(root = 3,
                                          right = Arvore(root = 4,
                                                         right = None,
                                                         left = None,
                                                         level = 3),
                                          left = Arvore(root = 2,
                                                        right = None,
                                                        left = None,
                                                        level = 3),
                                          level = 2),
                            level = 1),
             level = 0)

In [63]:
tree.busca_binaria(15)

(True, 0)

In [64]:
tree.busca_binaria(3)

Vá pra esquerda
Vá pra esquerda


(True, 2)

In [65]:
tree.busca_binaria(13)

Vá pra esquerda
Vá pra direita
Vá pra direita


(True, 3)

In [66]:
tree.busca_binaria(17)

Vá pra direita
Vá pra esquerda


(True, 2)

In [67]:
tree.busca_binaria(42)

Vá pra direita
Vá pra direita


False

In [68]:
tree.busca_binaria(5)

Vá pra esquerda
Vá pra esquerda
Vá pra direita


False

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/61af9259-b2d0-444c-bef0-22ae71c0b9f2.png" width=600>

_________

Com o método \_\_str\_\_(), caso alguém queira :)

In [8]:
class Arvore:
    '''
    classe pra representar uma árvore
    '''
    
    def __init__(self, 
                 root : int, 
                 right,
                 left,
                 level : int):
        '''
        root (int): o valor no nó;
        right (Arvore): objeto arvore, que representa a sub-arvore à direita
        left (Arvore): objeto arvore, que representa a sub-arvore à esquera
        '''
        
        # atributos: raiz, com maximo de 2 filhos, e definir quais são os filhos
        
        self.raiz = root

        self.direita = right
        self.esquerda = left
        
        # "profundidade", nivel hierárquivo do nó de uma arvore
        self.nivel = level
    
    def __repr__(self):
        
        # é uma folha?
        if self.esquerda == None and self.direita == None:
            
            return f"Folha com valor {self.raiz} no nó."
        
        elif self.nivel == 0:
            
            return f"Árvore com o nó raiz de valor {self.raiz}."
        
        # para todos os demais nós,
        else:
            
            return f"Nó interno da árvore, com valor {self.raiz} no nó."
        
        
    # adaptei daqui: 
    # https://stackoverflow.com/questions/20242479/printing-a-tree-data-structure-in-python       
    def __str__(self, level=0):
        
        txt = f"{'-'*5*level}|{int(repr(self.raiz)):02d}|{'-'*(20-5*level)}"[:20] + "\n"
        
        if self.direita:
            
            txt += f'{self.direita.__str__(level+1)}'
            
        if self.esquerda:
            
            txt += f'{self.esquerda.__str__(level+1)}'
            
        return txt
        
        
    def busca_binaria(self, buscado):
        
        # se eu encontrei o buscado na raiz (que é onde estão os elementos)
        if buscado == self.raiz:
            
            return True, self.nivel
        
        # se eu tô numa folha e não retornei True até aqui, eu retorno False.
        elif self.esquerda == None and self.direita == None:
            
            return False
        
        # se eu não encontrei o elemento na raiz
        # E se eu ainda não cheguei numa folha,
        # eu percorro a árvore
        
        elif buscado < self.raiz:
            
            print("Vá pra esquerda")
            return self.esquerda.busca_binaria(buscado)
            
        elif buscado > self.raiz:
            
            print("Vá pra direita")
            return self.direita.busca_binaria(buscado)
        
        

In [9]:
tree = Arvore(root = 15,
              right = Arvore(root = 18,
                             right = Arvore(root = 20,
                                            right = None,
                                            left = None, 
                                            level = 2),
                             left = Arvore(root = 17,
                                           right = None,
                                           left = None, 
                                           level = 2),
                             level = 1),
              left = Arvore(root = 6,
                            right = Arvore(root = 7,
                                           right = Arvore(root = 13,
                                                          right = None,
                                                          left = None,
                                                          level = 3),
                                           left = None,
                                           level = 2),
                            left = Arvore(root = 3,
                                          right = Arvore(root = 4,
                                                         right = None,
                                                         left = None,
                                                         level = 3),
                                          left = Arvore(root = 2,
                                                        right = None,
                                                        left = None,
                                                        level = 3),
                                          level = 2),
                            level = 1),
             level = 0)

In [12]:
tree

Árvore com o nó raiz de valor 15.

In [13]:
tree.esquerda

Nó interno da árvore, com valor 6 no nó.

In [11]:
# pense que pegou a árvore e rotacionou 90° em sentido anti-horário!!

print(tree)

|15|----------------
-----|18|-----------
----------|20|------
----------|17|------
-----|06|-----------
----------|07|------
---------------|13|-
----------|03|------
---------------|04|-
---------------|02|-



<img src="https://s3-sa-east-1.amazonaws.com/lcpi/61af9259-b2d0-444c-bef0-22ae71c0b9f2.png" width=600>

_________

### 1.5) Árvores de decisão

Árvores podem ser usadas para criar um caminho lógico para uma decisão. 

Na figura, temos uma árvore que diagnosticará se uma pessoa está com algum problema de saúde.

<img src=https://s3-sa-east-1.amazonaws.com/lcpi/c7bfd1c3-f7dc-464a-ae25-6dcc6ce7672f.PNG width=600>

Crie uma árvore no Python que representa a árvore da imagem. 

Inserir método que percorre a árvore, fazendo perguntas, e ao final diz o problema de saúde de uma determinada pessoa.

In [1]:
# exercício: implementem a classe dá árvore! 

# construam também um método para o diagnóstico
# no método, deve haver um input perguntando sobre alguma das variáveis 
# (sente mal estar? tem dor de cabeça?)
# a resposta deve ser de sim/nao, True/False
# com base na resposta, vc deve decidir por qual lado seguir, e assim, percorrer a árvore
# percorra a árvore, até chegar em alguma folha
# na folha, é retornado o diagnóstico.


In [35]:
class Arvore:
    
    def __init__(self, p, es, di, lv):
        
        self.pergunta = p
        
        self.esquerda = es
        self.direita = di
        
        # lembre que esse atributo "nivel" SÓ É UTILIZADO
        # no método __repr__ abaixo. Só serve pra isso.
        self.nivel = lv
        
    def __repr__(self):
        
        # é uma folha?
        if self.esquerda == None and self.direita == None:
            
            return f"O diagnóstico é: {self.pergunta}."
        
        elif self.nivel == 0:
            
            return f"A primeira pergunta é: você está com {self.pergunta}?"
        
        # para todos os demais nós,
        else:
            
            return f"Agora eu pergunto: você está com {self.pergunta}?"
        
        
    def diagnostico(self):
        
        # é uma folha?
        if self.esquerda == None and self.direita == None:
        
            return f"O diagnóstico é: {self.pergunta}."
        
        else:
            
            # pegando dados do usuário
            resposta = input(f"{self.nivel + 1} - Você está com {self.pergunta}? Responda com 's' ou 'n': ").lower()
            
            while resposta not in ["s", "n"]:
                
                pergunta = f"Não entendi!\n{self.nivel + 1} - Você está com {self.pergunta}? Responda com 's' ou 'n': "
                resposta = input(pergunta).lower()
                
            # agora, com base na resposta do usuario, percorremos a árvore
            
            if resposta == "s":
                
                return self.direita.diagnostico()
            
            # isso podia ser só um "else", mas vou deixar elif pra ficar explicito
            elif resposta == "n":
                
                return self.esquerda.diagnostico()
            

In [36]:
# dt = decision tree

dt = Arvore(p = "mal estar",
            es = Arvore(p = "febre",
                        es = Arvore(p = "dor de cabeça",
                                    es = Arvore(p = "saudável",
                                                es = None,
                                                di = None,
                                                lv = 3),
                                    di = Arvore(p = "fadiga",
                                                es = None,
                                                di = None,
                                                lv = 3),
                                    lv = 2),
                        di = Arvore(p = "mancha",
                                    es = Arvore(p = "virose",
                                                es = None,
                                                di = None,
                                                lv = 3),
                                    di = Arvore(p = "sarampo",
                                                es = None,
                                                di = None,
                                                lv = 3),
                                    lv = 2),
                       lv = 1),
            di = Arvore(p = "dor de cabeça",
                        es = Arvore(p = "vômito",
                                    es = Arvore(p = "fome",
                                                es = None,
                                                di = None,
                                                lv = 3),
                                    di = Arvore(p = "infecção intestinal",
                                                es = None,
                                                di = None,
                                                lv = 3),
                                    lv = 2),
                        di = Arvore(p = "boca seca",
                                    es = Arvore(p = "falta de café",
                                                es = None,
                                                di = None,
                                                lv = 3),
                                    di = Arvore(p = "ressaca",
                                                es = None,
                                                di = None,
                                                lv = 3),
                                    lv = 2),
                       lv = 1),
           lv = 0)

In [29]:
dt

A primeira pergunta é: você está com mal estar?

In [30]:
dt.esquerda

Agora eu pergunto: você está com febre?

In [31]:
dt.esquerda.direita.direita

O diagnóstico é: sarampo.

<img src=https://s3-sa-east-1.amazonaws.com/lcpi/c7bfd1c3-f7dc-464a-ae25-6dcc6ce7672f.PNG width=600>

In [37]:
dt.diagnostico()

1 - Você está com mal estar? Responda com 's' ou 'n': s
2 - Você está com dor de cabeça? Responda com 's' ou 'n': n
3 - Você está com vômito? Responda com 's' ou 'n': s


'O diagnóstico é: infecção intestinal.'

In [38]:
dt.diagnostico()

1 - Você está com mal estar? Responda com 's' ou 'n': n
2 - Você está com febre? Responda com 's' ou 'n': n
3 - Você está com dor de cabeça? Responda com 's' ou 'n': n


'O diagnóstico é: saudável.'

In [40]:
dt.diagnostico()

1 - Você está com mal estar? Responda com 's' ou 'n': n
2 - Você está com febre? Responda com 's' ou 'n': s
3 - Você está com mancha? Responda com 's' ou 'n': n


'O diagnóstico é: virose.'

_____