# Árvores (conceitos)

> __Nó:__

> __Profundidade:__

> __Folha:__

> __Altura:__ A altura de uma árvore é o número máximo de arestas no caminho mais longo da raiz até uma folha. Em outras palavras, é a profundidade máxima de qualquer nó na árvore.

> __Subárvore:__ Uma subárvore é uma árvore que consiste em um nó e todos os seus descendentes. Ou seja, é uma parte da árvore que é ela mesma uma árvore.

> __Nível:__ O nível de um nó em uma árvore é sua profundidade mais 1. O nível da raiz é 1, e o nível aumenta à medida que você desce na árvore.

> __Grau de um Nó:___ O grau de um nó é o número de filhos que ele tem. Um nó sem filhos (folha) tem um grau de 0, um nó com um filho tem um grau de 1, e assim por diante.

> __Árvore Binária:__ Uma árvore binária é uma árvore em que cada nó tem no máximo dois filhos: um filho à esquerda e um filho à direita.

In [10]:
# Definição da classe Arvore
# Implementação generica N-aria
class TreeNode:
    def __init__(self, data):
        self.data = data
        self.children = []

    def add_child(self, child_node):
        self.children.append(child_node)

    def __repr__(self, level=0, parent_label=''):
        ret = ""
        if level == 0:
            ret += f"root: '{self.data}'\n"
        else:
            ret += f"{'    ' * level}{parent_label}_child: '{self.data}'\n"
        for child in self.children:
            ret += child.__repr__(level + 1, self.data)
        return ret




In [8]:
# Exemplo de uso:

# Criando os nós da árvore
root = TreeNode("A")
b = TreeNode("B")
c = TreeNode("C")
d = TreeNode("D")
e = TreeNode("E")
c1 = TreeNode("c1")
c2 = TreeNode("c2")
A_c1 = TreeNode(90)
A_c2 = TreeNode(60)
A_c3 = TreeNode(40)
A_c4 = TreeNode(20)
# Adicionando os nós à árvore
root.add_child(b)
root.add_child(c)
root.add_child(A_c1)
root.add_child(A_c2)
root.add_child(A_c3)
root.add_child(A_c4)
b.add_child(d)
b.add_child(e)
c.add_child(c1)
c.add_child(c2)
# Imprimindo a árvore
print(root)

root: 'A'
    A_child: 'B'
        B_child: 'D'
        B_child: 'E'
    A_child: 'C'
        C_child: 'c1'
        C_child: 'c2'
    A_child: '90'
    A_child: '60'
    A_child: '40'
    A_child: '20'



# Arvore de sufixo

> Estrutura na qual armazenamos todas as substrings de uma string. Muito utilizado em algoritmos de busca por padrões em textos.
Assim como também em algortimos de:

- __Compressão de Dados:__ As árvores de sufixo podem ser usadas em algoritmos de compressão de dados, como o algoritmo de compressão de dados de Burrows-Wheeler, que é amplamente utilizado em programas de compressão de arquivos, como o bzip2.
__Biologia Computacional:__ As árvores de sufixo são usadas em bioinformática para pesquisar e comparar sequências de DNA e proteínas. Elas são úteis em algoritmos para identificar padrões, procurar homologias entre sequências, e realizar alinhamentos de sequências.
__Análise de Sequências de Texto:__ Além da pesquisa de padrões, as árvores de sufixo podem ser usadas para análise de sequências de texto, como a extração de todas as ocorrências de palavras-chave em um texto ou a identificação de padrões repetidos.
__Engenharia de Software:__ Em engenharia de software, as árvores de sufixo podem ser usadas para identificar padrões de código em grandes projetos de software, auxiliando na análise estática de código, na refatoração e na detecção de clones de código.
__Processamento de Linguagem Natural (PLN):__ Em PLN, as árvores de sufixo podem ser usadas para várias tarefas, como segmentação de texto, análise morfológica, e extração de informações.


# Árvores de segmentos

Além da utilização comum em consultas de intervalos de valores em matrizes, as árvores de segmentos possuem outras aplicações em diferentes áreas. Algumas delas incluem:

__Consultas de Mínimo/Máximo em Intervalos Dinâmicos:__ As árvores de segmentos podem ser usadas para responder consultas de mínimo/máximo em intervalos dinâmicos em que os elementos na matriz são atualizados ao longo do tempo. Isso é útil em problemas de otimização, como encontrar o menor ou maior elemento em uma janela móvel de uma matriz.

__Consultas de Soma em Intervalos Dinâmicos:__ Além das consultas de mínimo/máximo, as árvores de segmentos podem ser usadas para responder consultas de soma em intervalos dinâmicos. Isso é útil em problemas que envolvem a soma de valores em uma janela móvel de uma matriz, como encontrar a soma dos elementos em uma submatriz retangular.

__Construção de Árvores de Fenwick/BIT:__ As árvores de segmentos podem ser usadas na construção de árvores de Fenwick (também conhecidas como árvores BIT - Binary Indexed Trees). As árvores de Fenwick são usadas para suportar operações eficientes de atualização e consulta em intervalos de valores, como somas de prefixo e atualizações de elementos individuais em uma matriz.

__Contagem de Elementos Distintos em Intervalos:__ As árvores de segmentos podem ser estendidas para suportar operações de contagem de elementos distintos em intervalos de uma matriz. Isso é útil em problemas que envolvem a contagem de elementos únicos em uma janela móvel de uma matriz.
Problemas de Planejamento de Recursos: As árvores de segmentos podem ser aplicadas em problemas de planejamento de recursos, como alocação de salas de aula, alocação de recursos computacionais, e otimização de uso de recursos em geral.

#Árvores Trie

- Estrutura de árvore usada para armazenar um conjunto de strings em que cada nó representa um caractere e as strings são representadas pela sequência de caracteres ao longo do caminho da raiz ao nó correspondente à string completa.

> - Um das principais vantagens das árvores Trie: a busca é eficiente e tem complexidade __O(M)__, onde M é o comprimento da palavra a ser buscada, independente do tamanho total da árvore ou do número de palavras armazenadas nela. Isso torna as árvores Trie especialmente úteis em problemas de busca de padrões e em aplicações onde a eficiência da busca é crucial.

In [11]:
# Implemetação da Arvore Trie

class TrieNode:
    def __init__(self):
        self.children = {}
        self.is_end_of_word = False

class Trie:
    def __init__(self):
        self.root = TrieNode()

    def insert(self, word):
        current_node = self.root
        for char in word:
            if char not in current_node.children:
                current_node.children[char] = TrieNode()
            current_node = current_node.children[char]
        current_node.is_end_of_word = True

    def search(self, word):
        current_node = self.root
        for char in word:
            if char not in current_node.children:
                return False
            current_node = current_node.children[char]
        return current_node.is_end_of_word



In [14]:
# Exemplo de uso:
trie = Trie()
words = ["apple", "banana", "orange", "app", "oranges", "bana"]
for word in words:
    trie.insert(word)

print(trie.search("apple"))     # True
print(trie.search("app"))       # True
print(trie.search("banana"))    # True
print(trie.search("bana"))     # False


True
True
True
True


# Dica/Ideia

> As demais arvores são apenas implementações da arvore n-ária junto com um conjunto de restriçoes para a construção da arvore. Restições estas que vão contribuir para a resolução do problema na qual a arvore sera aplicada.

#Árvores Binárias:
- Cada nó na árvore tem no máximo dois filhos.

# Árvores Binárias de Busca (BST):
- Uma árvore binária em que, para cada nó, todos os nós na subárvore esquerda têm valores menores e todos os nós na subárvore direita têm valores maiores.


# Árvores Balanceadas:
- Árvores em que a altura das subárvores esquerda e direita de cada nó é equilibrada, o que ajuda a garantir um desempenho de tempo de execução mais previsível em operações como inserção, exclusão e busca. Exemplos incluem árvores AVL e árvores vermelho-preto.

# Arvore AVL

# Arvore Rubro-Negra

# Árvore B:

__Estrutura Balanceada:__ A árvore B é uma árvore de busca balanceada que permite a inserção, exclusão e busca em tempo logarítmico, mantendo a altura da árvore relativamente baixa e, portanto, garantindo um bom desempenho em operações de busca.

__Nós com Múltiplos Filhos:__ Cada nó em uma árvore B pode ter um número variável de filhos, geralmente entre um mínimo e um máximo predefinidos. Isso permite que cada nó armazene uma quantidade significativa de chaves de índice.
Ordem das Chaves: As chaves nos nós da árvore B são organizadas de maneira que todas as chaves em um nó estão em ordem ascendente, facilitando as operações de busca.

__Chaves e Ponteiros:__ Além das chaves, cada nó na árvore B também pode conter ponteiros para os filhos e para os registros associados às chaves. Isso permite uma navegação eficiente na árvore e recuperação de dados associados.

# Árvore B+:

__Nós de Índice e Nós de Dados Separados:__ Na árvore B+, os nós internos da árvore contêm apenas chaves de índice, enquanto os dados associados às chaves são armazenados em nós de dados separados. Isso permite uma utilização mais eficiente do espaço em disco, já que os nós de índice são menores e podem armazenar mais chaves.

__Folhas Ligadas:__ Todas as folhas da árvore B+ são ligadas em uma lista encadeada, o que facilita a execução de operações de intervalo e de percorrimento sequencial, como por exemplo, em uma consulta que recupera todas as chaves em um intervalo.

__Chaves Repetidas:__ A árvore B+ permite a inserção de chaves duplicadas, o que pode ser útil em alguns cenários de aplicação.
