### Comparação de algoritmos de busca

Comparando a busca sequencial, busca binária, Hash e Hash com LL, gostariamos de um algoritmo ideal com busca O(logn) e inserção e remoção melhor que O(n).

A situação ideal é conseguida quando a tabela tem uma estrutura em árvore de busca. Veremos árvores binárias de busca

### Árvore binária

Chamamos de Árvores Binárias (AB), um conjunto finito T de nós ou vértices, onde existe um nó especial chamado raiz e os restantes podem ser divididos em dois subconjuntos disjuntos, chamados de sub-árvores esquerda e direita que também são Árvores Binárias. Em particular T pode ser vazio.

Cada nó pode ter 0, 1 ou 2 filhos. Todo nó tem um pai.

Dizemos que o nível da raiz é 1 e que o nível de um nó é o nível de seu pai mais 1. A altura de uma AB é o maior dos níveis de seus nós.

Dizemos que um nó é folha da AB se não tem filhos.

### Árvore binária de busca 

Seja T uma AB. Se v é um nó de T, chamamos de info(v) a informação armazenada em v.

Chamamos T de Árvore Binária de Busca (ABB) quando:

   1. Se v1 pertencente à sub-árvore esquerda de v então info(v1) < info(v).
   2. Se v2 pertencente à sub-árvore direita de v então info(v2) > info(v).
   
Ou seja, tudo na esquerda é menor que v e tudo na direita é maior que v 

### Árvores binárias como LL

Podemos representar uma ABB com uma lista ligada, onde cada elemento tem os seguintes
campos:

1. info - campo de informação
2. eprox - apontador para a sub-árvore esquerda
3. dprox - apontador para a sub-árvore direita

Representar uma ABB como um nó que é a raiz e duas referências para as respectivas sub-árvore esquerda e direita:

In [62]:
class ABB:

    def __init__(self, raiz):
        ''' cria uma nova ABB com esta raiz e sem filhos.'''
        self._info = raiz
        self._eprox = None
        self._dprox = None

### Algoritmos de busca

#### A1

In [5]:
# Procura elemento com info igual a v na ABB h
# Devolve o 1º nó encontrado ou None
# Versão recursiva
def busca(h, v):
    if h is None: return None
    t = h._info
    if t == v: return h
    if t > v:
        return busca(h._eprox, v) # procura à esquerda
    else:
        return busca(h._dprox, v) # procura à direita

No pior caso, o número de comparações é igual ao número de nós da árvore, no caso em que a árvore tem tantos níveis quanto o número de elementos. Portanto a complexidade é O(N).

A complexidade é a altura da árvore, portanto é conveniente que a árvore tenha sempre altura mínima. Árvore com tal propriedade é tida como **completa** (todos os nós com filhos
vazios estão no último ou penúltimo nível). Aqui é O(logn)

**Lema**

Se T uma AB completa com N nós e altura H. Então $2^{(H-1)} ≤ N ≤ 2^{H}-1$.

In [7]:
# Procura elemento com info igual a v na ABB h
# Devolve o 1º nó encontrado ou None
# Versão não recursiva
def buscaNR(h, v):
    p = h
    while p is not None:
        t = p._info
        if t == v: return p # encontrou
        if t > v: p = p._eprox # à esquerda
        else: p = p._dprox # à direita
    # se chegou aqui é porque não encontrou
    return None

### Outros algoritmos

#### A3


In [27]:
# conta elementos com info igual a v na ABB h
def conta(h, v):
    if h is None: return 0
    # verifica se conta este nó
    if v == h._info: a = 1
    else: a = 0
    # conta este nó mais as ABBs esquerda e direita
    return a + conta(h._eprox, v) + conta(h._dprox, v)

1

**Exercícios**

1. Refaça, supondo que elementos iguais, estarão sempre à direita.
2. Refaça novamente usando um algoritmo não recursivo.

In [55]:
# recursivo, iguais só na direita
def conta_dir(h, v):
    if h is None: return 0
    if v == h._info: 
        return 1 + conta_dir(h._dprox, v)
    return 0 + conta_dir(h._dprox, v) + conta_dir(h._eprox, v)

# iguais só na direita
def conta_NRD(h, v):
    cont = 0
    while h != None:
        if v == h._info: 
            cont+=1
            h = h._dprox
        elif v < h._info: h = h._eprox
        else: h = h._dprox
    return cont

# iguais só na esquerda
def conta_NRE(h, v):
    cont = 0
    while h != None:
        if v == h._info: 
            cont+=1
            h = h._eprox
        elif v < h._info: h = h._eprox
        else: h = h._dprox
    return cont

abb = None
for k in [2,2,3,1,4,7,2,4]: abb = insere(abb, k)
conta_NRE(abb,2)

1

#### A4

In [63]:
# Monta uma ABB a partir de uma lista já classificada
# Elementos repetidos tanto a esquerda quanto a direita
def montaABB(a, iesq, idir):
    # verifica se há elementos na lista
    if iesq > idir: return None
    m = (iesq + idir) // 2 # elemento médio
    abb = ABB(a[m])
    abb_esq = montaABB(a, iesq, m - 1)
    abb_dir = montaABB(a, m + 1, idir)
    abb._eprox = abb_esq
    abb._dprox = abb_dir
    return abb

# chamada raiz = monta(a, 0, n-1) monta a árvore com todos os elementos

lista = [0, 1, 2, 3, 4, 5, 6]
outralista = [0,1,1,2,2,2,3,3,3,3,4,4,4,5,5,6,7,8,9]
mabb = montaABB(lista, 0, 6)
moabb = montaABB(outralista, 0, 18)

**Exercícios**

1. Desenhe a ABB construída pelo algoritmo acima para as listas:
      1. [0, 1, 2, 3, 4, 5, 6]
      2. [0, 1, 1, 3, 4, 4, 5, 6, 6]
      
2. Refaça a função montaABB acima usando sub-listas do Python. A função terá então um só parâmetro montaABB(a).

#### A5

In [None]:
# Conta o número de nós de uma ABB h
def contaNN(h):
    if h is None: return 0
    return 1 + contaNN(h._eprox) + contaNN(h._dprox)

**Exercícios**

1. Função conta1(h) que conta o número de folhas de uma AB h.
2. Função conta2(h) que conta o número de nós que tenham pelo menos um filho de uma AB h.
3. Função conta3(h, x) que conta número de elementos com info >= x de uma ABB h.
4. Idem ao problema A4 acima, considerando uma ABB onde elementos iguais ficam à direita.

In [1]:
# conta nº de folhas
def conta1(h):
    if h._eprox == None and h._dprox == None: return 1
    return conta1(h._eprox) + conta1(h._dprox)

# conta nº de nós com pelo menos 1 filho
def conta2(h):
    if h ._eprox != None or h._dprox != None:
        return 1 + conta2(h._eprox) + conta2(h._dprox)
    return 0

# conta nº de elementos >= x
def conta3(h,x):
    t = h._info
    if t >= x:
        return 1 + conta3(h._eprox) + conta3(h._dprox)
    else:
        return 0 + conta3(h._dprox)

**Extra Prova 2**

Escreva uma função ImprimeMI (R, x) que recebe uma ABB R e um valor x. Imprime todos os elementos da ABB (campo info) maiores ou iguais a x em ordem crescente.

In [2]:
# imprime todos os infos de R.eprox (parte esquerda)
# imprime R.info
# imprime todos os infos de R.dprox (parte direita)
def ImprimeMI(R, x):
    if R == None: return
    if R.info < x:
        ImprimeMI(R.dprox, x)
    elif R.info == x:
        print(R.info)
        ImprimeMI(R.dprox, x)
    else:
        ImprimeMI(R.eprox, x)
        print(R.info)
        ImprimeMI(R.dprox, x)
        
def ImprimeMI2(R, x):
    if R == None: return
    if R.info < x:
        ImprimeMI2(R.dprox, x)
    else:
        ImprimeMI2(R.eprox, x)
        print(R.info)
        ImprimeMI2(R.dprox, x)
        
def ImprimeMI3(R, x):
    if R == None: return
    ImprimeMI3(R.eprox, x)
    if R.info >= x: 
        print(R.info)
    ImprimeMI3(R.dprox, x)


#### A6

In [None]:
# Devolve lista com todos os nós de um certo nivel niv
def listaniveis(h, listnos, niv, niv_atual):
    if niv == niv_atual:
        if h is not None: listnos.append(h._info)
        else: listnos.append(None)
        return
    # ainda não chegou neste nível
    if h is not None:
        listaniveis(h._eprox, listnos, niv, niv_atual + 1)
        listaniveis(h._dprox, listnos, niv, niv_atual + 1)
    else:
        listaniveis(None, listnos, niv, niv_atual + 1)
        listaniveis(None, listnos, niv, niv_atual + 1)
        
# lista cada um dos níveis da ABB mabb
k = 0
while True:
    ln = []
    listaniveis(mabb, ln, k, 0)
    if ln.count(None) == 2 ** k: break
    print("nivel ", k,":", ln)
    k = k + 1
print("Esta ABB tem", k, "níveis")

#### A7

In [9]:
# transforma o trecho acima em uma função
def ImprimeNiveisABB(h, nomeABB):
    print("\n\nLista a ABB:", nomeABB, "nível a nível")
    k = 0
    while True:
        ln = []
        listaniveis(h, ln, k, 0)
        if ln.count(None) == 2 ** k: break
        print("nivel ", k,":", ln)
        k = k + 1
    print("ABB", nomeABB, "com", k, "níveis")

#### A8

In [64]:
# percorre a ABB da sub-árvore esquerda, para raiz, para sub-árvore direita
# nós visitados em ordem crescente do campo info
def ImprimeABB(h):
    if h is None: return
    ImprimeABB(h._eprox)
    print(h._info)
    ImprimeABB(h._dprox)
    
ImprimeABB(mabb)

0
1
2
3
4
5
6


**Exercícios**

1. Idem visitando primeiro a raiz, sub-árvore esquerda e direita (ordem pré-fixa)
2. Idem visitando primeiro a sub-árvore esquerda, a direita e a raiz (ordem pós-fixa)

In [None]:
def ImprimeABB1(h):
    if h is None: return
    print(h._info)
    ImprimeABB1(h._eprox)
    ImprimeABB1(h._dprox)
    
def ImprimeABB2(h):
    if h is None: return
    ImprimeABB1(h._eprox)
    print(h._info)
    ImprimeABB1(h._dprox)

### Algoritmos de inserção numa ABB

#### A9

In [13]:
# Insere elemento com info x na ABB h
# Elementos iguais sempre a direita
def insere(h, x):
    # verifica se será o primeiro
    if h is None:
        h = ABB(x)
        return h
    # procura o lugar para inserir x
    # percorre a ABB até achar um nó com o filho None
    p, q = h, h
    while q is not None:
        v = q._info
        p = q
        # à esquerda ou à direita
        if x < v: q = q._eprox # esquerda
        else: q = q._dprox # direita
    # Neste ponto, p é o pai do nó a ser inserido
    # Verificar novamente se é a esquerda ou direita
    q = ABB(x)
    if x < p._info: p._eprox = q
    else: p._dprox = q
    return h

# exepmlo
abb = None
for k in [2,2,1,3]: abb = insere(abb, k)

**Exercícios**

1. A versão acima usa duas referências (p e q) para percorrer a ABB. Refaça usando apenas uma referência.
2. Escreva uma versão recursiva da inserção

**Complexidade da construção de uma ABB por inserções sucessivas**

O($n^2$)

**Complexidade da inserção em uma ABB**

Pior caso: O(n)

Melhor caso (árvore completa): O(logn)

### Algoritmo de remoção em uma ABB

### Árvores Binárias de Busca Completas

ABBs podem ficar desbalanceadas com a inserção ou remoção de novos elementos. Seria ideal que a ABB fosse **completa** (com menor número de níveis possível). Pode-se fazer isso de 2 formas:

1. Toda vez que um elemento é inserido ou removido, rearranja-se a ABB para a mesma continue completa.

2. Inserir e remover elementos da maneira usual e de tempos em tempos executar um algoritmo que reconstrói a ABB deixando-a completa.

Com uma ABB completa, temos a situação ideal de busca, pois temos uma algoritmo equivalente ao da busca binária O(log N), em uma tabela que permite inserções rápidas (O(log N)) e remoções tão rápidas quanto possível (O(N) no pior caso). Além disso, só usa
a quantidade de memória necessária.