### Busca Sequencial

Consiste em varrer uma tabela a procura de um determinado elemento, verificando ao final se o mesmo foi ou
não foi encontrado.

In [4]:
def busca1(a, x):
    n = len(a)
    for i in range(n):
        if a[i] == x: return i
    return -1

def busca2(a, x):
    n = len(a)
    i = 0
    while i < n and a[i] != x:
        i += 1
    # verifica se parou porque chegou ao fim ou encontrou um igual
    if i == n: return -1 # chegou a
    return i # encontrou um igual

Para Busca1, temos a comparação (a[i] == x) sendo executada:

Máximo = n (n encontra ou x = a[n-1])

Mínimo = 1 (x = a[0])

Médio = (n+1)/2 (aqui com a hipótese de que a probabilidade de ser encontrada em cada lugar é a mesma)

O(n)

Se tiverem probabilidades diferentes temos:

Colocar no início da tabela os elementos com maior frequência, já que serão encontrados com menos comparações.

    Suponha agora que a probabilidade do elemento procurado ser a[i] é pi.
    Σ pi (0<=i<n) é a probabilidade de x estar na tabela.
    Σ pi < 1 se existe alguma chance de x não estar na tabela.
    1 - Σ pi é a probabilidade de x não estar na tabela.
    O número médio de comparações será então:
    1.p0 + 2.p1 + 3.p2 + ... + n.p(n-1) + n.( 1 - Σ pi )

Nº médio de comparações é menor do que normalmente.

### Busca sequencial em tabela ordenada

Modificação: se durante a busca, encontrar um elemento que é maior que x, não adianta continuar a procurar, já que todos os outros também serão maiores.

In [None]:
def busca(a, x):
    n = len(a)
    for i in range(n):
        if a[i] == x: return i # encontrou
        if a[i] > x: return -1 # não adianta continuar procurando    return -1

def busca(a, x):
    n = len(a)
    i = 0
    while i < n and a[i] < x: i += 1
    # verifica se parou porque chegou ao fim ou encontrou um igual
    if i == n: return -1 # chegou ao final
    if a[i] == x: return i # achou
    return -1 # encontrou um maior então não adianta procurar mais

### Busca binária em tabela ordenada

1) Testa com o elemento do meio da tabela;

2) Se for igual, termina o algoritmo porque encontrou o elemento;

3) Se o elemento do meio é maior, repete o processo considerando a tabela do inicio até o meio – 1;

4) Se o elemento do meio é menor, repete o processo considerando a tabela do meio + 1 até o final;

Se o elemento não está na tabela, chegará o momento em que a tabela restante terá zero elementos que é o
outro critério de parada do algoritmo.

In [5]:
def buscabinaria(a, x):
    n = len(a)
    inicio = 0
    final = n - 1
    # Enquanto a tabela tem elementos continue procurando
    while inicio <= final:
        meio = (inicio + final) // 2
        if a[meio] == x: return meio # encontrou o procurado
        # verifica se continua a procura na parte superior ou inferior
        if x < a[meio]: final = meio - 1 # parte superior
        else: inicio = meio + 1 # parte inferior
    return -1

#### Exercício


Considerando a tabela [2 5 7 11 13 17 25].

1) Quantas comparações serão necessárias para procurar cada um dos 7 elementos da tabela?  
P/ busca sequencial      P/ busca binária  
2 -> 1                   2 -> 3  
5 -> 2                   5 -> 2  
7 -> 3                   7 -> 3  
11 -> 4                  11 -> 1  
13 -> 5                  13 -> 3  
17 -> 6                  17 -> 2  
25 -> 7                  25 -> 3  

2) Diga quantas comparações serão necessárias para procurar os seguintes números que não estão na tabela 12, 28, 1, 75, 8?  
P/ busca sequencial      P/ busca binária
12 -> 7                  12 -> 3
28 -> 7                  28 -> 3
1 -> 7                   1 -> 3
75 -> 7                  75 -> 3
8 -> 7                   8 -> 3

Sendo uma outra tabela [2 5 7 11 13 17 25 3 35 39]

1) Quantas comparações para cada um dos 10 elementos?

P/ busca sequencial      P/ busca binária
2 -> 1                   2 -> 3
5 -> 2                   5 -> 2
7 -> 3                   7 -> 3
11 -> 4                  11 -> 4
13 -> 5                  13 -> 1
17 -> 6                  17 -> 3
25 -> 7                  25 -> 4
3 -> 8                   3 -> 2
35 -> 9                  35 -> 3 
39 ->  10                39 ->  4

2) Quantas comparações para os números 12,28,1,75,8?

P/ busca sequencial      P/ busca binária
12 -> 10                  12 -> 5
28 -> 10                  28 -> 4
1 -> 10                   1 -> 3
75 -> 10                  75 -> 4
8 -> 10                   8 -> 4

#### Exercício

Outra forma de se pensar o algoritmo de busca binária, é usar o fato que a tabela tem um primeiro elemento
(base) e um tamanho (n). A cada repetição compara-se o elemento procurado com o elemento médio da
tabela (x == a[base + n // 2]?). Se encontrar termina. Se x > a[base + n // 2] o elemento
procurado deve estar acima e a nova base fica sendo (base + n // 2 + 1), enquanto o novo valor de n
fica em (n // 2)se n é impar ou (n // 2 -1) se n é par. Se x < a[base + n // 2] o
elemento procurado deve estar abaixo, a base permanece a mesma e n fica em (n // 2). Inicialmente a
base é zero e o algoritmo termina quando n fica zero, isto é, a tabela terminou e não encontramos o
elemento procurado.

1) Escreva a função buscabinaria2(a, n), usando esse algoritmo.

In [206]:
def buscabinaria(a, x):
    n = len(a)
    inicio = 0
    final = n - 1
    # Enquanto a tabela tem elementos continue procurando
    while inicio <= final:
        meio = (inicio + final) // 2
        if a[meio] == x: return meio # encontrou o procurado
        # verifica se continua a procura na parte superior ou inferior
        if x < a[meio]: final = meio -1 # parte superior
        else: inicio = meio + 1 # parte inferior
    return -1

def buscabinaria2(a, x):
    n, base = len(a), 0
    # enquanto existir elementos na lista, itera
    while n > 0:
        # se encontrou, é maior ou menor
        if x == a[base+n//2]: return base+n//2
        elif x > a[base+n//2]:
            base = base + n//2+1
            if n%2 == 0: n = n//2-1
            else: n = n//2
        else: n = n//2
    return -1

l = [1,2,3,4,6,8,11]
buscabinaria2(l,4)

3

### Busca binária recursiva

In [21]:
def BBR(a, inicio, final, x):
    if inicio > final: return -1
    k = (inicio + final) // 2
    if a[k] == x: return k
    # procura na parte superior ou inferior da tabela
    if a[k] > x: return BBR(a, inicio, k - 1, x)
    return BBR(a, k + 1, final, x)

# com chamada inicial BBR(v,0,n-1,x)

#### Exercício

In [209]:
def BBR2(a, base, n, x):
    if n <= 0: return -1
    if x == a[base+n//2]: return base+n//2
    # procura na parte superior ou inferior da tabela
    if x > a[base+n//2]: 
        if n%2 == 0: return BBR2(a, base + n//2+1, n//2-1, x)
        else: return BBR2(a, base + n//2+1, n//2, x)
    else: return BBR2(a, base, n//2, x)
    
l = [1,2,3,4,6,8,11]
BBR2(l,0,len(l),2)

1

In [62]:
# procura x em a[0] até a[n-1] e devolve:
# 0 se x<= a[0]
# n se x > a[n-1]
# R se a[R-1] < x <= a[R]
def binariaP(x, a):
    n = len(a)
    # se x está fora da tabela
    if x <= a[0]: return 0
    if x > a[n-1]: return n
    # x pode estar dentro da tabela
    L = 0
    R = n-1
    while R - L > 1:
        M = (R + L) // 2
        if x <= a[M]: R = M
        else: L = M
    return R

l = [1,2,3,4,6,8,11]
binariaP(10,l)

6

### Busca binária - análise simplificada


Comparação principal é a[meio] == x, pois representa a quantidade de repetições até o final do algoritmo.

#### Mínimo 

1 (encontra na primeira)

#### Máximo

Enquanto não se encontra o elemento procurado, as comparações continuam até o valor k tal que:

$2^k$ ≤ N < $2^{k+1}$

Ou k ≤ lg N < k + 1 (lg N é o log de N na base 2)

Ou ainda (somando – k – lg N em todos os membros): - lg N ≤ - k < - lg N + 1

Ou (multiplicando por -1) lg N – 1 < k ≤ lg N

Como estamos interessados no valor (k + 1) temos: lg N < (k + 1) ≤ 1 + lg N

Assim o número máximo de comparações está entre lg N e 1 + lg N

Então ele é O(lgN) ou O(logN)

#### Médio

lg (N+1) - 1

### Exercícios

1) Tabela de 5 elementos com as seguintes probabilidades de busca.

    elemento       x1  x2   x3   x4   x5
    probabilidade 0.5 0.25 0.15 0.08 0.02
    
a) Calcule o número médio de comparações no algoritmo de busca seqüencial para a tabela com os elementos na seguinte ordem:

    a1) x1, x2, x3, x4, x5
    a2) x5, x4, x3, x2, x1
    a3) x3, x2, x5, x1, x4   
R:

    1.p0 + 2.p1 + 3.p2 + 4.p3 + 5.p4 + 5.(1-1)
    a1) 1,87
    a2) 4,13
    a3) 3,11    

b) Idem supondo a seguinte distribuição, sendo que o elemento procurado pode não estar na tabela.

    elemento      x1  x2  x3  x4  x5
    probabilidade 0.4 0.2 0.1 0.1 0.05
R:

    1.p0 + 2.p1 + 3.p2 + 4.p3 + 5.p4 + 5.(1-0.85)
    a1) 2,5 
    a2) 4,1
    a3) 3,5

2) Considerando a modificação no algoritmo de busca binária.

In [100]:
import random

def entre(a,b):
    return random.randrange(a,b+1)

def buscabinaria(a, x):
    n = len(a)
    inicio = 0
    final = n - 1
    # Enquanto a tabela tem elementos continue procurando
    while inicio <= final:
        meio = entre(inicio, final)
        if a[meio] == x: return meio # encontrou o procurado
        # verifica se continua a procura na parte superior ou inferior
        if x < a[meio]: final = meio -1 # parte superior
        else: inicio = meio + 1 # parte inferior
    # Se chegou aqui é porque esgotou as possibilidades e não encontrou
    return -1

l = [1,2,3,4,6,8,11]
buscabinaria(l,4)

0

A função entre(inicio,final) é uma função que devolve um número aleatório entre inicio e fim.

a) Está correta? R: Sim, não é necessário ser exatamente no meio, esse é apenas a melhor escolha.

b) Diga qual o número mínimo e o número máximo de vezes que a comparação (v[i] == x) é efetuada e em qual situação ocorre.

    Mínimo = 1 (se a[meio] é o primeiro elemento comparado); 
    Máximo = n (se aleatoriamente fosse escolhido o meio de forma que virasse uma lista sequencial)

c) O que acontece se a função devolver n/3?  R: Sei la

3) Escreva um algoritmo de busca ternária, isto é, a cada passo calcular m1=n/2 e m2=2*n/3. A tabela então fica dividida em 3 partes (esquerda, meio e direita). Daí basta comparar com m1 e m2. Se não for igual o elemento deve estar em uma das 3 partes. A cada passo a tabela fica dividida por 3.

In [5]:
def buscabinaria(a, x):
    n = len(a)
    inicio = 0
    final = n - 1
    # Enquanto a tabela tem elementos continue procurando
    while inicio <= final:
        meio = (inicio + final) // 2
        if a[meio] == x: return meio # encontrou o procurado
        # verifica se continua a procura na parte superior ou inferior
        if x < a[meio]: final = meio - 1 # parte superior
        else: inicio = meio + 1 # parte inferior
    return -1

def busca_ternaria(a, x):
    n = len(a)
    inicio = 0
    final = n-1
    while inicio <= final:
        m1, m2 = (inicio+final)//2, (2*(final-inicio)//3)+inicio
        if a[m1] == x: return m1
        elif a[m2] == x: return m2
        if x < a[m1]: final = m1 - 1
        elif a[m1] < x < a[m2]: inicio, final = m1 + 1, m2 - 1
        elif x > a[m2]: inicio = m2 + 1
    return -1
        
l = [1,2,3,4,6,8,11,13]
busca_ternaria(l,13)

7