<a href="https://colab.research.google.com/github/cristianegea/Estruturas-de-Dados-e-Algoritmos-usando-Python/blob/main/4_Busca_e_Ordena%C3%A7%C3%A3o.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1. Busca

A busca é o processo de selecionar determinada informação a partir de uma coleção de dados com base em um critério específico. Em outras palavras, é o processo de localizar um item específico em uma coleção de itens de dados.

Busca sequencial: envolve localizar um item dentro de uma sequência utilizando uma `search key` para identificar um item específico. Uma `key` é um valor único utilizado para identificar os elementos de dados de uma coleção.

## 1.1. Busca Linear

A solução mais simples para o problema de busca de sequência é o algoritmo de busca linear ou sequencial. Esta técnica itera sobre uma sequência até que o item especificado seja localizado ou todos os items tenham sido examinados.

In [None]:
# O item alvo pode ser localizado em uma sequência utilizando o operador "in"
if key in theArray:
  print("The key is in the array")
else:
  print("The key is not in the array")

**Procura por item específico** 

Um loop controlado por contagem é utilizado para atravessar a sequência enquanto cada elemente é comparado com o valor alvo. Se o valor alvo estiver na sequência, o loop é finalizado e `True` é retornado. Caso contrário, uma travessia completa é realizada e `False` é retornado após finalização do loop.

In [None]:
# Algoritmo de busca sequencial, cujo resultado é um valor booleano indicando sucesso ou falha do processo de busca
# Implementation of the linear search on an unsorted sequence
def linearSearch( theValues, target ) :
  n = len( theValues )
  for i in range( n ) :
    # If the target is in the ith element, return True
    if theValues[i] == target:
      return True
  
  return False # If not found, return False.

Para analisar o algoritmo de busca sequencial para o pior caso, é preciso primeiramente determinar as condições que constituem o pior caso.

Obs.: o pior caso ocorre quando o algoritmo executa o nº máximo de etapas. Para uma busca sequencial, o pior caso ocorre quando o item alvo não está na sequência e o loop itera sobre a sequência completa.

**Busca em uma sequência ordenada**

Uma busca linear também pode ser realizada sobre uma sequência ordenada, que é uma sequência contendo valores em uma ordem específica.

Uma busca linear sobre uma sequência ordenada trabalha da mesma forma que trabalha sobre uma sequência não ordenada, com uma exceção. É possível terminar a busca em menos tempos quando o valor não está localizado na sequência, em vez de sempre ter de realizar uma travessia completa.

A única modificação com relação à versão anterior é a inclusão de um teste para determinar se o item atual dentro da sequência é maior que o valor alvo. Se um valor maior é encontrado, o loop termina e `False` é retornado. Neste caso, o pior caso ocorre quando o valor não está na sequência e é maior do que o último elemento da sequência. Neste caso, o algoritmo ainda atravessará a sequência completa de $n$ itens.

In [None]:
# Implementation of the linear search on a sorted sequence
def sortedLinearSearch( theValues, item ) :
  n = len( theValues )
  for i in range( n ) :
    # If the target is found in the ith element, return True
    if theValues[i] == item :
      return True
    # If target is larger than the ith element, it's not in the sequence.
    elif theValues[i] > item :
      return False
  
  return False # The item is not in the sequence.

**Localizando o menor valor**

No caso de uma sequência não ordenada, para preparar o loop é assumido que o primeiro valor na sequência é o menor e inicia-se a comparação com o segundo item. Visto que o menor valor pode estar em qualquer lugar da sequência, é preciso realizar uma completa transversal.

In [None]:
# Searching for the smallest value in an unsorted sequence.
def findSmallest( theValues ):
  n = len( theValues )
  # Assume the first item is the smallest value
  smallest = theValues[0]
  # Determine if any other item in the sequence is smaller
  for i in range( 1, n ) :
    if theList[i] < smallest :
      smallest = theValues[i]
  return smallest # Return the smallest found.

## 1.2. Busca Binária

O algoritmo de busca linear para uma sequência ordenada produziu uma leve melhoria sobre a busca linear com uma sequência não ordenada, contudo ambos os casos possuem complexidade de tempo no pior caso. Neste caso, o algoritmo envolve a divisão de um problema grande em partes menores.

O algoritmo começa examinando o item do meio da sequência ordenada, resultando em uma das 3 possíveis condições:

* o item do meio é o valor alvo

* o item do meio é menor que o valor alvo

* o item do meio é maior que o valor alvo

Uma vez que a sequência é ordenada, é possível eliminar metade dos itens da lista quando o valor alvo não é encontrado na posição do meio.

Tendo descartado uma das metades da sequência, o processo é repetido sobre os itens remanescentes. Contudo, se o valor alvo não for localizado, o processo continuará até o valor alvo ser encontrado ou todos os valores serem eliminados.

In [None]:
# Implementation of the binary search algorithm.
def binarySearch( theValues, target ) :
  # Start with the entire sequence of elements.
  low = 0
  high = len(theValues) - 1

  '''
    low e high são utilizados para marcar o intervalo dos elementos na sequência
    
    Quando a busca começa, o intervalo é a sequência completa, visto que o valor alvo pode estar
    qualquer lugar na sequência
    
    A primeira etapa da iteração é determinar o ponto do meio da sequência

    Depois de calcular o valor do meio, o elemento correspondente na posição é examinado.

    Se valor alvo = valor do meio, o algoritmo retorna True

    Se valor alvo < valor do meio, a marcação high é ajustada para ser menor que o ponto do meio

    Se valor alvo > valor do meio, a marcação low é ajustada para ser maior que o ponto do meio
  '''

  # Repeatedly subdivide the sequence in half until the target is found.
  while low <= high :
    # Find the midpoint of the sequence.
    mid = (high + low) // 2
    # Does the midpoint contain the target?
    if theValues[mid] == target :
      return True
    # Or does the target precede the midpoint?
    elif target < theValues[mid] :
      high = mid - 1
    # Or does it follow the midpoint?
    else :
      low = mid + 1
    
  # If the sequence cannot be subdivided further, we're done.
  return False

O pior caso ocorre quando o valor alvo não está localizado na sequência, semelhantemente ao caso da busca linear. A diferença é que nem todos os elementos na sequência são examinados antes de determinar se o valor alvo está ou não na sequência, mesmo no pior caso.

# 2. Ordenação

Ordenação é o processo de arranjar ou ordenar uma coleção de itens, tal que cada item e seus sucessor satisfazem uma relação prestabelecida. Os itens podem ser valores simples (como inteiros e reais) ou tipos mais complexos (como registros ou dicionários). A chave pode ser o próprio valor quando a ordenação envolve tipos simples ou pode ser um componente específico ou combinação de componentes quando a ordenação envolve tipos complexos.

O Python fornece o método `sort()` para ordenar uma lista, contudo este método não pode ser utilizado com um array ou outras estruturas de dados.

## 2.1. Bubble Sort

O algoritmo bubble sort reordena os valores iterando sobre a lista diversas vezes, fazendo com que valores maiores borbulhem no topo ou no final da lista.

O algoritmo requer múltiplos passos sobre os elementos, com cada passo iniciando no primeiro elemento e terminando na posição antes da iteração anterior. Durante cada passo, os elementos na primeira e segunda posição são comparados. Se o primeiro elemento for maior que o segundo, então os elementos são trocados de lugar. Caso contrário, permanecem na mesma posição.

No passo seguinte, as posições 2 e 3 são comparadas. Se o primeiro for maior que o segundo, então eles são trocados de lugar. Caso contrário, permanecem na mesma posição.

O processo continua para cada par sucessivo de elementos até que o elemento com maior valor seja posicionado no final.



In [None]:
# Implementation of the bubble sort algorithm
# Sorts a sequence in ascending order using the bubble sort algorithm.
def bubbleSort( theSeq ):
  n = len( theSeq )
  # Perform n-1 bubble operations on the sequence
  for i in range( n - 1 ) :
    # Bubble the largest item to the end.
    for j in range( i + n - 1 ) :
      if theSeq[j] > theSeq[j + 1] : # swap the j and j+1 items.
      tmp = theSeq[j]
      theSeq[j] = theSeq[j + 1]
      theSeq[j + 1] = tmp

A eficiência do algoritmo bubble sort depende somente do nº total de chaves no array e é independente dos valores específicos e do arranjo inicial destes valores.

Para determinar a eficiência é preciso determinar o número total de iterações realizadas pelo loop interno para uma sequência contendo $n$ valores. O loop externo é executado $n-1$ vezes, visto que o algoritmo realiza $n-1$ passos sobre a sequência. O número de iterações para o loop interno não é fixo, mas depende da iteração atual do loop externo. O número total de iterações para o loop interno será a soma dos $n-1$ inteiros, que é igual a 

$$
\frac{n(n-1)}{2} - n = \frac{1}{2}(n^2+n)
$$

O bubble sort é considerado um dos algoritmos de ordenação mais ineficiente devido ao número total de trocas requeridas. Dado um array de chaves na ordem reversa, uma troca é realizada para cada iteração para o loop interno, que pode ser custoso na prática.

Caso a sequência já esteja ordenada não haverá a necessidade de ordená-la. Porém, o algoritmo mesmo assim realizará as iterações sobre os $n$ elementos da sequência.

## 2.2. Selection Sort

Em vez de trocar os elementos de lugar como realizado no bubble sort, os elementos são escaneados a fim de localizar o menor elemento da sequência. Assim, o processo começa localizando o menor valor na sequência e o troca de lugar com o valor que está na primeira posição na sequência. O segundo menor valor é localizado se trocado de lugar com o valor na 2ª posição. Este processo continua posicionando cada valor sucessivo, selecionando-os daqueles ainda não classificados e trocando com os valores nas respectivas posições.

Quando o selection sort é implementado no código, o algoritmo mantém tanto os valores ordenados quanto os valores não ordenados na mesma estrutura de sequência.

O selection sort realiza múltiplos passos sobre a sequência, mas, diferentemente do bubble sort, realiza unica troca depois de cada passo.

In [None]:
# Implementation of the selection sort algorithm.
# Sorts a sequence in ascending order using the selection sort algorithm.
def selectionSort( theSeq ):
  n = len( theSeq )
  for i in range( n - 1 ):
    # Assume the ith element is the smallest.
    smallNdx = i
    # Determine if any other element contains a smaller value.
    for j in range( i + 1, n ):
      if theSeq[j] < theSeq[smallNdx] :
        smallNdx = j

  # Swap the ith value and smallNdx value only if the smallest value is
  # not already in its proper position. Some implementations omit testing
  # the condition and always swap the two values.
  if smallNdx != i :
    tmp = theSeq[i]
    theSeq[i] = theSeq[smallNdx]
    theSeq[smallNdx] = tmp

O selection sort realiza $n-1$ passos sobre o array e reposiciona $n-1$ valores.



## 2.3. Insertion Sort

O insertion sort mantém uma coleção de itens ordenados e um coleção de itens a ser ordenado. Quando o algoritmo insertion sort é implementado em um programa, são mantidas as coleções ordenadas e não ordenadas com a mesma estrutura de sequência.

O algoritmo mantém a lista de valores ordenados no início da sequência e escolhe o próximo valor não classificado do primeiro daqueles ainda a serem posicionados. Para posicionar o próximo item, o local correto dentro da sequência dos valores ordenados é localizado por meio da busca. Depois de localizar a posição adequada, os itens são deslocados descendo uma posiçaõ a fim de liberar a posição.

In [None]:
# Implementation of the insertion sort algorithm.
# Sorts a sequence in ascending order using the insertion sort algorithm.
def insertionSort( theSeq ):
  n = len( theSeq )
  # Starts with the first item as the only sorted entry.
  for i in range( 1, n ) :
    # Save the value to be positioned
    value = theSeq[i]
    # Find the position where value fits in the ordered part of the list.
    pos = i
    while pos > 0 and value < theSeq[pos - 1] :
      # Shift the items to the right during the search
      theSeq[pos] = theSeq[pos - 1]
      pos -= 1
    
    # Put the saved value into the open slot.
    theSeq[pos] = value

'''
  A função insertioSort() começa assumindo que o 1º item está localizado na posição adequada.

  Em seguida, uma iteração é realizada sobre os itens remanescentes, de modo que cada valor possa ser
  inserido em suas posições apropriadas dentro da porção ordenada da sequência.

  A parte ordenada da sequência está na frente, enquanto as que ainda não foram inseridas estão no final 

  A variável de índice de loop i marca o ponto de separação entre as duas partes 

  O loop interno é utilizado para localizar o ponto de inserção dentro de sequência ordenada e, no mesmo
  tempo, desloca os itens para baixo para abrir espaço para o próximo item. 
'''