# 03 - Algoritmos de Ordenação (Counting Sort)

Estruturas de Dados e Algoritmos

Ciência da Computação

Universidade Federal de Campina Grande (UFCG)

Rafael de Arruda Sobral (UFCG/SEE-PB)

Prof. Dr. Adalberto Cajueiro de Farias (UFCG)

- Crie uma cópia deste *Notebook* do *Google Colaboratory* em seu *Google Drive*: `Arquivo` -> `Salvar uma cópia no Drive`.

- Vale ressaltar que este material é um complemento ao conteúdo estudado no componente curricular "Estruturas de Dados e Algoritmos" do curso de Ciência da Computação da UFCG, com o intuito de contribuir com as aulas de monitoria.

Este material aborda os algoritmos de ordenação em tempo linear, tal como o Counting Sort, além de propor alguns exercícios práticos.

# Algoritmos em tempo linear

Todos os algoritmos que estudamos até agora demandam de comparações para ordenar sequências. Em termos de Análise Assintótica, isso acarreta em um tempo de execução variando entre O(n log n) até O(n²). Apenas o Bubble Sort e o Insertion Sort podem ter complexidade O(n) em seu melhor caso, ainda que isso só aconteça quando a sequência já está ordenada, algo nem um pouco eficaz no final das contas. É importante lembrar que sempre enfatizamos o pior caso de execução desde o ponto de vista assintótico. Entretanto, alguns algoritmos não precisam comparar elementos para ordenar os vetores, podendo resultar em uma complexidade linear. Alguns exemplos são: Counting Sort, Radix Sort ([clique aqui](https://visualgo.net/en/sorting)), e Bucket Sort. Neste material, vamos dar ênfase apenas ao primeiro algoritmo mencionado.

Porém, ainda é válido destacar que os algoritmos de tempo linear que não demandam de comparações também acarretam em mais uso de memória extra. Além disso, o Radix Sort e o Bucket Sort precisam de outro algoritmo em sua lógica para conseguir fazer as ordenações, normalmente usando o Counting Sort (não demandando de comparações e com complexidade linear), caso contrário esses algoritmos podem ter um custo maior.

Observe, por exemplo, o código do Bucket Sort em Python a seguir e perceba como o algoritmo estrutura sua lógica. Analise o tempo de execução e note que a complexidade não é linear. Tente entender como o tempo de execução se torna cúbico e por qual motivo a complexidade assintótica é prejudicada, tendo em vista o uso de outro algoritmo internamente. Neste exemplo, meramente ilustrativo, você também deve perceber que usamos funções built-in de listas em Python, ao invés de apenas manipular os índices do vetor tais quais em um array em Java. Aproveite e revise como criar "asserts" em Python.

In [None]:
# @title {vertical-output: true}

def bucket_sort(array):

  """
  Bucket Sort divides the unsorted array elements into
  several groups called buckets. Each bucket is then sorted
  by using any of the suitable sorting algorithms or
  recursively applying the same bucket algorithm. Finally,
  the sorted buckets are combined to form a final sorted array.
  """

  # If so, return the empty array
  if len(array) == 0:
    return array

  # Determine the number of buckets
  num_buckets = len(array)
  max_value = max(array)

  # Create empty buckets
  bucket = [[] for _ in range(num_buckets)]

  # Insert elements into their respective buckets
  for j in array:
    index_b = int(num_buckets * j / (max_value + 1))
    bucket[index_b].append(j)

  # Sort the elements of each bucket using Insertion Sort
  for i in range(num_buckets):
    bucket[i] = insertion_sort(bucket[i])

  # Get the sorted elements
  sorted_array = []
  for i in range(num_buckets):
    sorted_array.extend(bucket[i])

  return sorted_array

def insertion_sort(array):

  """ Insertion Sort algorithm. """

  for i in range(1, len(array)):
    key = array[i]
    aux = i - 1
    while (aux >= 0 and array[aux] > key):
      array[aux + 1] = array[aux]
      aux -= 1
    array[aux + 1] = key
  return array

def asserts():

  """ Test the Bucket Sort """

  # Test 1: Basic test case
  assert bucket_sort([0.2, 0.7, 0.1]) == [0.1, 0.2, 0.7]
  print("Test 1 Passed: [0.1, 0.2, 0.7]")

  # Test 2: Empty list
  if bucket_sort([]) == []:
    print("Test 2 Passed: []")
    assert True
  else:
    print("Test 2 Failed: Expected []")
    assert False

  # Test 3: Single element
  if bucket_sort([0.5]) == [0.5]:
    print("Test 3 Passed: [0.5]")
    assert True
  else:
    print("Test 3 Failed: Expected [0.5]")
    assert False

  # Test 4: Already sorted
  if bucket_sort([0.1, 0.2, 0.3, 0.4, 0.5]) == [0.1, 0.2, 0.3, 0.4, 0.5]:
    print("Test 4 Passed: [0.1, 0.2, 0.3, 0.4, 0.5]")
    assert True
  else:
    print("Test 4 Failed: Expected [0.1, 0.2, 0.3, 0.4, 0.5]")
    assert False

  # Test 5: Reverse sorted
  if bucket_sort([0.5, 0.4, 0.3, 0.2, 0.1]) == [0.1, 0.2, 0.3, 0.4, 0.5]:
    print("Test 5 Passed: [0.1, 0.2, 0.3, 0.4, 0.5]")
    assert True
  else:
    print("Test 5 Failed: Expected [0.1, 0.2, 0.3, 0.4, 0.5]")
    assert False

  # Test 6: Random order
  if bucket_sort([0.9, 0.2, 0.4, 0.1, 0.5, 0.8, 0.6, 0.3, 0.7]) == [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]:
    print("Test 6 Passed: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]")
    assert True
  else:
    print("Test 6 Failed: Expected [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]")
    assert False

  # Test 7: Duplicates
  if bucket_sort([0.5, 0.3, 0.5, 0.3, 0.5]) == [0.3, 0.3, 0.5, 0.5, 0.5]:
    print("Test 7 Passed: [0.3, 0.3, 0.5, 0.5, 0.5]")
    assert True
  else:
    print("Test 7 Failed: Expected [0.3, 0.3, 0.5, 0.5, 0.5]")
    assert False

  # Test 8: Mixed small and large numbers
  if bucket_sort([0.12, 0.34, 0.23, 0.45, 0.56, 0.78, 0.67, 0.89]) == [0.12, 0.23, 0.34, 0.45, 0.56, 0.67, 0.78, 0.89]:
    print("Test 8 Passed: [0.12, 0.23, 0.34, 0.45, 0.56, 0.67, 0.78, 0.89]")
    assert True
  else:
    print("Test 8 Failed: Expected [0.12, 0.23, 0.34, 0.45, 0.56, 0.67, 0.78, 0.89]")
    assert False

# Run the tests
asserts()

Test 1 Passed: [0.1, 0.2, 0.7]
Test 2 Passed: []
Test 3 Passed: [0.5]
Test 4 Passed: [0.1, 0.2, 0.3, 0.4, 0.5]
Test 5 Passed: [0.1, 0.2, 0.3, 0.4, 0.5]
Test 6 Passed: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]
Test 7 Passed: [0.3, 0.3, 0.5, 0.5, 0.5]
Test 8 Passed: [0.12, 0.23, 0.34, 0.45, 0.56, 0.67, 0.78, 0.89]


# Counting Sort

O algoritmo Counting Sort tem uma rotina de contagem de frequência de elementos, fazendo uso de memória extra tanto para alocar esse cálculo quanto para ordenar os valores. De forma geral, é possível mapear o elemento para uma posição indexada com o mesmo valor do elemento. Assim, seu tempo de execução é linear, dado por O(n+k), podendo ser otimizado quando encontramos o menor e o maior valor da sequência a ser ordenada. Isso também importa para o caso do uso de memória extra, uma vez que podemos criar vetores de memória extra apenas com o tamanho necessário. Confira o funcionamento do algoritmo através do VisuAlgo: [clique aqui](https://visualgo.net/en/sorting).

Esperamos que você já tenha compreendido a versão do Counting Sort em Java, logo o código em Python a seguir pode ser melhor analisado. Faça testes diferentes com entradas diversas mediante a simulação do "main" fornecida, ou ainda criando alguns "asserts" em Python.

In [None]:
# @title {vertical-output: true}

def counting_sort(array):

  """
  The Counting Sort algorithm records the frequency of
  elements and sorts them according to the index.
  It demands a O(n + k) complexity, even though using
  extra memory.
  """

  greater = array[0]
  for i in range(1, len(array)):
     if (array[i] > greater):
        greater = array[i]
  count = [0] * (greater + 1)
  for i in range(0, len(array)):
     count[array[i]] += 1
  for i in range(1, len(count)):
     count[i] += count[i - 1]
  aux = [0] * (len(array))
  for i in range(len(array) - 1, -1, -1):
     aux[count[array[i]] - 1] = array[i]
     count[array[i]] -= 1
  for i in range(0, len(array)):
     array[i] = aux[i]

def main():

    """ Simula a entrada e a saída de dados. """

    entrada = input().split()
    lista = [int(e) for e in entrada]
    counting_sort(lista)
    print(lista)

main()

2 4 3 7 1 5 9 8 6
[1, 2, 3, 4, 5, 6, 7, 8, 9]


# Exercícios

In [None]:
# @title {vertical-output: true}

# EXERCÍCIO 01

def counting_sort_extended(array):

  """
  Esta versão do algoritmo deve satisfazer os seguintes
  requisitos:

  - Alocar o tamanho mínimo possível para o array de
    contadores (C).
  - Ser capaz de ordenar arrays contendo números negativos.
  """

  # Escreva seu código abaixo:


def main():

    """ Simula a entrada e a saída de dados. """

    entrada = input().split()
    lista = [int(e) for e in entrada]
    counting_sort_extended(lista)
    print(lista)

main()

In [None]:
# @title {vertical-output: true}

# EXERCÍCIO 02

def bucket_sort_linear(array):

  """
  Bucket Sort divides the unsorted array elements into
  several groups called buckets. Each bucket is then sorted
  by using a LINEAR sorting algorithm. Finally,the sorted
  buckets are combined to form a final sorted array. Anyways,
  you must edit the code in order to work with the Counting
  Sort algorithm, so that the time complexity is O(n).
  """

  # If so, return the empty array
  if len(array) == 0:
    return array

  # Determine the number of buckets
  num_buckets = len(array)
  max_value = max(array)

  # Create empty buckets
  bucket = [[] for _ in range(num_buckets)]

  # Insert elements into their respective buckets
  for j in array:
    index_b = int(num_buckets * j / (max_value + 1))
    bucket[index_b].append(j)

  # Sort the elements of each bucket using Insertion Sort
  for i in range(num_buckets):
    bucket[i] = insertion_sort(bucket[i])

  # Get the sorted elements
  sorted_array = []
  for i in range(num_buckets):
    sorted_array.extend(bucket[i])

  return sorted_array

def insertion_sort(array):

  """ Insertion Sort algorithm. """

  for i in range(1, len(array)):
    key = array[i]
    aux = i - 1
    while (aux >= 0 and array[aux] > key):
      array[aux + 1] = array[aux]
      aux -= 1
    array[aux + 1] = key
  return array

def asserts():

  """ Test the Bucket Sort """

  # Test 1: Basic test case
  assert bucket_sort_linear([0.2, 0.7, 0.1]) == [0.1, 0.2, 0.7]
  print("Test 1 Passed: [0.1, 0.2, 0.7]")

  # Test 2: Empty list
  if bucket_sort_linear([]) == []:
    print("Test 2 Passed: []")
    assert True
  else:
    print("Test 2 Failed: Expected []")
    assert False

  # Test 3: Single element
  if bucket_sort_linear([0.5]) == [0.5]:
    print("Test 3 Passed: [0.5]")
    assert True
  else:
    print("Test 3 Failed: Expected [0.5]")
    assert False

  # Test 4: Already sorted
  if bucket_sort_linear([0.1, 0.2, 0.3, 0.4, 0.5]) == [0.1, 0.2, 0.3, 0.4, 0.5]:
    print("Test 4 Passed: [0.1, 0.2, 0.3, 0.4, 0.5]")
    assert True
  else:
    print("Test 4 Failed: Expected [0.1, 0.2, 0.3, 0.4, 0.5]")
    assert False

  # Test 5: Reverse sorted
  if bucket_sort_linear([0.5, 0.4, 0.3, 0.2, 0.1]) == [0.1, 0.2, 0.3, 0.4, 0.5]:
    print("Test 5 Passed: [0.1, 0.2, 0.3, 0.4, 0.5]")
    assert True
  else:
    print("Test 5 Failed: Expected [0.1, 0.2, 0.3, 0.4, 0.5]")
    assert False

  # Test 6: Random order
  if bucket_sort_linear([0.9, 0.2, 0.4, 0.1, 0.5, 0.8, 0.6, 0.3, 0.7]) == [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]:
    print("Test 6 Passed: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]")
    assert True
  else:
    print("Test 6 Failed: Expected [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]")
    assert False

  # Test 7: Duplicates
  if bucket_sort_linear([0.5, 0.3, 0.5, 0.3, 0.5]) == [0.3, 0.3, 0.5, 0.5, 0.5]:
    print("Test 7 Passed: [0.3, 0.3, 0.5, 0.5, 0.5]")
    assert True
  else:
    print("Test 7 Failed: Expected [0.3, 0.3, 0.5, 0.5, 0.5]")
    assert False

  # Test 8: Mixed small and large numbers
  if bucket_sort_linear([0.12, 0.34, 0.23, 0.45, 0.56, 0.78, 0.67, 0.89]) == [0.12, 0.23, 0.34, 0.45, 0.56, 0.67, 0.78, 0.89]:
    print("Test 8 Passed: [0.12, 0.23, 0.34, 0.45, 0.56, 0.67, 0.78, 0.89]")
    assert True
  else:
    print("Test 8 Failed: Expected [0.12, 0.23, 0.34, 0.45, 0.56, 0.67, 0.78, 0.89]")
    assert False

# Run the tests
asserts()

`Rafael de Arruda Sobral, 2024. Estruturas de Dados e Algoritmos (Monitoria), UFCG.`

`Prof. Dr. Adalberto Cajueiro de Farias, 2024. Estruturas de Dados e Algoritmos, UFCG.`