## Algoritmos de ordenação

In [1]:
import tracemalloc              # Biblioteca para medir o consumo de memória
import sys
sys.dont_write_bytecode = True  # Impede a criação do cache
from time import time
from data.nomes_desord import nomes

### Bubble sort

In [2]:
""" 
    ALGORITMO DE ORDENAÇÃO BUBBLE SORT
    Percorre a lista a ser ordenada em sucessivas passadas, trocando dois elementos adjacentes sempre que o segundo for MENOR que o primeiro.
    Efetua tantas passadas quanto necessárias, até que, na última passada, nenhuma troca seja efetuada
"""

def bubble_sort(lista):
    global comps, trocas, passadas
    comps = trocas = passadas = 0

    # Loop eterno, não sabemos quantas passadas serão necessárias
    while True:
        trocou = False
        passadas += 1
        
        # Percurso da lista, do primeiro ao PENÚLTIMO elemento, com acesso a cada posição
        for pos in range(len(lista) - 1):
            comps += 1
            
            # Se o número que está a frente na lista for MENOR do que o que está atrás, TROCA
            if lista[pos + 1 ] < lista[pos]:
                lista[pos + 1], lista[pos] = lista[pos], lista[pos + 1]
                trocou = True
                trocas += 1
        
        if not trocou:  # Não houve troca na passada
            break       # Interrompe o loop eterno; acabou

In [3]:
# Teste com um vetor de 10 números
nums = [6, 4, 2, 0, 9, 5 ,1, 8, 3, 7]
bubble_sort(nums)
print('Lista ordenada: ', nums)
print(f'Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Comparações: 54, trocas: 21, passadas: 6


Pior caso:
- n = itens da lista
- 90 -> n² - n
- 45 -> (n² - n) / 2
- 10 -> n
- Uma pequena alteração no número de elementos, eleva o número de comparações ao quadrado

In [4]:
pior_caso = [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
bubble_sort(pior_caso)
print('Lista ordenada: ', pior_caso)
print(f'Pior caso - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Pior caso - Comparações: 90, trocas: 45, passadas: 10


Melhor caso:
- n = itens da lista
- 0 -> n - 1
- 0 -> 0
- 1 -> 1

In [5]:
melhor_caso = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
bubble_sort(melhor_caso)
print('Lista ordenada: ', melhor_caso)
print(f'Melhor caso - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Melhor caso - Comparações: 9, trocas: 0, passadas: 1


In [6]:
# Pega apenas os 10k primeiros nomes
nomes_10k = nomes[:10000]

hora_ini = time()
bubble_sort(nomes_10k)
hora_fim = time()

# print("Nomes ordenados: ", nomes_10k)
print(f'Tempo gasto: {round((hora_fim - hora_ini) * 1000, 2)}ms')
print(f'Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Tempo gasto: 22568.87ms
Comparações: 98440155, trocas: 24695190, passadas: 9845


### Bubble sort (otimizado)

In [7]:
""" 
    ALGORITMO DE ORDENAÇÃO BUBBLE SORT
    Percorre a lista a ser ordenada em sucessivas passadas, trocando dois elementos adjacentes sempre que o segundo for MENOR que o primeiro.
    Efetua tantas passadas quanto necessárias, até que, na última passada, nenhuma troca seja efetuada
    VERSÃO OTIMIZADA COM ENCOLHIMENTO DO PERCURSO A CADA PASSADA
"""

def bubble_sort(lista):
    global comps, trocas, passadas
    comps = trocas = passadas = 0
    desloc = 1

    # Loop eterno, não sabemos quantas passadas serão necessárias
    while True:
        trocou = False
        passadas += 1
        
        # Percurso da lista, do primeiro ao PENÚLTIMO elemento, com acesso a cada posição
        for pos in range(len(lista) - desloc):
            comps += 1
            
            # Se o número que está a frente na lista for MENOR do que o que está atrás, TROCA
            if lista[pos + 1 ] < lista[pos]:
                lista[pos + 1], lista[pos] = lista[pos], lista[pos + 1]
                trocou = True
                trocas += 1
        
        if not trocou:  # Não houve troca na passada
            break       # Interrompe o loop eterno; acabou

        desloc += 1 # Aumenta o deslocamento para diminuir o tamanho da próxima passada

In [8]:
# Teste com um vetor de 10 números
nums = [6, 4, 2, 0, 9, 5 ,1, 8, 3, 7]
bubble_sort(nums)
print('Lista ordenada: ', nums)
print(f'Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Comparações: 39, trocas: 21, passadas: 6


In [9]:
pior_caso = [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
bubble_sort(pior_caso)
print('Lista ordenada: ', pior_caso)
print(f'Pior caso - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Pior caso - Comparações: 45, trocas: 45, passadas: 10


In [10]:
melhor_caso = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
bubble_sort(melhor_caso)
print('Lista ordenada: ', melhor_caso)
print(f'Melhor caso - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Melhor caso - Comparações: 9, trocas: 0, passadas: 1


In [11]:
# Pega apenas os 10k primeiros nomes
nomes_10k = nomes[:10000]

hora_ini = time()
bubble_sort(nomes_10k)
hora_fim = time()

# print("Nomes ordenados: ", nomes_10k)
print(f'Tempo gasto: {round((hora_fim - hora_ini) * 1000, 2)}ms')
print(f'Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Tempo gasto: 12773.34ms
Comparações: 49983065, trocas: 24695190, passadas: 9845


### Selection sort

In [12]:
""" 
    ALGORITMO DE ORDENAÇÃO SELECTION SORT

    Isola (seleciona) o primeiro elemento da lista e, em seguida, encontra o menor valor no restante da lista.
    Se o valor encontrado for menor que o valor previamente selecionado, efetua a troca entre eles.
    Continuando, seleciona o segundo elemento da lista, buscando pelo menor valor das posições subsequentes.
    Faz a troca entre os dois valores, se necessário.
    O processo se repete até que o penúltimo elemento da lista seja isolado, comparado com o último e feita a troca entre eles, se for o caso
"""

def selection_sort(lista):

    global comps, trocas, passadas
    comps = trocas = passadas = 0
    
    # Loop que vai da primeira até a PENÚLTIMA posição
    for pos_sel in range(len(lista) - 1):

        passadas += 1

        # Encontra o menor valor da sublista à frente de pos_sel
        pos_menor = pos_sel + 1
        for pos in range(pos_sel + 2, len(lista)):
            # Se o valor encontrado na posição pos for MENOR que o valor da posição pos_menor,
            # então pos_menor passa a ser pos
            comps += 1
            if lista[pos] < lista[pos_menor]: pos_menor = pos

        # Compara os elementos das posições pos_menor e pos_sel.
        # Se o valor do primeiro for MENOR que o valor do segundo, efetua a troca
        comps += 1
        if lista[pos_menor] < lista[pos_sel]:
            lista[pos_menor], lista[pos_sel] = lista[pos_sel], lista[pos_menor]
            trocas += 1

In [13]:
# Teste com um vetor de 10 números
nums = [6, 4, 2, 0, 9, 5 ,1, 8, 3, 7]
selection_sort(nums)
print('Lista ordenada: ', nums)
print(f'Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Comparações: 45, trocas: 7, passadas: 9


In [14]:
pior_caso = [9, 0, 1, 2, 3, 4, 5, 6, 7, 8]
selection_sort(pior_caso)
print('Lista ordenada: ', pior_caso)
print(f'Pior caso - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Pior caso - Comparações: 45, trocas: 9, passadas: 9


In [15]:
melhor_caso = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
selection_sort(melhor_caso)
print('Lista ordenada: ', melhor_caso)
print(f'Melhor caso - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Lista ordenada:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Melhor caso - Comparações: 45, trocas: 0, passadas: 9


In [16]:
# Pega apenas os 10k primeiros nomes
nomes_10k = nomes[:10000]

hora_ini = time()
selection_sort(nomes_10k)
hora_fim = time()

# print("Nomes ordenados: ", nomes_10k)
print(f'Tempo gasto: {round((hora_fim - hora_ini) * 1000, 2)}ms')
print(f'Nomes - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Tempo gasto: 6975.56ms
Nomes - Comparações: 49995000, trocas: 9988, passadas: 9999


### Recursividade

In [17]:
"""
    RECURSIVIDADE

    Trata-se de uma técnica de programação pela qual uma função chama a si mesma, em uma condição diferente da inicial.
    O principal objetivo do uso da recursividade é diminuir a complexidade de algoritmos.
"""

# Cálculo do fatorial, versão iterativa (não recursiva)
def fatorial_iter(num):
    # Não é possível calcular o fatorial de números negativos
    if num < 0:
        raise Exception("Erro: número negativo, cálculo impossível")
    
    res = 1

    # Loop descendente de num até 1
    for x in range(num, 0, -1): res *= x
    
    return res

In [18]:
print('7! = ', fatorial_iter(7))
print('0! = ', fatorial_iter(0))
# print('-6! = ', fatorial_iter(-6))  # Retorna o erro

7! =  5040
0! =  1


In [19]:
# Cálculo do fatorial, de forma recursiva
def fatorial_rec(num):
    # Não é possível calcular o fatorial de números negativos
    if num < 0:
        raise Exception("Erro: número negativo, cálculo impossível")
    
    if num <= 1: return 1   # O fatorial de 0 e 1 é 1
    else: return num * fatorial_rec(num - 1)    # Chamada recursiva à função

In [20]:
print('7! = ', fatorial_rec(7))
print('0! = ', fatorial_rec(0))
# print('-6! = ', fatorial_rec(-6))   # Retorna o erro

7! =  5040
0! =  1


### Merge Sort

In [21]:
""" 
    ALGORÍTMO DE ORDENAÇÃO MERGE SORT

    No processo de ordenação, esse algoritmo "desmonta" a lista original, contendo N elementos, até obter N listas com apenas um elemento cada uma.
    Em seguida, usando a técnica de mesclagem (merge), "remonta" a lista, desta vez com os elementos já em ordem.
"""

# Variáveis de estatísticas
divs = juncs = comps = 0

def merge_sort(lista):

    global divs, juncs, comps

    # Para que possa haver divisão da lista, esta deve ter mais de um elemento
    if len(lista) > 1:
        
        # Encontra a posição do meio da lista, para fazer a divisão em duas metades
        meio = len(lista) // 2

        # Tira uma cópia de cada metade da lista
        sublista_esq = lista[:meio]
        sublista_dir = lista[meio:]
        divs += 1   # Número de divisões

        # Chamamos recursivamente a função para que ela continue repartindo cada uma das sublistas em duas partes menores
        sublista_esq = merge_sort(sublista_esq)
        sublista_dir = merge_sort(sublista_dir)

        # AQUI COMEÇA A MESCLAGEM ORDENADA DAS DUAS SUBLISTAS
        pos_esq = pos_dir = 0
        ordenada = []   # Lista vazia

        # Compara os elementos das sublistas entre si e insere na lista ordenada o menor entre dois elementos
        while pos_esq < len(sublista_esq) and pos_dir < len(sublista_dir):
            # O menor elemento está na sublista da esquerda
            comps += 1  # Número de comparações
            if sublista_esq[pos_esq] < sublista_dir[pos_dir]:
                # 'Desce' o elemento da esquerda para a lista ordenada
                ordenada.append(sublista_esq[pos_esq])
                pos_esq += 1    # Incrementa pos_esq
            # O menor elemento está na sublista da direita
            else:
                # 'Desce' o elemento da direita para a sublista ordenada
                ordenada.append(sublista_dir[pos_dir])
                pos_dir += 1    # Incrementa pos_dir
        
        # Verificação da sobra
        sobra = []      # Lista vazia

        # Sobra à esquerda
        if(pos_esq < pos_dir): sobra = sublista_esq[pos_esq:]
        # Sobra à direita
        else: sobra = sublista_dir[pos_dir:]

        juncs += 1  # Número de junções

        # O resultado final é a junção (concatenação) da lista ordenada com a sobra
        return ordenada + sobra
    
    else: return lista

In [22]:
# Teste com vetor de 10 números
nums = [6, 4, 2, 0, 9, 5, 1, 8, 3, 7]
divs = juncs = comps = 0    # Reseta as variáveis de estatísticas
resultado = merge_sort(nums)
print("Lista original:", nums)
print("Lista ordenada:", resultado)
print(f"Divisões: {divs}, junções: {juncs}, comparações: {comps}")

Lista original: [6, 4, 2, 0, 9, 5, 1, 8, 3, 7]
Lista ordenada: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Divisões: 9, junções: 9, comparações: 24


In [23]:
nums = [9, 0, 8, 1, 7, 2, 6, 3, 5, 4]
divs = juncs = comps = 0    # Reseta as variáveis de estatísticas
resultado = merge_sort(nums)
print("Lista original:", nums)
print("Lista ordenada:", resultado)
print(f"Divisões: {divs}, junções: {juncs}, comparações: {comps}")

Lista original: [9, 0, 8, 1, 7, 2, 6, 3, 5, 4]
Lista ordenada: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Divisões: 9, junções: 9, comparações: 22


In [24]:
nomes_merge = nomes

divs = juncs = comps = 0
tracemalloc.start() # Inicia a medição de memória
hora_ini = time()
resultado = merge_sort(nomes_merge)
hora_fim = time()

# Captura as informações de gasto de memória
mem_atual, mem_pico = tracemalloc.get_traced_memory()
tracemalloc.stop()

# print("Nomes ordenados: ", resultado)
print(f'Tempo gasto: {round((hora_fim - hora_ini) * 1000, 2)}ms')
print(f'Pico de memória: {round(mem_pico / 1024 / 1024, 3)} MB')
print(f"Nomes (100k) - Divisões: {divs}, junções: {juncs}, comparações: {comps}")

Tempo gasto: 7076.71ms
Pico de memória: 2.401 MB
Nomes (100k) - Divisões: 100786, junções: 100786, comparações: 1549342


### Comparações

In [25]:
nomes_10k = nomes[:10000]

tracemalloc.start()
hora_ini = time()
bubble_sort(nomes_10k)
hora_fim = time()
mem_atual, mem_pico = tracemalloc.get_traced_memory()
tracemalloc.stop()

print('Bubble Sort:')
print(f'Tempo gasto: {round((hora_fim - hora_ini) * 1000, 2)}ms')
print(f'Pico de memória: {round(mem_pico / 1024 / 1024, 3)} MB')
print(f'Nomes (10k) - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Bubble Sort:
Tempo gasto: 213794.77ms
Pico de memória: 0.014 MB
Nomes (10k) - Comparações: 49983065, trocas: 24695190, passadas: 9845


In [26]:
nomes_10k = nomes[:10000]

tracemalloc.start()
hora_ini = time()
selection_sort(nomes_10k)
hora_fim = time()
mem_atual, mem_pico = tracemalloc.get_traced_memory()
tracemalloc.stop()

print('Selection Sort:')
print(f'Tempo gasto: {round((hora_fim - hora_ini) * 1000, 2)}ms')
print(f'Pico de memória: {round(mem_pico / 1024 / 1024, 3)} MB')
print(f'Nomes (10k) - Comparações: {comps}, trocas: {trocas}, passadas: {passadas}')

Selection Sort:
Tempo gasto: 101982.48ms
Pico de memória: 0.014 MB
Nomes (10k) - Comparações: 49995000, trocas: 9988, passadas: 9999


In [27]:
nomes_10k = nomes[:10000]

divs = juncs = comps = 0
tracemalloc.start()
hora_ini = time()
resultado = merge_sort(nomes_10k)
hora_fim = time()
mem_atual, mem_pico = tracemalloc.get_traced_memory()
tracemalloc.stop()

print('Merge Sort:')
print(f'Tempo gasto: {round((hora_fim - hora_ini) * 1000, 2)}ms')
print(f'Pico de memória: {round(mem_pico / 1024 / 1024, 3)} MB')
print(f'Nomes (10k) - Divisões: {divs}, junções: {juncs}, comparações: {comps}')

Merge Sort:
Tempo gasto: 674.72ms
Pico de memória: 0.238 MB
Nomes (10k) - Divisões: 9999, junções: 9999, comparações: 120484
