# Algoritmos de ordenação de dados


Ser capaz de ordenar os elementos de um conjunto de dados é uma das tarefas básicas mais
requisitadas por aplicações computacionais. Como exemplo, podemos citar a busca binária, um
algoritmo de busca muito mais eficiente que a simples busca sequencial. 

Buscar elementos em conjuntos ordenados é bem mais rápido do que em conjuntos desordenados. Existem diversos algoritmos de ordenação, sendo alguns mais eficientes do que outros. Neste curso, iremos apresentar alguns deles: Bubblesort, Selectionsort, Insertionsort, Quicksort e Mergesort.

### Bubblesort

O algoritmo Bubblesort é uma das abordagens mais simplistas para a ordenação de dados. A ideia
básica consiste em percorrer o vetor diversas vezes, em cada passagem fazendo flutuar para o topo
da lista (posição mais a direita possível) o maior elemento da sequência. Esse padrão de
movimentação lembra a forma como as bolhas em um tanque procuram seu próprio nível, e disso
vem o nome do algoritmo (também conhecido como o método bolha).

Embora no melhor caso esse algoritmo necessite de apenas n operações relevantes, onde n
representa o número de elementos no vetor, no pior caso são feitas n2
 operações. 
 
Portanto, diz-se
que a complexidade do método é de ordem quadrática. Por essa razão, ele não é recomendado para
programas que precisem de velocidade e operem com quantidade elevada de dados. A seguir
veremos uma implementação em Python desse algoritmo.

In [2]:
import numpy as np
import time
# Implementação em Python do algoritmo de ordenação Bubblesort
def BubbleSort(L):
    # Percorre cada elemento da lista L
    for i in range(len(L)-1, 0, -1):
    # Flutua o maior elemento para a posição mais a direita
        for j in range(i):
            if L[j] > L[j+1]:
                L[j], L[j+1] = L[j+1], L[j]
        # Início do script

n = 5000
X = list(np.random.random(n))
# Imprime vetor
print('Vetor não ordenado: ')
print(X)
print()
# Aplica Bubblesort
inicio = time.time()
BubbleSort(X)
fim = time.time()
# Imprime vetor ordenado
print('Vetor ordenado: ')
print(X)
print()
print('Tempo de processamento: %.3f s' %(fim - inicio))

Vetor não ordenado: 
[0.5337526503706586, 0.2963127812654569, 0.09533837577099669, 0.47639452729520515, 0.7673110615218818, 0.30465368005291904, 0.18063219179394563, 0.2701533519031156, 0.6258626292710251, 0.7486132515795464, 0.5800321119845055, 0.275241466495594, 0.9409034182598841, 0.3431261782850621, 0.3302623972692835, 0.40075257684416654, 0.2922401387024751, 0.628852539950377, 0.3114480723922226, 0.20732424776294078, 0.6334118166646271, 0.9494235426162552, 0.34260876174553434, 0.3065950758123165, 0.43724616354706813, 0.4230633658049905, 0.49711900015255495, 0.6997054115264361, 0.7961501420517637, 0.10190792135050053, 0.00409245901714006, 0.24487865296201583, 0.05115229930506837, 0.1817296945911634, 0.7763638699553836, 0.78865630965606, 0.6193754764323438, 0.2994750015501155, 0.3950080221590526, 0.6669386671882399, 0.09554766859019759, 0.3512920235286866, 0.8950074737792021, 0.9545342831040923, 0.9168826233305769, 0.4879456607654804, 0.3306976696741891, 0.22004070190052005, 0.68014

---

### Selection sort

A ordenação por seleção é um método baseado em se passar o menor valor do vetor para a primeira posição mais a esquerda disponível, depois o de segundo menor valor para a segunda posição e assim sucessivamente, com os n – 1 elementos restantes. 

Esse algoritmo compara a cada iteração um elemento com os demais, visando encontrar o menor. A complexidade desse algoritmo será sempre de ordem quadrática, isto é o número de operações realizadas depende do quadrado do tamanho do vetor de entrada. 

Algumas vantagens desse método são: é um algoritmo simples de ser implementado, não usa um vetor auxiliar e portanto ocupa pouca memória, é um dos mais velozes para vetores pequenos. Como desvantagens podemos citar o fato de que ele não é muito eficiente para grandes vetores.

In [4]:
import numpy as np
import time
# Implementação em Python do algoritmo de ordenação Selectionsort
def SelectionSort(L):
    # Percorre todos os elementos de L
    for i in range(len(L)):
        menor = i
        # Encontra o menor elemento
        for k in range(i+1, len(L)):
            if L[k] < L[menor]:
                menor = k
        # Troca a posição do elemento i com o menor
        L[menor], L[i] = L[i], L[menor]
        
# Início do script
n = 5000
X = list(np.random.random(n))

# Imprime vetor
print('Vetor não ordenado: ')
print(X)
print()

# Aplica Bubblesort
inicio = time.time()
SelectionSort(X)
fim = time.time()

# Imprime vetor ordenado
print('Vetor ordenado: ')
print(X)
print()
print('Tempo de processamento: %.3f s' %(fim - inicio))

Vetor não ordenado: 
[0.14953859668604663, 0.8108065671030348, 0.2546259328170316, 0.376890941804493, 0.7836445550861239, 0.7440930805582734, 0.3645128094903899, 0.9854911145719897, 0.2551810981145657, 0.8068914293147603, 0.6355172794373293, 0.5245292047882449, 0.03813493435347792, 0.7816523316161123, 0.7214035767610802, 0.8853371691287181, 0.4701723118735065, 0.1573719314731986, 0.2836769783888349, 0.03000288718281119, 0.4999657222643551, 0.683626255516377, 0.9433477659920969, 0.6586155373370806, 0.6097644617553928, 0.3854732813990869, 0.49782787886960445, 0.3281718699599695, 0.35160507231926497, 0.8189423952800937, 0.26164267572613564, 0.15218081465027122, 0.36618373904404267, 0.4313503811808571, 0.17866300247219513, 0.7198639215205284, 0.9841490582889186, 0.6833153565919414, 0.4428425610706743, 0.20647429197419565, 0.43319822938771513, 0.5288237240341381, 0.6191958881499254, 0.7682125938771875, 0.6968575673850844, 0.41847328187491284, 0.0664023101867175, 0.1550560625507632, 0.368844

---

### Insertion sort

Insertion sort, ou ordenação por inserção, é o algoritmo de ordenação que, dado um vetor inicial
constrói um vetor final com um elemento de cada vez, uma inserção por vez. Assim como
algoritmos de ordenação quadráticos, é bastante eficiente para problemas com pequenas entradas,
sendo o mais eficiente entre os algoritmos desta ordem de classificação.

Podemos fazer uma comparação do Insertion sort com o modo de como algumas pessoas organizam
um baralho num jogo de cartas. Imagine que você está jogando cartas. Você está com as cartas na
mão e elas estão ordenadas. Você recebe uma nova carta e deve colocá-la na posição correta da sua
mão de cartas, de forma que as cartas obedeçam a ordenação.

A cada nova carta adicionada a sua mão de cartas, a nova carta pode ser menor que algumas das
cartas que você já tem na mão ou maior, e assim, você começa a comparar a nova carta com todas
as cartas na sua mão até encontrar sua posição correta. Você insere a nova carta na posição correta,
e, novamente, sua mão é composta de cartas totalmente ordenadas. Então, você recebe outra carta e
repete o mesmo procedimento. Então outra carta, e outra, e assim por diante, até você não receber
mais cartas. Esta é a ideia por trás da ordenação por inserção. Percorra as posições do vetor,
começando com o índice zero. Cada nova posição é como a nova carta que você recebeu, e você
precisa inseri-la no lugar correto no sub-vetor ordenado à esquerda daquela posição.

In [5]:
import numpy as np
import time
# Implementação em Python do algoritmo de ordenação Insertionsort
def InsertionSort(L):
    # Percorre cada elemento de L
    for i in range(1, len(L)):
        k = i
        # Insere o pivô na posição correta
        while k > 0 and L[k] < L[k-1]:
            L[k], L[k-1] = L[k-1], L[k]
            k = k - 1

# Início do script
n = 5000
X = list(np.random.random(n))

# Imprime vetor
print('Vetor não ordenado: ')
print(X)
print()

# Aplica Bubblesort
inicio = time.time()
InsertionSort(X)
fim = time.time()

# Imprime vetor ordenado
print('Vetor ordenado: ')
print(X)
print()
print('Tempo de processamento: %.3f s' %(fim - inicio))


Vetor não ordenado: 
[0.10069349530608573, 0.9875822591183767, 0.8064774691197218, 0.6855281248494618, 0.9060770546853596, 0.052856629486221496, 0.42537869148408436, 0.8374750316854647, 0.09793248421828382, 0.11321680229220854, 0.17812287787064296, 0.15374720468806902, 0.022843885772218853, 0.9674761035302936, 0.290404699565314, 0.07192302313672394, 0.15870553401862764, 0.7322027663219433, 0.3528377559975795, 0.3823160868912543, 0.28847352660169256, 0.15037749937499845, 0.6659879158418318, 0.24239629116637018, 0.5124783287959015, 0.09483068234149483, 0.06853167111629188, 0.6889211010534264, 0.4807790170826386, 0.7714993696499918, 0.262439991155618, 0.3124493277359258, 0.4768835289023817, 0.48470452120204355, 0.1902918594376103, 0.946556870966603, 0.1786462714023721, 0.2055529289516813, 0.3178227016825863, 0.3583828422643449, 0.2374097241401818, 0.24371287801327313, 0.9607184786764349, 0.32097439161230334, 0.2142774372215671, 0.22070127588265365, 0.09581936632547561, 0.4553093968258044,

### Merge Sort

#### Iterativo

In [1]:
def merge(lst, start, mid, end):
    left = lst[start:mid]
    right = lst[mid:end]
    i = j = 0
    k = start
    
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            lst[k] = left[i]
            i += 1
        else:
            lst[k] = right[j]
            j += 1
        k += 1

    while i < len(left):
        lst[k] = left[i]
        i += 1
        k += 1

    while j < len(right):
        lst[k] = right[j]
        j += 1
        k += 1

def iterative_merge_sort(lst):
    n = len(lst)
    width = 1
    while width < n:
        for i in range(0, n, width * 2):
            left = i
            mid = min(i + width, n)
            right = min(i + width * 2, n)
            merge(lst, left, mid, right)
        width *= 2
    return lst


In [5]:
lst = [10, 88, 20, 30, 44, 22, 15, 4, 23, 75, 35, 12, 27, 68, 98, 16, 1, 4, 6, 3, 25, 32, 14, 18, 17, 11, 63, 35, 24, 19, 85, 75]

In [6]:
result = iterative_merge_sort(lst)

print(result)

[1, 3, 4, 4, 6, 10, 11, 12, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25, 27, 30, 32, 35, 35, 44, 63, 68, 75, 75, 85, 88, 98]
