# Análise de Algoritmos de Ordenação

Giovani Candido - RA: 191021601 <br>
Luis Henrique Morelli - RA: 181027097

---

<br>

## Importação de módulos

Vamos importar alguns módulos necessários. 

In [None]:
import random
import heapq

<br>

## Funções Utilitárias

Precisaremos de uma função para gerar arrays para nossos experimentos.

A função generate_array é a responsável por criar um array com valores de 0 a upper_bound-1. Ademais, a flag sorted_arr indica se o array deve ser ordenado ou ter uma distribuição aleatória de valores.

In [None]:
def generate_array(sorted_arr, upper_bound):
    arr = list(range(0, upper_bound))
    
    if not sorted_arr:
        random.shuffle(arr)
        
    return arr

Também vamos precisar de uma função para transformar os nossos arrays em strings.

In [None]:
def truncate_array_str(size, arr):
    if size <= 10:
        return str(arr)
    
    first_slice = [str(x) for x in arr[0:5]]
    last_slice = [str(x) for x in arr[-5:]]
    
    new_arr = first_slice + ['...'] + last_slice
    
    new_arr_str = '['
    
    for c in new_arr[:-1]:
        new_arr_str += c + ', '

    new_arr_str += new_arr[-1] + ']'
    
    return new_arr_str

<br>

## Implementação dos Algoritmos

Aqui, implementamos todos os algoritmos de ordenação que iremos utilizar nos experimentos.

### Bubble sort

In [None]:
def bubble_sort(size, arr): 
    swapped = True
    i = 0

    while i < size-1 and swapped:
        swapped = False
        j = 0
    
        while j < size-1-i:
            if arr[j] > arr[j+1]:
                aux = arr[j]
                arr[j] = arr[j+1]
                arr[j+1] = aux
                
                swapped = True
            
            j += 1
        
        i += 1

<br> 

### Insertion sort

In [None]:
def insertion_sort(size, arr):
    for i in range(1, size):
        aux = arr[i]
        j = i - 1

        while j >= 0 and aux < arr[j]:
            arr[j + 1] = arr[j]

            j -= 1
            
        arr[j + 1] = aux

<br>

### Merge sort

In [None]:
def merge_sort(begin, end, arr):
    if begin == end:
        return
    
    middle = int((begin+end)/2)
    
    merge_sort(begin, middle, arr)
    merge_sort(middle+1, end, arr)
    
    aux = []
    
    i = begin
    j = middle+1
            
    while i < middle+1 or j < end+1:
        if i == middle+1:
            aux.append(arr[j])
            j += 1
        elif j == end+1:
            aux.append(arr[i])
            i += 1
        elif arr[i] < arr[j]:
            aux.append(arr[i])
            i += 1
        else:
            aux.append(arr[j])
            j += 1
    
    for i in range(begin, end+1):
        arr[i] = aux[i-begin]

<br>

### Quick sort

In [None]:
def quick_sort(begin, end, arr):
    pivot = arr[int((begin+end)/2)]
    
    i = begin
    j = end
    
    while i < j:
        while arr[i] < pivot:
            i += 1
        
        while arr[j] > pivot:
            j -= 1
        
        if i <= j:
            aux = arr[i]
            arr[i] = arr[j]
            arr[j] = aux

            i += 1
            j -= 1

    if j > begin:
        quick_sort(begin, j, arr)
    
    if i < end:
        quick_sort(i, end, arr)

<br>

### Heap sort

In [None]:
def heap_sort(size, arr):
    aux = list(arr)
    heapq.heapify(aux)

    for i in range(0, size):
        arr[i] = heapq.heappop(aux)

<br>

## Experimentos

Nosso protocolo de experimentação consiste em rodar determinado algoritmo de ordenação para cada array gerado, tencionando obter o tempo de execução. Para cada algoritmo de ordenação, consideramos duas situações: arrays ordenados e arrays com valores distruibuídos aleatoriamente. Outrossim, para observarmos melhor como o tamanho da entrada afeta o desempenho dos algoritmos, decidimos considerar múltiplos tamanhos de array para cada situação. Sendo assim, adotamos arrays com 10, 100, 1.000 e 10.000 valores inteiros. 

Para obtermos o tempo de execução de cada experimento, utilizaremos o comando %timeit.

### Tamanho = 10

#### **Arrays ordenados:**

**Bubble sort**

In [None]:
size = 10

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o bubble_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Insertion sort**

In [None]:
size = 10

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o insertion_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Merge sort**

In [None]:
size = 10

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o merge_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Quick sort**

In [None]:
size = 10

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o quick_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Heap sort**

In [None]:
size = 10

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o heap_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

<br>

#### **Arrays não ordenados**

**Bubble sort**

In [None]:
size = 10

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o bubble_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Insertion sort**

In [None]:
size = 10

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o insertion_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Merge sort**

In [None]:
size = 10

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o merge_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Quick sort**

In [None]:
size = 10

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o quick_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Heap sort**

In [None]:
size = 10

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o heap_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

<br>

### Tamanho = 100

#### **Arrays ordenados**

**Bubble sort**

In [None]:
size = 100

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o bubble_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Insertion sort**

In [None]:
size = 100

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o insertion_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Merge sort**

In [None]:
size = 100

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o merge_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Quick sort**

In [None]:
size = 100

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o quick_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Heap sort**

In [None]:
size = 100

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o heap_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

<br>

#### **Arrays não ordenados**

**Bubble sort**

In [None]:
size = 100

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o bubble_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Insertion sort**

In [None]:
size = 100

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o insertion_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Merge sort**

In [None]:
size = 100

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o merge_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Quick sort**

In [None]:
size = 100

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o quick_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Heap sort**

In [None]:
size = 100

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o heap_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

<br>

### Tamanho = 1.000

#### **Arrays ordenados**

**Bubble sort**

In [None]:
size = 1000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o bubble_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Insertion sort**

In [None]:
size = 1000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o insertion_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Merge sort**

In [None]:
size = 1000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o merge_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Quick sort**

In [None]:
size = 1000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o quick_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Heap sort**

In [None]:
size = 1000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o heap_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

<br>

#### **Arrays não ordenados**

**Bubble sort**

In [None]:
size = 1000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o bubble_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Insertion sort**

In [None]:
size = 1000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o insertion_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Merge sort**

In [None]:
size = 1000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o merge_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Quick sort**

In [None]:
size = 1000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o quick_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Heap sort**

In [None]:
size = 1000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o heap_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

<br>

### Tamanho = 10.000

#### **Arrays ordenados**

**Bubble sort**

In [None]:
size = 10000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o bubble_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Insertion sort**

In [None]:
size = 10000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o insertion_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Merge sort**

In [None]:
size = 10000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o merge_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Quick sort**

In [None]:
size = 10000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o quick_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Heap sort**

In [None]:
size = 10000

arr = generate_array(True, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o heap_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

<br>

#### **Arrays não ordenados**

**Bubble sort**

In [None]:
size = 10000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o bubble_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Insertion sort**

In [None]:
size = 10000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o insertion_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Merge sort**

In [None]:
size = 10000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o merge_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Quick sort**

In [None]:
size = 10000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o quick_sort(0, size-1, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

---
<br>

**Heap sort**

In [None]:
size = 10000

arr = generate_array(False, upper_bound = size)

print('Array original: ' + truncate_array_str(size, arr))

exec_time = %timeit -n1 -r1 -q -o heap_sort(size, arr)

print('Array após a ordenação: ' + truncate_array_str(size, arr))

print('\nTempo de execução: ' + str(exec_time))

<br>

## Resultados

Em relação ao Bubble e ao Insertion Sort, algoritmos de ordenação iterativos, podemos inferir que o desempenho é bom quando se trata de arrays já ordenados ou até mesmo de não ordenados com até 100 valores. Esses algoritmos apresentam os melhores tempos de execução nas situações descritas. No entanto, para arrays não ordenados de tamanhos superiores a 100, os algoritmos começam a perder o lugar para algoritmos mais robustos.

Os algoritmos Merge Sort e Quick Sort, que apresentam uma abordagem recursiva, também possuem suas peculiaridades. O Merge apresentou bons resultados para arrays ordenados e de tamanhos menores ou iguais a 100, e para arrays não ordenados com tamanhos maiores que 100. Por outro lado, o Quick Sort não apresentou resultados satisfatórios para arrays já ordenados e de tamanhos pequenos, mas destacou-se com o aumento do tamanho em arrays não ordenados.

O destaque entre os algoritmos de ordenação é o Heap Sort. Este algoritmo conseguiu resultados satisfatórios para arrays ordenados e não ordenados, e de todos os tamanhos utilizados nos experimentos. Mesmo que não tenha resultado no melhor tempo de execução em todas as configurações, o algoritmo é sem dúvidas o mais versátil.