Projeto 1 - Individual ou em dupla

Faça um programa (em qualquer linguagem de programação) para:

a) entradas de vetores de tamanhos 1.000, 10.000 e 100.000

- aleatórias

- ordenadas em forma crescente

- ordenadas em forma decrescente

b) utilize os métodos: bolha, seleção, inserção, mergesort e quicksort para ordená-los.

c) marque os tempos comparativamente entre todos os métodos em todos os vetores

Entregas: 

Gere um relatório com:

1) método: esclareça, por exemplo, tipo de equipamento utilizado, massa de dados, algoritmos utilizados, linguagem de programação, etc.

2) gráficos com as comparações de tempos medidos entre todos os métodos.

3) análise crítica sobre a eficiência dos algoritmos.

4) análise crítica sobre a análise assintótica X os tempos obtidos.

Apresentação em aula com até 10 minutos explicando o projeto.

#### Importa as Bibliotecas
- "numpy" para apoio na geração de vetores aleatórios
- "pandas" para a manipulação de dados
- "datetime" para gravar os tempos de execução
- "sys" para alterar o parâmetro de recursividade
- "inspect" para verificar o tamanho da pilha, caso seja necessário

In [1]:
import numpy as np 
import pandas as pd
from datetime import datetime
import sys
import inspect

In [2]:
# Para resolver o problema da recursão do Python
sys.setrecursionlimit(3000)


In [3]:
# Cria Arquivo de Log do Zero
with open('log_execucoes.txt', 'w', encoding='utf-8') as f:
    f.write('metodo_ordenacao;tipo_array;tamanho_array;dt_inicio;dt_fim;segundos_totais')    

#### Algoritmos de Ordenação #### 

Os algoritmos não foram criados do zero, nós buscamos algumas opções na internet e identificamos um arquivo com os algorimos prontos. 

Fizemos apenas algumas alterações (principalmente no Quicksort)

Fonte: https://colab.research.google.com/drive/1rgdEwvn3wfD5-wUVE_9MuZvEdy7kjdNv?usp=sharing

In [4]:
# Função "Bubble Sort"
def bubble_sort(lista):
    # Percorre cada elemento da lista
    for i in range(len(lista)-1, 0, -1):
        # Flutua o maior elemento para a posição mais a direita
        for j in range(i):
            if lista[j] > lista[j+1]:
                lista[j], lista[j+1] = lista[j+1], lista[j]

In [5]:
# Função "Selection Sort"
def selection_sort(lista):
    # Percorre todos os elementos de L
    for i in range(len(lista)):
        menor = i
        # Encontra o menor elemento
        for k in range(i+1, len(lista)):
            if lista[k] < lista[menor]:
                menor = k 
        # Troca a posição do elemento i com o menor
        lista[menor], lista[i] = lista[i], lista[menor]

In [6]:
# Função "Insertion Sort"
def insertion_sort(lista):
    # Percorre cada elemento da lista
    for i in range(1, len(lista)):
        k = i
        # Insere o pivô na posição correta
        while k > 0 and lista[k] < lista[k-1]:
            lista[k], lista[k-1] = lista[k-1], lista[k]
            k = k - 1

In [7]:
# Função "Merge Sort"
def merge_sort(lista):

    if len(lista) > 1:
        
        meio = len(lista)//2
        LE = lista[:meio]   # Lista Esquerda
        LD = lista[meio:]   # Lista Direita
        
        # Aplica recursivamente nas sublistas
        merge_sort(LE)   
        merge_sort(LD)
        
        # Quando volta da recursão inicia aqui!
        i, j, k = 0, 0, 0
        
        # Faz a intercalação das duas listas (merge)
        while i < len(LE) and j < len(LD):
            if LE[i] < LD[j]:
                lista[k] = LE[i]
                i += 1
            else:
                lista[k] = LD[j]
                j += 1
            k += 1

        while i < len(LE):
            lista[k] = LE[i]
            i += 1
            k += 1

        while j < len(LD):
            lista[k] = LD[j]
            j += 1
            k += 1

In [8]:
# Função "Quick Sort"
def quick_sort(lista):
    if len(lista) <= 1:
        return lista
    # Consideramos o Pivô como elemento do meio da lista. 
    m = lista[len(lista)//2]
    # Chamada recursiva 
    return  quick_sort([x for x in lista if x < m]) + [x for x in lista if x == m] + quick_sort([x for x in lista if x > m])

#### Função que executa ordenação
Esta função executa a ordenação de acordo com o algoritmo passado por parâmetro e grava o tempo de execução nos logs 

In [9]:
# Função que executa a ordenação e grava o log de execuções (para futura comparação)
def exec_ordenacao(metodo,arr,tipo):

    log = None

    if metodo == "bubble":
        start_time = datetime.now()
        bubble_sort(arr)
        end_time = datetime.now()
        seconds = (end_time-start_time).total_seconds()

        log = metodo + ";" + tipo +  ";" + str(len(arr)) + ";" + start_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + end_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + str(seconds)

    elif metodo == "selection":
        start_time = datetime.now()
        selection_sort(arr)
        end_time = datetime.now()
        seconds = (end_time-start_time).total_seconds()

        log = metodo + ";" + tipo +  ";" + str(len(arr)) + ";" + start_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + end_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + str(seconds)
    
    elif metodo == "insertion":
        start_time = datetime.now()
        insertion_sort(arr)
        end_time = datetime.now()
        seconds = (end_time-start_time).total_seconds()

        log = metodo + ";" + tipo +  ";" + str(len(arr)) + ";" + start_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + end_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + str(seconds)
    
    elif metodo == "merge":
        start_time = datetime.now()
        merge_sort(arr)
        end_time = datetime.now()
        seconds = (end_time-start_time).total_seconds()

        log = metodo + ";" + tipo +  ";" + str(len(arr)) + ";" + start_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + end_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + str(seconds)

    elif metodo == "quick":
        start_time = datetime.now()
        quick_sort(arr)
        end_time = datetime.now()
        seconds = (end_time-start_time).total_seconds()

        log = metodo + ";" + tipo +  ";" + str(len(arr)) + ";" + start_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + end_time.strftime("%Y-%m-%d %H:%M:%S") + ";" + str(seconds)

    else: 
        print("Métdodo de Ordenação não encontrado")

    if(log):
        with open('log_execucoes.txt', 'a', encoding='utf-8') as f:
            f.write('\n')
            f.write(log)
        print(log)

#### Criação de Vetores 
Conforme solicitado no projeto, criamos 9 vetores: três aleatórios, três crescentes e três decrescentes (de mil, dez mil e cem mil elementos na lista)

In [10]:
# Criação dos vetores

# Vetores Aleatórios
a_1K = np.random.randint(1,5000,1000).tolist()
a_10K = np.random.randint(1,50000,10000).tolist()
a_100K = np.random.randint(1,500000,100000).tolist()

# Vetores Crescentes
c_1K =[]
c_10K =[]
c_100K =[]
for i in range(1,1001): c_1K.append(i)
for i in range(1,10001): c_10K.append(i)
for i in range(1,100001): c_100K.append(i)

# Vetores Decrescentes
d_1K = []
d_10K = []
d_100K = []
for i in range(1000,0,-1): d_1K.append(i)
for i in range(10000,0,-1): d_10K.append(i)
for i in range(100000,0,-1): d_100K.append(i)


#### Coleta de Dados das Execuções

Em cada etapa coletamos os dados de cada algoritmo para os 9 vetores. 

Importante: Para cada vetor, criamos uma cópia para garantir que a execução posterior não vai pegar um vetor já trabalhado. 


In [11]:
# Teste Quick Sort

# Vetores 1K
qs_a_1K = a_1K.copy()
exec_ordenacao("quick",qs_a_1K,"Aleatório")

qs_c_1K = c_1K.copy()
exec_ordenacao("quick",qs_c_1K,"Crescente")

qs_d_1K = d_1K.copy()
exec_ordenacao("quick",qs_d_1K,"Decrescente")


# Vetores 10K
qs_a_10K = a_10K.copy()
exec_ordenacao("quick",qs_a_10K,"Aleatório")

qs_c_10K = c_10K.copy()
exec_ordenacao("quick",qs_c_10K,"Crescente")

qs_d_10K = d_10K.copy()
exec_ordenacao("quick",qs_d_10K,"Decrescente")

# Vetores 100K
qs_a_100K = a_100K.copy()
exec_ordenacao("quick",qs_a_100K,"Aleatório")

qs_c_100K = c_100K.copy()
exec_ordenacao("quick",qs_c_100K,"Crescente")

qs_d_100K = d_100K.copy()
exec_ordenacao("quick",qs_d_100K,"Decrescente")

quick;Aleatório;1000;2022-09-07 20:15:45;2022-09-07 20:15:45;0.002997
quick;Crescente;1000;2022-09-07 20:15:45;2022-09-07 20:15:45;0.00101
quick;Decrescente;1000;2022-09-07 20:15:45;2022-09-07 20:15:45;0.001491
quick;Aleatório;10000;2022-09-07 20:15:45;2022-09-07 20:15:45;0.032145
quick;Crescente;10000;2022-09-07 20:15:45;2022-09-07 20:15:45;0.022443
quick;Decrescente;10000;2022-09-07 20:15:45;2022-09-07 20:15:45;0.022473
quick;Aleatório;100000;2022-09-07 20:15:45;2022-09-07 20:15:45;0.375561
quick;Crescente;100000;2022-09-07 20:15:45;2022-09-07 20:15:46;0.296617
quick;Decrescente;100000;2022-09-07 20:15:46;2022-09-07 20:15:46;0.284804


In [12]:
# Teste Bubble Sort 

# Vetores 1K
bs_a_1K = a_1K.copy()
exec_ordenacao("bubble",bs_a_1K,"Aleatório")

bs_c_1K = c_1K.copy()
exec_ordenacao("bubble",bs_c_1K,"Crescente")

bs_d_1K = d_1K.copy()
exec_ordenacao("bubble",bs_d_1K,"Decrescente")


# Vetores 10K
bs_a_10K = a_10K.copy()
exec_ordenacao("bubble",bs_a_10K,"Aleatório")

bs_c_10K = c_10K.copy()
exec_ordenacao("bubble",bs_c_10K,"Crescente")

bs_d_10K = d_10K.copy()
exec_ordenacao("bubble",bs_d_10K,"Decrescente")


# Vetores 100K
bs_a_100K = a_100K.copy()
exec_ordenacao("bubble",bs_a_100K,"Aleatório")

bs_c_100K = c_100K.copy()
exec_ordenacao("bubble",bs_c_100K,"Crescente")

bs_d_100K = d_100K.copy()
exec_ordenacao("bubble",bs_d_100K,"Decrescente")

bubble;Aleatório;1000;2022-09-07 20:15:46;2022-09-07 20:15:46;0.106249
bubble;Crescente;1000;2022-09-07 20:15:46;2022-09-07 20:15:46;0.050571
bubble;Decrescente;1000;2022-09-07 20:15:46;2022-09-07 20:15:46;0.141581
bubble;Aleatório;10000;2022-09-07 20:15:46;2022-09-07 20:15:56;9.539783
bubble;Crescente;10000;2022-09-07 20:15:56;2022-09-07 20:16:01;5.112359
bubble;Decrescente;10000;2022-09-07 20:16:01;2022-09-07 20:16:15;14.229089
bubble;Aleatório;100000;2022-09-07 20:16:15;2022-09-07 20:32:49;994.183949
bubble;Crescente;100000;2022-09-07 20:32:49;2022-09-07 20:41:36;527.096857
bubble;Decrescente;100000;2022-09-07 20:41:36;2022-09-07 21:06:36;1499.362124


In [13]:
# Teste Selection Sort

# Vetores 1K
ss_a_1K = a_1K.copy()
exec_ordenacao("selection",ss_a_1K,"Aleatório")

ss_c_1K = c_1K.copy()
exec_ordenacao("selection",ss_c_1K,"Crescente")

ss_d_1K = d_1K.copy()
exec_ordenacao("selection",ss_d_1K,"Decrescente")

# Vetores 10K
ss_a_10K = a_10K.copy()
exec_ordenacao("selection",ss_a_10K,"Aleatório")

ss_c_10K = c_10K.copy()
exec_ordenacao("selection",ss_c_10K,"Crescente")

ss_d_10K = d_10K.copy()
exec_ordenacao("selection",ss_d_10K,"Decrescente")


#Vetores 100K
ss_a_100K = a_100K.copy()
exec_ordenacao("selection",ss_a_100K,"Aleatório")

ss_c_100K = c_100K.copy()
exec_ordenacao("selection",ss_c_100K,"Crescente")

ss_d_100K = d_100K.copy()
exec_ordenacao("selection",ss_d_100K,"Decrescente")

selection;Aleatório;1000;2022-09-07 21:06:36;2022-09-07 21:06:36;0.075712
selection;Crescente;1000;2022-09-07 21:06:36;2022-09-07 21:06:36;0.064297
selection;Decrescente;1000;2022-09-07 21:06:36;2022-09-07 21:06:36;0.059608
selection;Aleatório;10000;2022-09-07 21:06:36;2022-09-07 21:06:41;4.920917
selection;Crescente;10000;2022-09-07 21:06:41;2022-09-07 21:06:46;4.898455
selection;Decrescente;10000;2022-09-07 21:06:46;2022-09-07 21:06:51;4.964943
selection;Aleatório;100000;2022-09-07 21:06:51;2022-09-07 21:14:40;469.484341
selection;Crescente;100000;2022-09-07 21:14:40;2022-09-07 21:22:47;486.311838
selection;Decrescente;100000;2022-09-07 21:22:47;2022-09-07 21:31:04;497.467428


In [14]:
# Vetores 1K
is_a_1K = a_1K.copy()
exec_ordenacao("insertion",is_a_1K,"Aleatório")

is_c_1K = c_1K.copy()
exec_ordenacao("insertion",is_c_1K,"Crescente")

is_d_1K = d_1K.copy()
exec_ordenacao("insertion",is_d_1K,"Decrescente")


# Vetores 10K
is_a_10K = a_10K.copy()
exec_ordenacao("insertion",is_a_10K,"Aleatório")

is_c_10K = c_10K.copy()
exec_ordenacao("insertion",is_c_10K,"Crescente")

is_d_10K = d_10K.copy()
exec_ordenacao("insertion",is_d_10K,"Decrescente")


# Vetores 100K
is_a_100K = a_100K.copy()
exec_ordenacao("insertion",is_a_100K,"Aleatório")

is_c_100K = c_100K.copy()
exec_ordenacao("insertion",is_c_100K,"Crescente")

is_d_100K = d_100K.copy()
exec_ordenacao("insertion",is_d_100K,"Decrescente")


insertion;Aleatório;1000;2022-09-07 21:31:04;2022-09-07 21:31:04;0.091522
insertion;Crescente;1000;2022-09-07 21:31:04;2022-09-07 21:31:04;0.0
insertion;Decrescente;1000;2022-09-07 21:31:04;2022-09-07 21:31:05;0.188211
insertion;Aleatório;10000;2022-09-07 21:31:05;2022-09-07 21:31:14;9.370455
insertion;Crescente;10000;2022-09-07 21:31:14;2022-09-07 21:31:14;0.001842
insertion;Decrescente;10000;2022-09-07 21:31:14;2022-09-07 21:31:32;17.822269
insertion;Aleatório;100000;2022-09-07 21:31:32;2022-09-07 21:47:38;966.315678
insertion;Crescente;100000;2022-09-07 21:47:38;2022-09-07 21:47:38;0.013905
insertion;Decrescente;100000;2022-09-07 21:47:38;2022-09-07 22:16:47;1749.128263


In [15]:
# Teste Merge Sort

# Vetores 1K
ms_a_1K = a_1K.copy()
exec_ordenacao("merge",ms_a_1K,"Aleatório")

ms_c_1K = c_1K.copy()
exec_ordenacao("merge",ms_c_1K,"Crescente")

ms_d_1K = d_1K.copy()
exec_ordenacao("merge",ms_d_1K,"Decrescente")


# Vetores 10K
ms_a_10K = a_10K.copy()
exec_ordenacao("merge",ms_a_10K,"Aleatório")

ms_c_10K = c_10K.copy()
exec_ordenacao("merge",ms_c_10K,"Crescente")

ms_d_10K = d_10K.copy()
exec_ordenacao("merge",ms_d_10K,"Decrescente")


# Vetores 100K
ms_a_100K = a_100K.copy()
exec_ordenacao("merge",ms_a_100K,"Aleatório")

ms_c_100K = c_100K.copy()
exec_ordenacao("merge",ms_c_100K,"Crescente")

ms_d_100K = d_100K.copy()
exec_ordenacao("merge",ms_d_100K,"Decrescente")

merge;Aleatório;1000;2022-09-07 22:16:47;2022-09-07 22:16:47;0.004
merge;Crescente;1000;2022-09-07 22:16:47;2022-09-07 22:16:47;0.002618
merge;Decrescente;1000;2022-09-07 22:16:47;2022-09-07 22:16:47;0.003666
merge;Aleatório;10000;2022-09-07 22:16:47;2022-09-07 22:16:47;0.056013
merge;Crescente;10000;2022-09-07 22:16:47;2022-09-07 22:16:47;0.044056
merge;Decrescente;10000;2022-09-07 22:16:47;2022-09-07 22:16:47;0.044806
merge;Aleatório;100000;2022-09-07 22:16:47;2022-09-07 22:16:48;0.690791
merge;Crescente;100000;2022-09-07 22:16:48;2022-09-07 22:16:49;0.563015
merge;Decrescente;100000;2022-09-07 22:16:49;2022-09-07 22:16:49;0.521281


#### Consolida os dados 

Consolida os dados da execução em um arquivo excel para servir de base de análise

In [16]:
# Abre o arquivo de log em um DF
df_log = pd.read_csv('./log_execucoes.txt',sep=';')

# Carrega os dados do Excel
df_dados = pd.read_excel('./dados_tempos.xlsx',sheet_name='dados')

# Busca o Ultimo ID da Coleta
ultima_coleta = max(df_dados['id_coleta'])
id_coleta = int(ultima_coleta)+1
df_log['id_coleta'] = id_coleta

#Junda os dois Data Frames
df_dados = pd.concat([df_dados,df_log])

# Grava Dados no arquivo Excel
df_dados.to_excel('dados_tempos.xlsx',sheet_name='dados', index=False)