https://lamfo-unb.github.io/2019/04/21/Sorting-algorithms/

## Importação de dependências

Estas bibliotecas são utilizadas para diferentes propósitos no experimento:

* time: medição do tempo de execução.
* random: geração de casos médios aleatórios.
* math: operações matemáticas, como raiz quadrada.
* psutil: monitoramento do uso de recursos do sistema.
* os: interações com o sistema operacional, como verificar se arquivos existem.
* tracemalloc: rastreamento do uso de memória.
* csv: leitura e escrita de arquivos CSV.
* datetime: obter a data e hora atuais.

In [1]:
import time
import random
import math
import psutil
import os
import tracemalloc
import csv
from datetime import datetime

## Implementação dos Algoritmos de Ordenação:

### a) MergeSort

In [2]:
def merge_sort(arr):
    if len(arr) > 1:
        mid = len(arr) // 2
        left_half = arr[:mid]
        right_half = arr[mid:]

        merge_sort(left_half)
        merge_sort(right_half)

        i, j, k = 0, 0, 0
        while i < len(left_half) and j < len(right_half):
            if left_half[i] < right_half[j]:
                arr[k] = left_half[i]
                i += 1
            else:
                arr[k] = right_half[j]
                j += 1
            k += 1

        while i < len(left_half):
            arr[k] = left_half[i]
            i += 1
            k += 1

        while j < len(right_half):
            arr[k] = right_half[j]
            j += 1
            k += 1

### b) QuickSort

In [3]:
def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    else:
        pivot = arr[len(arr) // 2]
        left = [x for x in arr if x < pivot]
        middle = [x for x in arr if x == pivot]
        right = [x for x in arr if x > pivot]
        return quick_sort(left) + middle + quick_sort(right)

### c) SelectionSort

In [None]:
def selection_sort(arr):
    for i in range(len(arr)):
        min_idx = i
        for j in range(i+1, len(arr)):
            if arr[j] < arr[min_idx]:
                min_idx = j
        arr[i], arr[min_idx] = arr[min_idx], arr[i]

## Medição do Tempo e Memória
Esta função measure_time_and_memory mede o tempo e o uso de memória de uma função de ordenação.

In [6]:
def measure_time_and_memory(arr, sort_function):
    tracemalloc.start()
    start_time = time.time()
    arr_copy = arr[:]  # Copiar o array para evitar alterar o original
    sort_function(arr_copy)
    end_time = time.time()
    current, peak = tracemalloc.get_traced_memory()
    tracemalloc.stop()
    return end_time - start_time, peak / (1024 * 1024)  # Converter para MB


## Geração de Casos de Teste (Vetores de entrada)

Cada algoritmo terá seus próprios casos de teste específicos para melhor caso, pior caso e caso médio, refletindo de maneira mais precisa a complexidade e a performance de cada um.

### MergeSort melhor caso

Array já ordenado. 

Melhor Caso (generate_best_case_merge_sort): Gera um array ordenado de 0 a n-1.

In [None]:
def generate_best_case_merge_sort(n):
    return list(range(n))

### MergeSort pior caso

O pior caso para MergeSort será aquele onde o array é tal que, em cada etapa, a função merge faz o número máximo de comparações. Seguindo a lógica explicada, foi criado uma função recursiva para construir os arrais.

Pior Caso (generate_worst_case_merge_sort): Gera um array que resulta no número máximo de comparações no MergeSort. Utiliza uma abordagem recursiva para alternar os elementos entre subarrays esquerdo e direito.

In [None]:
# Pior caso para MergeSort: https://stackoverflow.com/questions/24594112/when-will-the-worst-case-of-merge-sort-occur
def generate_worst_case_merge_sort(arr):
    if len(arr) <= 1:
        return arr
    mid = len(arr) // 2
    left = generate_worst_case_merge_sort(arr[:mid])
    right = generate_worst_case_merge_sort(arr[mid:])
    worst_case_arr = []
    left_index, right_index = 0, 0
    while left_index < len(left) and right_index < len(right):
        worst_case_arr.append(left[left_index])
        left_index += 1
        worst_case_arr.append(right[right_index])
        right_index += 1
    # Append any remaining elements (only happens if len(arr) is odd)
    worst_case_arr.extend(left[left_index:])
    worst_case_arr.extend(right[right_index:])
    return worst_case_arr

def generate_worst_case_merge_sort_wrapper(n):
    arr = list(range(n))
    return generate_worst_case_merge_sort(arr)

### MergeSort caso medio

O caso médio para MergeSort é um array embaralhado aleatoriamente.

Caso Médio (generate_average_case_merge_sort): Gera um array embaralhado aleatoriamente.
Essa abordagem garante que o pior caso do MergeSort é configurado corretamente para maximizar o número de comparações, enquanto os melhores e casos médios permanecem conforme esperado.

In [7]:
# Caso médio para MergeSort: array aleatório
def generate_average_case_merge_sort(n):
    arr = list(range(n))
    random.shuffle(arr)
    return arr

### QuickSort melhor caso

Para o pivô sendo o elemento do meio, o melhor caso ocorre quando o array é tal que cada divisão é perfeitamente equilibrada. Na prática, isso não depende muito do estado inicial (ordenado ou aleatório), mas sim de uma distribuição balanceada dos elementos.

In [None]:
def generate_best_case_quick_sort(n):
    return list(range(n))

### QuickSort pior caso

O pior caso ocorre quando o array está ordenado ou inversamente ordenado, e o pivô sendo o elemento do meio ainda resulta em uma partição desbalanceada. Contudo, com o pivô sendo o elemento do meio, um array ordenado ou inversamente ordenado não cria o pior caso. Então, vamos criar uma distribuição específica que força o pior caso.

In [None]:
def generate_worst_case_quick_sort(arr):
    if len(arr) <= 1:
        return arr
    mid = len(arr) // 2
    left = generate_worst_case_quick_sort(arr[:mid])
    right = generate_worst_case_quick_sort(arr[mid:])
    return [arr[mid]] + left + right

def generate_worst_case_quick_sort_wrapper(n):
    arr = list(range(n))
    return generate_worst_case_quick_sort(arr)

### QuickSort caso medio

Para o caso médio, um array aleatório geralmente serve bem para esta abordagem.

In [8]:
def generate_average_case_quick_sort(n):
    arr = list(range(n))
    random.shuffle(arr)
    return arr

### Selection Sort melhor caso
O melhor caso para o Selection Sort ocorre quando o array já está ordenado. Mesmo neste caso, o algoritmo ainda tem que passar por todas as comparações, mas não faz trocas desnecessárias. A complexidade permanece O(n^2), mas o número de trocas é mínimo.

In [9]:
def generate_best_case_selection_sort(n):
    return list(range(n))

### Selection Sort pior caso

O pior caso para o Selection Sort ocorre quando o array está em ordem inversa. Isso força o algoritmo a realizar o máximo número de trocas.

In [None]:
def generate_worst_case_selection_sort(n):
    return list(range(n-1, -1, -1))

### Selection Sort caso medio

O caso médio para o Selection Sort é um array aleatório, onde o desempenho será representativo da média esperada para a complexidade O(n^2).

In [None]:
def generate_average_case_selection_sort(n):
    arr = list(range(n))
    random.shuffle(arr)
    return arr

### Função para retornar as funções de geração de casos de teste com base no algoritmo

Esta função retorna um conjunto de funções de geração de casos de teste (melhor caso, pior caso e caso médio) específicas para o algoritmo de ordenação fornecido. O objetivo é fornecer as funções corretas que geram os casos de teste apropriados para o algoritmo especificado.

**Como funciona:**

**Entrada:** Um string algorithm_name, que é o nome do algoritmo de ordenação (por exemplo, "MergeSort").

**Processamento:** Verifica qual é o nome do algoritmo e retorna um conjunto de três funções: uma para gerar o melhor caso, uma para gerar o pior caso e outra para gerar o caso médio.

**Saída:** Uma tupla contendo três funções de geração de casos de teste correspondentes ao algoritmo especificado.

In [11]:
def get_case_generators(algorithm_name):
    if algorithm_name == "MergeSort":
        return (generate_best_case_merge_sort, generate_worst_case_merge_sort_wrapper, generate_average_case_merge_sort)
    elif algorithm_name == "QuickSort":
        return (generate_best_case_quick_sort, generate_worst_case_quick_sort_wrapper, generate_average_case_quick_sort)
    elif algorithm_name == "SelectionSort":
        return (generate_best_case_selection_sort, generate_worst_case_selection_sort, generate_average_case_selection_sort)
    else:
        raise ValueError(f"Algoritmo desconhecido: {algorithm_name}")


## Seleção da Função de Ordenação

Seleciona a função de ordenação com base no nome fornecido.

In [12]:
def get_sort_function(algorithm_name):
    if algorithm_name == "MergeSort":
        return merge_sort
    elif algorithm_name == "QuickSort":
        return quick_sort
    elif algorithm_name == "SelectionSort":
        return selection_sort
    else:
        raise ValueError(f"Algoritmo desconhecido: {algorithm_name}")

## Leitura do Arquivo de Entrada

Lê o arquivo de entrada para obter os tamanhos dos arrays e o algoritmo a ser testado.

In [13]:
def read_input_file(filename):
    with open(filename, 'r') as file:
        sizes = list(map(int, file.readline().strip().split()))
        algorithm = file.readline().strip()
    return sizes, algorithm

## Função Principal

A função principal coordena a leitura dos parâmetros de entrada, seleção do algoritmo de ordenação, execução dos testes e gravação dos resultados em um arquivo CSV.

**Fluxo Geral do Programa**

**Leitura dos Parâmetros de Entrada:** O arquivo input-teste.txt é lido para obter os tamanhos dos arrays e o algoritmo de ordenação a ser testado.

**Configuração do Arquivo de Log:** Se o arquivo de log não existe, ele é criado com o cabeçalho apropriado.

**Execução dos Testes:** Para cada tamanho de array, são gerados três tipos de casos (melhor, pior e médio). Para cada caso, o tempo e o uso de memória são medidos.

**Registro dos Resultados:** Os resultados são registrados no arquivo de log e impressos no console.

Esta estrutura permite uma análise detalhada da performance de diferentes algoritmos de ordenação sob diferentes condições.

In [None]:
def main():
    sizes, algorithm_name = read_input_file('input.txt')
    sort_function = get_sort_function(algorithm_name)
    log_file = 'sort_performance_log.csv'

    if not os.path.exists(log_file):
        with open(log_file, 'w', newline='') as csvfile:
            fieldnames = ['timestamp', 'algorithm', 'size', 'case', 'time', 'memory']
            writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
            writer.writeheader()

    case_generators = get_case_generators(algorithm_name)
    cases = ['melhor', 'pior', 'medio']

    for size in sizes:
        for case, gen_case in zip(cases, case_generators):
            if case == 'medio':
                times = []
                memories = []
                for _ in range(5):
                    arr = gen_case(size)
#                     print(f"Array {case} caso (antes da ordenação): {arr}")
                    time_spent, memory_used = measure_time_and_memory(arr, sort_function)
                    times.append(time_spent)
                    memories.append(memory_used)
                avg_time = sum(times) / len(times)
                avg_memory = sum(memories) / len(memories)
                log_entry = {
                    'timestamp': datetime.now().strftime('%Y-%m-%d %H:%M:%S'),
                    'algorithm': algorithm_name,
                    'size': size,
                    'case': case,
                    'time': avg_time,
                    'memory': avg_memory
                }
                print(f"{log_entry['timestamp']}, {algorithm_name}, {size}, {case}, {avg_time:.6f}, {avg_memory:.6f} MB")
            else:
                arr = gen_case(size)
#                 print(f"Array {case} caso (antes da ordenação): {arr}")
                time_spent, memory_used = measure_time_and_memory(arr, sort_function)
                log_entry = {
                    'timestamp': datetime.now().strftime('%Y-%m-%d %H:%M:%S'),
                    'algorithm': algorithm_name,
                    'size': size,
                    'case': case,
                    'time': time_spent,
                    'memory': memory_used
                }
                print(f"{log_entry['timestamp']}, {algorithm_name}, {size}, {case}, {time_spent:.6f}, {memory_used:.6f} MB")

            with open(log_file, 'a', newline='') as csvfile:
                fieldnames = ['timestamp', 'algorithm', 'size', 'case', 'time', 'memory']
                writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
                writer.writerow(log_entry)

In [None]:
if __name__ == "__main__":
    main()