##Passo 1
Implementar o algoritmo Select-BFPRT em Python. Como entrada o algoritmo deve receber uma tripla (x,y,z) onde x é um vetor de y posições e 1 <= z <= y é um inteiro. Como saída deverá retornar o z-ésimo maior elemento do vetor.

###Select BFPRT
A função select-bfprt é utilizada para encontrar o k-ésimo menor elemento de um vetor através do algortimo BFPRT(mediana das medianas) - para esta atividade o algoritmo foi modificado para encontrar o k-ésimo maior elemento do vetor - divindo o vetor em grupos de tamanho 5 a fim de encontrar as medianas de cada grupo e usar esta mediana para dividir o array em três partes menores, continuando a busca na parte correta até encontrar o elemento desejado.


In [2]:
import random

def select_bfprt(x, y, z):
    if len(x) <= z:
        return sorted(x)[y]

    # Divide o array em grupos de tamanho r e encontra as medianas de cada grupo
    groups = [x[i:i+r] for i in range(0, len(x), z)]
    medians = [select_bfprt(group, len(group)//2, z) for group in groups]

    # Encontra a mediana das medianas
    median_of_medians = select_bfprt(medians, len(medians)//2, z)

    # Divide o array em três partes com base na mediana das medianas
    smaller = [a for a in x if a < median_of_medians]
    equal = [a for a in x if a == median_of_medians]
    larger = [a for a in x if a > median_of_medians]

    if y < len(smaller):
        return select_bfprt(smaller, y, z)
    elif y < len(smaller) + len(equal):
        return median_of_medians
    else:
        return select_bfprt(larger, y - len(smaller) - len(equal), z)

###Partition BFPRT
A função partition-bfprt recebe como argumento um array e os indíces que definem o intervalo de particionamento.Para este caso o indíce do pivô foi escolhido de forma aleatória dentro do intervalo, move o pivô para a extrema direita do intervalo e rearranja os elementos de forma que todos os elementos menores que o pivô estajam à esquerda e todos os elementos maiores estejam à direita do pivô. Em seguida a função retorna o indíce final do pivô após a partição.

In [3]:
def partition_bfprt(arr, left, right):
    while left < right:
        # Escolhe aleatoriamente um índice de pivô
        pivot_index = random.randint(left, right)

        # Obtém o valor do pivô
        pivot_value = arr[pivot_index]

        # Move o pivô para a extrema direita
        arr[pivot_index], arr[right] = arr[right], arr[pivot_index]

        store_index = left
        for i in range(left, right):
            if arr[i] < pivot_value:
                arr[i], arr[store_index] = arr[store_index], arr[i]
                store_index += 1
        arr[store_index], arr[right] = arr[right], arr[store_index]

        # Decide qual subarray continuar
        if pivot_index == store_index:
            return arr[pivot_index]
        elif pivot_index < store_index:
            right = store_index - 1
        else:
            left = store_index + 1

    return arr[left]

###Caso de teste
A estrutura "if __name__ == __main__" é frequentemente usada em scripts Python para garantir que o código dentro dela só seja executado quando o arquivo Python é executado diretamente como um programa e não quando é importado como módulo em outro script.

In [4]:

if __name__ == "__main__":
    vetor = [3, 2, 1, 5, 4, 8, 6, 7]
    r = 5  # Tamanho do intervalo
    z = 4  # Queremos encontrar o 4º maior elemento (índice 3)
    resultado = select_bfprt(vetor, len(vetor) - z, r)
    print(f"{z}-ésimo maior elemento: {resultado}")

4-ésimo maior elemento: 5


##Passo 2
Implementar uma invariante do algoritmo que receberá um outro valor "r" que definirá o tamanho do intervalo que será ordenado na chamada recursiva. No Passo 1 o intervalo utlizado no algoritmo tinha tamanho 5. Para cada um dos casos r ∈ {3,5,7,9,11}, calcule o tempo médio do algoritmo através de testes computacionais para cada valor cada valor de r.

Para a realização dos testes deve-se gerar aleatoriamente um mihão de triplas (x,y,z), onde y >= 1000000. Além disso, deve-se calcular, também, o tempo médio que cada algoritmo leva para resolver essas instâncias.

###Select BFPRT with R
Modificada a partir da função select-bfprt, o algoritmo select-bfprt-with-r recebe como parâmetro uma variável "r" que definirá o tamanho o tamanho do intervalo que será ordenado recursivamnete. Para cada caso r ∈ {3,5,7,9,11}.

In [5]:
def select_bfprt_with_r(x, y, z, r):
    if y <= r:
        return sorted(x)[z - 1]

    # Divide o array em grupos de tamanho r e encontra as medianas de cada grupo
    groups = [x[i:i+r] for i in range(0, y, r)]
    medians = [select_bfprt(group, len(group) // 2, r) for group in groups]

    # Encontra a mediana das medianas
    median_of_medians = select_bfprt(medians, len(medians) // 2, r)

    # Divide o array em três partes com base na mediana das medianas
    smaller = [elem for elem in x if elem < median_of_medians]
    equal = [elem for elem in x if elem == median_of_medians]
    larger = [elem for elem in x if elem > median_of_medians]

    if z <= len(smaller):
        return select_bfprt_with_r(smaller, len(smaller), z, r)
    elif z <= len(smaller) + len(equal):
        return median_of_medians
    else:
        return select_bfprt_with_r(larger, len(larger), z - len(smaller) - len(equal), r)

###Random Triples
Este trecho de código gera aleatoriamente 1000 triplas (x,y,z)

In [7]:
import random
import time

def random_triples(num_instances):
    triples = []
    for _ in range(num_instances):
        y = random.randint(100,1000) # y maior ou igual a 1,000
        x = [random.randint(1, 1000) for _ in range(y)]  # Criar vetor x aleatório
        z = random.randint(1, y)  # z entre 1 e y
        triples.append((x, y, z))
    return triples

###Measure Time
A função measure-time mede o tempo médio de execução do select-bfprt-with-r com os valores do intervalo fornecido para r.

In [10]:
def measure_time(triples, r):
    total_time = 0
    for triple in triples:
        x, y, z = triple
        start_time = time.time()
        select_bfprt_with_r(x, y,z, r)
        end_time = time.time()
        total_time += end_time - start_time
    return total_time / len(triples)

# Executar testes para diferentes valores de r
num_instances = 1000
triples = random_triples(num_instances)
r_values = [3, 5, 7, 9, 11]

for r in r_values:
    avg_time = measure_time(triples, r)
    print(f"Tempo médio para r = {r}: {avg_time} segundos")

Tempo médio para r = 3: 0.0020196006298065184 segundos
Tempo médio para r = 5: 0.0008179600238800049 segundos
Tempo médio para r = 7: 0.00041740059852600096 segundos
Tempo médio para r = 9: 0.0003578159809112549 segundos
Tempo médio para r = 11: 0.00035724234580993653 segundos
