# Título: "Análise de Desempenho de Algoritmos de Pesquisa"



# Módulo Pesquisa 

Neste módulo, iremos desenvolver um conjunto de funções para realizar pesquisas em listas de números por forma a testar o desempenho de algoritmos de pesquisa. 

1. `Pesquisa Sequencial`: Um método simples que percorre a lista um elemento de cada vez até encontrar o valor desejado.
2. `Pesquisa Sequencial Recursiva`: Uma versão recursiva da pesquisa sequencial que utiliza chamadas de função para encontrar o valor desejado.

3. `Pesquisa Binária`: Um algoritmo de pesquisa mais eficiente que funciona em listas ordenadas, dividindo a lista ao meio repetidamente.

4. `Pesquisa Binária Recursiva`: Uma versão recursiva da pesquisa binária que utiliza chamadas de função para encontrar o valor desejado em listas ordenadas.

Essas funções de pesquisa são úteis e podem ter diversas aplicações, desde encontrar elementos num determinado conjunto de dados até otimizar o tempo de busca em listas ordenadas. 

In [None]:
def pesquisa_sequencial_lista_ordenada(lista, item):
    """
    Realiza uma pesquisa sequencial numa lista ordenada para encontrar o 'item' desejado.

    Args:
    lista (list): A lista ordenada de números a ser pesquisada.
    item: O número que desejamos encontrar na lista.

    Returns:
    bool: Retorna True se o 'item' for encontrado na lista, False caso contrário.
    """
    encontrado = False
    for elemento in lista:
        if elemento == item:
            encontrado = True
            break
        if elemento > item:
            encontrado = False
            break
    return encontrado

def pesquisa(lista, item):
    """
    Realiza uma pesquisa sequencial recursiva numa lista para encontrar o valor 'n' desejado.

    Args:
    lista (list): A lista de números a ser pesquisada.
    n: O número que desejamos encontrar na lista.

    Returns:
    bool: Retorna True se o valor 'n' for encontrado na lista, False caso contrário.
    """
    if not lista:  # Condição de parada: lista vazia, elemento não encontrado
        return False
    if lista[0] == item:
        return True
    return pesquisa(lista[1:], item)


def pesquisa_binaria(lista, item):
    """
    Realiza uma pesquisa binária numa lista ordenada para encontrar o valor 'item' desejado.

    Args:
    lista (list): A lista ordenada de números a ser pesquisada.
    item: O valor que desejamos encontrar na lista.

    Returns:
    bool: Retorna True se o valor 'item' for encontrado na lista, False caso contrário.
    """
    primeiro = 0
    ultimo = len(lista) - 1
    while primeiro <= ultimo:
        meio = (primeiro + ultimo) // 2
        if lista[meio] == item:
            return True
        else:
            if item < lista[meio]:
                ultimo = meio - 1
            else:
                primeiro = meio + 1
    return False


def pesquisa_binaria_recursiva(lista, item):
    """
    Realiza uma pesquisa binária recursiva numa lista ordenada para encontrar o valor 'item' desejado.

    Args:
    lista (list): A lista ordenada de números a ser pesquisada.
    item: O valor que desejamos encontrar na lista.

    Returns:
    bool: Retorna True se o valor 'item' for encontrado na lista, False caso contrário.
    """
    if len(lista) == 0:
        return False
    else:
        meio = len(lista) // 2
        if lista[meio] == item:
            return True
        else:
            if item < lista[meio]:
                return pesquisa_binaria_recursiva(lista[:meio], item)
            else:
                return pesquisa_binaria_recursiva(lista[meio + 1:], item)


# Módulo Análise de Complexidade

Neste módulo, iremos desenvolver um conjunto de funções para avaliar o desempenho de outras funções. Teremos quatro funções principais:

1. `f_tempo`: Calcula o tempo médio e desvio padrão de execução de uma função com base num número de repetições.

2. `f_boxplot`: Desenha um boxplot dos tempos de execução.

3. `f_complexidade`: Avalia a complexidade de uma função em diferentes inputs, fornecendo médias e desvios padrão.

4. `f_complexidade_boxplot`: Gera um gráfico de tempo médio de execução em função dos inputs.





In [None]:
import time
import statistics
import matplotlib.pyplot as plt

def f_tempo(funcao, entrada, n_vezes, *args):
    """
    Calcula o tempo médio e desvio padrão de execução de uma função.

    Args:
        funcao: A função a ser analisada.
        entrada: Um input para a função.
        n_vezes: O número de vezes que a função deve ser executada.

    Returns:
        tempos_execucao: Uma lista dos tempos de execução individuais.
        tempo_medio: O tempo médio de execução.
        desvio_padrao: O desvio padrão do tempo de execução.
    """
    tempos_execucao = []
    for _ in range(n_vezes):
        start_time = time.time()
        funcao(entrada, *args)
        end_time = time.time()
        tempos_execucao.append(end_time - start_time)

    tempo_medio = statistics.mean(tempos_execucao)
    desvio_padrao = statistics.stdev(tempos_execucao)

    return tempos_execucao, tempo_medio, desvio_padrao

def f_boxplot(tempos_execucao):
    """
    Desenha um boxplot dos tempos de execução.

    Args:
        tempos_execucao: Uma lista de tempos de execução.
    """
    plt.boxplot(tempos_execucao)
    plt.show()

def f_complexidade(funcao, lista_inputs, n_vezes):
    """
    Avalia a complexidade de uma função para diferentes inputs.

    Args:
        funcao: A função a ser analisada.
        lista_inputs: Lista de inputs da função para avaliar o tempo de execução.
        n_vezes: O número de vezes que a função deve ser executada para cada input.

    Returns:
        dic_stats: Um dicionário com médias e desvios padrão para cada input.
        dic_tempos: Um dicionário com listas de tempos para cada input.
    """
    dic_stats = {}
    dic_tempos = {}

    for entrada in lista_inputs:
        tempos_execucao, tempo_medio, desvio_padrao = f_tempo(funcao, entrada, n_vezes)
        dic_stats[entrada] = (tempo_medio, desvio_padrao)
        dic_tempos[entrada] = tempos_execucao

    return dic_stats, dic_tempos

def f_complexidade_boxplot(dic_tempos):
    """
    Gera um gráfico de tempo médio de execução em função dos inputs.

    Args:
        dic_tempos: Um dicionário com listas de tempos de execução para diferentes inputs.
    """
    medias = [statistics.mean(dic_tempos[entrada]) for entrada in dic_tempos]
    inputs = list(dic_tempos.keys())

    plt.plot(inputs, medias, marker='o')
    plt.xlabel('Entradas')
    plt.ylabel('Tempo Médio de Execução')
    plt.show()


# Dados: Criar ficheiros

Neste exemplo iremos criar arquivos com números aleatórios e tamanhos diferentes.

O código é dividido em duas funções principais:
1. `gerar_arquivo_aleatorio`: Gera um ficheiro .txt com números aleatórios compreendidos num intervalo de 0 a 1.000.000.
2. `ordenar_arquivo`: Lê o arquivo de entrada, ordena os números e escreve o resultado no arquivo de saída.




In [None]:
import random
def gerar_arquivo_aleatorio(nome_arquivo, num_registros):
    """
    Gera um arquivo com números aleatórios.

    Args:
        nome_arquivo (str): O nome do arquivo a ser criado.
        num_registros (int): O número de registros a serem gerados e escritos no arquivo.
    """
    with open(nome_arquivo, 'w') as arquivo:
        for _ in range(num_registros):
            num = random.randint(0, 1000000)
            arquivo.write(str(num) + '\n')

def ordenar_arquivo(arquivo_entrada, arquivo_saida):
    """
    Lê um arquivo de entrada, ordena os números e escreve o resultado no arquivo de saída.

    Args:
        arquivo_entrada (str): O nome do arquivo de entrada com números desordenados.
        arquivo_saida (str): O nome do arquivo onde os números ordenados serão gravados.
    """
    with open(arquivo_entrada, 'r') as arquivo_entrada:
        numeros = [int(linha) for linha in arquivo_entrada]
        numeros.sort()
    with open(arquivo_saida, 'w') as arquivo_saida:
        for num in numeros:
            arquivo_saida.write(str(num) + '\n')

tamanhos_arquivos = [100, 1000, 10000, 100000]
for tamanho in tamanhos_arquivos:
    arquivo_aleatorio = f'aleatorio_{tamanho}.txt'
    arquivo_ordenado = f'ordenado_{tamanho}.txt'
    gerar_arquivo_aleatorio(arquivo_aleatorio, tamanho)
    ordenar_arquivo(arquivo_aleatorio, arquivo_ordenado)

    print(f'Arquivos criados para {tamanho} números.')
print('Concluído.')


# Análise do desempenho dos algoritmos

resultado do número de operações T(n)

# Pesquisa Sequencial
1. `A pesquisa sequencial` percorre a lista elemento por elemento até encontrar o item desejado ou chegar ao final da lista. O pior caso ocorre quando o item não está na lista, e a pesquisa percorre toda a lista.

**Análise de Complexidade Temporal**:

**Melhor caso**: O item é o primeiro elemento da lista (1 operação de comparação).

**Pior caso**: O item não está na lista, e é necessário percorrer todos os elementos (n operações de comparação, onde n é o tamanho da lista).

**Complexidade Temporal (Big-O)**: O(n) no pior caso, onde n é o tamanho da lista.

In [None]:
import time
import matplotlib.pyplot as plt
import random

# Função de pesquisa sequencial
def pesquisa_sequencial(lista, item):
    for elemento in lista:
        if elemento == item:
            return True
    return False

# Lista de tamanhos diferentes
tamanhos_de_lista = [100, 1000, 10000, 100000]
tempos_sequencial = []

for tamanho in tamanhos_de_lista:
    arquivo_ordenado = f'ordenado_{tamanho}.txt'
    lista_ordenada = []

    # Ler o arquivo ordenado e preencher a lista
    with open(arquivo_ordenado, 'r') as arquivo:
        lista_ordenada = [int(linha) for linha in arquivo]

    item = random.choice(lista_ordenada)  # Valor a ser pesquisado

    inicio = time.time()
    resultado_sequencial = pesquisa_sequencial(lista_ordenada, item)
    fim = time.time()
    tempo_sequencial = fim - inicio
    tempos_sequencial.append(tempo_sequencial)

# Crie um gráfico para visualizar os resultados
plt.plot(tamanhos_de_lista, tempos_sequencial, marker='o')
plt.xlabel('Tamanho da Lista')
plt.ylabel('Tempo de Execução (s)')
plt.title('Análise de Desempenho da Pesquisa Sequencial')
plt.grid(True)
plt.show()


# Pesquisa Sequencial Recursiva
1. `A pesquisa sequencial recursiva` também percorre a lista elemento por elemento até encontrar o item desejado ou chegar ao final da lista. 

**Análise de Complexidade Temporal**:

**Melhor caso**: O item é o primeiro elemento da lista (1 operação de comparação).

**Pior caso**: O item não está na lista, e é necessário percorrer todos os elementos (n operações de comparação, onde n é o tamanho da lista).

**Complexidade Temporal (Big-O)**: O(n) no pior caso, onde n é o tamanho da lista.

In [None]:
import time
import matplotlib.pyplot as plt
import random
import sys
sys.setrecursionlimit(10000)


# Função de pesquisa sequencial recursiva
def pesquisa_sequencial_recursiva(lista, item):
    if not lista:  # Condição de parada: lista vazia, elemento não encontrado
        return False
    if lista[0] == item:
        return True
    return pesquisa_sequencial_recursiva(lista[1:], item)

# Lista de tamanhos diferentes
tamanhos_de_lista = [100, 1000, 10000]
tempos_sequencial_recursiva = []

for tamanho in tamanhos_de_lista:
    arquivo_ordenado = f'ordenado_{tamanho}.txt'
    lista_ordenada = []

    # Ler o arquivo ordenado e preencher a lista
    with open(arquivo_ordenado, 'r') as arquivo:
        lista_ordenada = [int(linha) for linha in arquivo]

    item = random.choice(lista_ordenada)  # Valor a ser pesquisado

    inicio = time.time()
    resultado_sequencial_recursiva = pesquisa_sequencial_recursiva(lista_ordenada, item)
    fim = time.time()
    tempo_sequencial_recursiva = fim - inicio
    tempos_sequencial_recursiva.append(tempo_sequencial_recursiva)

# Crie um gráfico para visualizar os resultados
plt.plot(tamanhos_de_lista, tempos_sequencial_recursiva, marker='o')
plt.xlabel('Tamanho da Lista')
plt.ylabel('Tempo de Execução (s)')
plt.title('Análise de Desempenho da Pesquisa Sequencial Recursiva')
plt.grid(True)
plt.show()



fazer analise 
Avalie a complexidade temporal de cada um destes casos de forma teórica, identificando o Big-O. 

# Pesquisa Binária
1. `A pesquisa binária` é uma abordagem mais eficiente para listas ordenadas, a lista é dividada pela metade em cada iteração. 

**Análise de Complexidade Temporal**:

**Melhor caso**: O item é o primeiro elemento da lista (1 operação de comparação).

**Pior caso**: A lista é dividida ao meio até que o item seja encontrado ou não (log₂(n) operações de comparação, onde n é o tamanho da lista).

**Complexidade Temporal (Big-O)**: O(log n) no pior caso, onde n é o tamanho da lista.

In [None]:
import time
import matplotlib.pyplot as plt
import random

# Função de pesquisa binária
def pesquisa_binaria(lista, item):
    primeiro = 0
    ultimo = len(lista) - 1
    while primeiro <= ultimo:
        meio = (primeiro + ultimo) // 2
        if lista[meio] == item:
            return True
        else:
            if item < lista[meio]:
                ultimo = meio - 1
            else:
                primeiro = meio + 1
    return False

# Lista de tamanhos diferentes
tamanhos_de_lista = [100, 1000, 10000, 100000]
tempos_binaria = []

for tamanho in tamanhos_de_lista:
    arquivo_ordenado = f'ordenado_{tamanho}.txt'
    lista_ordenada = []

    # Ler o arquivo ordenado e preencher a lista
    with open(arquivo_ordenado, 'r') as arquivo:
        lista_ordenada = [int(linha) for linha in arquivo]

    item = random.choice(lista_ordenada)  # Valor a ser pesquisado

    inicio = time.time()
    resultado_binaria = pesquisa_binaria(lista_ordenada, item)
    fim = time.time()
    tempo_binaria = fim - inicio
    tempos_binaria.append(tempo_binaria)

# Crie um gráfico para visualizar os resultados
plt.plot(tamanhos_de_lista, tempos_binaria, marker='o')
plt.xlabel('Tamanho da Lista')
plt.ylabel('Tempo de Execução (s)')
plt.title('Análise de Desempenho da Pesquisa Binária')
plt.grid(True)
plt.show()


# Pesquisa Binária Recursiva
1. `A pesquisa binária recursiva` também divide a lista pela metade em cada iteração.

**Análise de Complexidade Temporal**:

**Melhor caso**: O item é o primeiro elemento da lista (1 operação de comparação).

**Pior caso**: A lista é dividida ao meio até que o item seja encontrado ou não (log₂(n) operações de comparação, onde n é o tamanho da lista).

**Complexidade Temporal (Big-O)**: O(log n) no pior caso, onde n é o tamanho da lista.

In [None]:
import time
import matplotlib.pyplot as plt
import random
import sys
sys.setrecursionlimit(10000)

# Função de pesquisa binária recursiva
def pesquisa_binaria_recursiva(lista, item):
    if len(lista) == 0:
        return False
    meio = len(lista) // 2
    if lista[meio] == item:
        return True
    elif item < lista[meio]:
        return pesquisa_binaria_recursiva(lista[:meio], item)
    else:
        return pesquisa_binaria_recursiva(lista[meio + 1:], item)

# Lista de tamanhos diferentes
tamanhos_de_lista = [100, 1000, 10000]
tempos_binaria_recursiva = []

for tamanho in tamanhos_de_lista:
    arquivo_ordenado = f'ordenado_{tamanho}.txt'
    lista_ordenada = []

    # Ler o arquivo ordenado e preencher a lista
    with open(arquivo_ordenado, 'r') as arquivo:
        lista_ordenada = [int(linha) for linha in arquivo]

    item = random.choice(lista_ordenada)  # Valor a ser pesquisado

    inicio = time.time()
    resultado_binaria_recursiva = pesquisa_binaria_recursiva(lista_ordenada, item)
    fim = time.time()
    tempo_binaria_recursiva = fim - inicio

    tempos_binaria_recursiva.append(tempo_binaria_recursiva)

# Crie um gráfico para visualizar os resultados
plt.plot(tamanhos_de_lista, tempos_binaria_recursiva, marker='o')
plt.xlabel('Tamanho da Lista')
plt.ylabel('Tempo de Execução (s)')
plt.title('Análise de Desempenho da Pesquisa Binária Recursiva')
plt.grid(True)
plt.show()



fazer analise 
Avalie a complexidade temporal de cada um destes casos de forma teórica, identificando o Big-O. 

In [None]:
def soma_ate_n(n):
    return sum(range(1, n + 1))

dic_stats, dic_tempos = f_complexidade(soma_ate_n, tamanhos_arquivos, n_vezes=100)
print('------')
print("Estatísticas:")
for entrada, (tempo_medio, desvio_padrao) in dic_stats.items():
    print(f"Tamanho do Arquivo: {entrada}")
    print(f"Tempo Médio: {tempo_medio} segundos")
    print(f"Desvio Padrão: {desvio_padrao} segundos")
    print("")

f_boxplot(list(dic_tempos.values()))
f_complexidade_boxplot(dic_tempos)

# Com o módulo de complexidade, avalie a complexidade temporal de cada um dos algoritmos de pesquisa implementados, para sequências a) não ordenadas e b) ordenadas, apresentando dois graficos. 

In [None]:
import random
import pandas as pd
import package_complexidade.analise_complexidade as ac
import matplotlib.pyplot as plt
from package_pesquisa.pesquisa import pesquisa, pesquisa_binaria, pesquisa_sequencial_lista_ordenada
from package_ficheiros.ficheiros import gerar_arquivo_aleatorio, ordenar_arquivo
import sys

# Set the maximum recursion depth to a higher value (e.g., 5000)
sys.setrecursionlimit(100000)

# Tamanhos dos arquivos a serem testados
tamanhos_arquivos = [100, 1000, 10000, 100000]

# Dicionários para armazenar os tempos médios
tempos_sequencial_nao_ordenado = {}
tempos_binaria_nao_ordenada = {}
tempos_sequencial_ordenado = {}
tempos_binaria_ordenada = {}

# Executar para arquivos de diferentes tamanhos
for tamanho in tamanhos_arquivos:
    arquivo_aleatorio = f'aleatorio_{tamanho}.txt'
    arquivo_ordenado = f'ordenado_{tamanho}.txt'

    gerar_arquivo_aleatorio(arquivo_aleatorio, tamanho)
    ordenar_arquivo(arquivo_aleatorio, arquivo_ordenado)

    # Usar Pandas para ler arquivos
    df_aleatorio = pd.read_csv(arquivo_aleatorio, header=None, names=["Numero"])
    df_ordenado = pd.read_csv(arquivo_ordenado, header=None, names=["Numero"])
    
    # Select a random item from df_aleatorio["Numero"]
    item = random.choice(df_aleatorio["Numero"])

    # Tempo médio de pesquisa sequencial em sequência não ordenada
    _, tempo_medio_pesquisa, _ = ac.f_tempo(pesquisa, df_aleatorio["Numero"].tolist(), 5, item)
    tempos_sequencial_nao_ordenado[tamanho] = tempo_medio_pesquisa

    # Tempo médio de pesquisa binária em sequência não ordenada
    _, tempo_medio_binaria_nao_ordenada, _ = ac.f_tempo(pesquisa_binaria, df_aleatorio["Numero"], 5, item)
    tempos_binaria_nao_ordenada[tamanho] = tempo_medio_binaria_nao_ordenada

    # Tempo médio de pesquisa sequencial em sequência ordenada
    _, tempo_medio_sequencial_ordenado, _ = ac.f_tempo(pesquisa_sequencial_lista_ordenada, df_ordenado["Numero"], 5, item)
    tempos_sequencial_ordenado[tamanho] = tempo_medio_sequencial_ordenado

    # Tempo médio de pesquisa binária em sequência ordenada
    _, tempo_medio_binaria_ordenada, _ = ac.f_tempo(pesquisa_binaria, df_ordenado["Numero"], 5, item)
    tempos_binaria_ordenada[tamanho] = tempo_medio_binaria_ordenada

# Plotagem dos gráficos
plt.figure(figsize=(12, 6))

plt.subplot(121)
plt.plot(tamanhos_arquivos, list(tempos_sequencial_nao_ordenado.values()), marker='o', label='Sequencial Não Ordenado')
plt.plot(tamanhos_arquivos, list(tempos_binaria_nao_ordenada.values()), marker='o', label='Binária Não Ordenada')
plt.xlabel('Tamanho do Arquivo')
plt.ylabel('Tempo Médio de Execução')
plt.title('Complexidade Temporal em Sequência Não Ordenada')
plt.legend()

plt.subplot(122)
plt.plot(tamanhos_arquivos, list(tempos_sequencial_ordenado.values()), marker='o', label='Sequencial Ordenado')
plt.plot(tamanhos_arquivos, list(tempos_binaria_ordenada.values()), marker='o', label='Binária Ordenada')
plt.xlabel('Tamanho do Arquivo')
plt.ylabel('Tempo Médio de Execução')
plt.title('Complexidade Temporal em Sequência Ordenada')
plt.legend()

plt.tight_layout()
plt.show()







## Avaliação da Complexidade Temporal em Pesquisas

Esta experiência visa avaliar a complexidade temporal de diferentes algoritmos de pesquisa, considerando três cenários distintos: `melhor caso`, `pior caso` e `caso intermediário`.

- **Melhor Caso**: Este cenário representa a situação ideal, em que a pesquisa é mais eficiente. Nesta pesquisa, consideraremos o primeiro elemento da lista como o item a ser encontrado.

- **Pior Caso**: O pior caso é aquele em que a pesquisa é menos eficiente e envolve a maior quantidade de comparações. Nesta pesquisa, consideraremos o pior caso como a tentativa de encontrar o último número da lista, tornando a pesquisa o mais ineficiente possível.

- **Caso Intermediário**: O caso intermediário está entre o melhor e o pior caso, representando uma situação realista. Para esse cenário, escolhemos um número que está no meio da lista como o alvo da pesquisa.

Esta experiência irá avaliar como diferentes algoritmos de pesquisa (pesquisa sequencial e pesquisa binária) se comportam em relação a esses três cenários, com duas configurações: **sequência ordenada** e **sequência não ordenada**.

Vamos criar dados e traçar gráficos para visualizar como o desempenho dos algoritmos varia em cada um desses cenários. Esta análise permitirá entender melhor a eficácia de cada algoritmo e em que circunstâncias eles são mais adequados.


In [None]:
import random
import pandas as pd
import package_complexidade.analise_complexidade as ac
import matplotlib.pyplot as plt
from package_pesquisa.pesquisa import pesquisa, pesquisa_binaria, pesquisa_sequencial_lista_ordenada
from package_ficheiros.ficheiros import gerar_arquivo_aleatorio, ordenar_arquivo
import sys

# Set the maximum recursion depth to a higher value (e.g., 5000)
sys.setrecursionlimit(100000)

# Tamanhos dos arquivos a serem testados
tamanhos_arquivos = [100, 1000, 10000, 100000]

# Dicionários para armazenar os tempos médios
tempos_sequencial_nao_ordenado = {"Melhor Caso": [], "Pior Caso": [], "Caso Intermediário": []}
tempos_sequencial_ordenado = {"Melhor Caso": [], "Pior Caso": [], "Caso Intermediário": []}
tempos_binaria_nao_ordenada = {"Melhor Caso": [], "Pior Caso": [], "Caso Intermediário": []}
tempos_binaria_ordenada = {"Melhor Caso": [], "Pior Caso": [], "Caso Intermediário": []}

for tamanho in tamanhos_arquivos:
    arquivo_aleatorio = f'aleatorio_{tamanho}.txt'
    arquivo_ordenado = f'ordenado_{tamanho}.txt'

    gerar_arquivo_aleatorio(arquivo_aleatorio, tamanho)
    ordenar_arquivo(arquivo_aleatorio, arquivo_ordenado)

    df_aleatorio = pd.read_csv(arquivo_aleatorio, header=None, names=["Numero"])
    df_ordenado = pd.read_csv(arquivo_ordenado, header=None, names=["Numero"])

    item_melhor_caso = df_aleatorio["Numero"].iloc[0]  # Primeiro valor da lista
    item_pior_caso = df_aleatorio["Numero"].iloc[-1]  # Último valor da lista
    item_intermediario = df_aleatorio["Numero"].iloc[len(df_aleatorio) // 2]  # Valor aleatório da lista

    # Pesquisa Sequencial Não Ordenada
    _, tempo_medio_melhor_caso_sequencial, _ = ac.f_tempo(pesquisa, df_aleatorio["Numero"].tolist(), 2, item_melhor_caso)
    _, tempo_medio_pior_caso_sequencial, _ = ac.f_tempo(pesquisa, df_aleatorio["Numero"].tolist(), 2, item_pior_caso)
    _, tempo_medio_intermediario_sequencial, _ = ac.f_tempo(pesquisa, df_aleatorio["Numero"].tolist(), 2, item_intermediario)

    tempos_sequencial_nao_ordenado["Melhor Caso"].append(tempo_medio_melhor_caso_sequencial)
    tempos_sequencial_nao_ordenado["Pior Caso"].append(tempo_medio_pior_caso_sequencial)
    tempos_sequencial_nao_ordenado["Caso Intermediário"].append(tempo_medio_intermediario_sequencial)

    # Pesquisa Sequencial Ordenada
    _, tempo_medio_melhor_caso_sequencial_ordenado, _ = ac.f_tempo(pesquisa_sequencial_lista_ordenada, df_ordenado["Numero"], 2,
                                                                  item_melhor_caso)
    _, tempo_medio_pior_caso_sequencial_ordenado, _ = ac.f_tempo(pesquisa_sequencial_lista_ordenada, df_ordenado["Numero"],
                                                                 2, item_pior_caso)
    _, tempo_medio_intermediario_sequencial_ordenado, _ = ac.f_tempo(pesquisa_sequencial_lista_ordenada,
                                                                     df_ordenado["Numero"], 2, item_intermediario)

    tempos_sequencial_ordenado["Melhor Caso"].append(tempo_medio_melhor_caso_sequencial_ordenado)
    tempos_sequencial_ordenado["Pior Caso"].append(tempo_medio_pior_caso_sequencial_ordenado)
    tempos_sequencial_ordenado["Caso Intermediário"].append(tempo_medio_intermediario_sequencial_ordenado)

    # Pesquisa Binária Não Ordenada
    _, tempo_medio_melhor_caso_binaria, _ = ac.f_tempo(pesquisa_binaria, df_aleatorio["Numero"], 2, item_melhor_caso)
    _, tempo_medio_pior_caso_binaria, _ = ac.f_tempo(pesquisa_binaria, df_aleatorio["Numero"], 2, item_pior_caso)
    _, tempo_medio_intermediario_binaria, _ = ac.f_tempo(pesquisa_binaria, df_aleatorio["Numero"], 2, item_intermediario)

    tempos_binaria_nao_ordenada["Melhor Caso"].append(tempo_medio_melhor_caso_binaria)
    tempos_binaria_nao_ordenada["Pior Caso"].append(tempo_medio_pior_caso_binaria)
    tempos_binaria_nao_ordenada["Caso Intermediário"].append(tempo_medio_intermediario_binaria)

    # Pesquisa Binária Ordenada
    _, tempo_medio_melhor_caso_binaria_ordenada, _ = ac.f_tempo(pesquisa_binaria, df_ordenado["Numero"], 2, item_melhor_caso)
    _, tempo_medio_pior_caso_binaria_ordenada, _ = ac.f_tempo(pesquisa_binaria, df_ordenado["Numero"], 2, item_pior_caso)
    _, tempo_medio_intermediario_binaria_ordenada, _ = ac.f_tempo(pesquisa_binaria, df_ordenado["Numero"], 2,
                                                                   item_intermediario)

    tempos_binaria_ordenada["Melhor Caso"].append(tempo_medio_melhor_caso_binaria_ordenada)
    tempos_binaria_ordenada["Pior Caso"].append(tempo_medio_pior_caso_binaria_ordenada)
    tempos_binaria_ordenada["Caso Intermediário"].append(tempo_medio_intermediario_binaria_ordenada)

# Plotagem dos gráficos
plt.figure(figsize=(12, 6))

plt.subplot(121)
plt.plot(tamanhos_arquivos, tempos_sequencial_nao_ordenado["Melhor Caso"], marker='o',
         label='Sequencial Não Ordenado - Melhor Caso')
plt.plot(tamanhos_arquivos, tempos_binaria_nao_ordenada["Melhor Caso"], marker='o',
         label='Binária Não Ordenada - Melhor Caso')
plt.plot(tamanhos_arquivos, tempos_sequencial_ordenado["Melhor Caso"], marker='o',
         label='Sequencial Ordenado - Melhor Caso')
plt.plot(tamanhos_arquivos, tempos_binaria_ordenada["Melhor Caso"], marker='o',
         label='Binária Ordenada - Melhor Caso')
plt.plot(tamanhos_arquivos, tempos_sequencial_nao_ordenado["Pior Caso"], marker='o',
         label='Sequencial Não Ordenado - Pior Caso')
plt.plot(tamanhos_arquivos, tempos_binaria_nao_ordenada["Pior Caso"], marker='o',
         label='Binária Não Ordenada - Pior Caso')
plt.plot(tamanhos_arquivos, tempos_sequencial_ordenado["Pior Caso"], marker='o',
         label='Sequencial Ordenado - Pior Caso')
plt.plot(tamanhos_arquivos, tempos_binaria_ordenada["Pior Caso"], marker='o',
         label='Binária Ordenada - Pior Caso')
plt.xlabel('Tamanho do Arquivo')
plt.ylabel('Tempo Médio de Execução')
plt.title('Complexidade Temporal em Sequência Não Ordenada e Ordenada - Melhor e Pior Caso')
plt.legend()

plt.subplot(122)
plt.plot(tamanhos_arquivos, tempos_sequencial_nao_ordenado["Caso Intermediário"], marker='o',
         label='Sequencial Não Ordenado - Caso Intermediário')
plt.plot(tamanhos_arquivos, tempos_binaria_nao_ordenada["Caso Intermediário"], marker='o',
         label='Binária Não Ordenada - Caso Intermediário')
plt.plot(tamanhos_arquivos, tempos_sequencial_ordenado["Caso Intermediário"], marker='o',
         label='Sequencial Ordenado - Caso Intermediário')
plt.plot(tamanhos_arquivos, tempos_binaria_ordenada["Caso Intermediário"], marker='o',
         label='Binária Ordenada - Caso Intermediário')
plt.xlabel('Tamanho do Arquivo')
plt.ylabel('Tempo Médio de Execução')
plt.title('Complexidade Temporal em Sequência Não Ordenada e Ordenada - Caso Intermediário')
plt.legend()

plt.tight_layout()
plt.show()


In [None]:
import random
import pandas as pd
import package_complexidade.analise_complexidade as ac
import matplotlib.pyplot as plt
from package_pesquisa.pesquisa import pesquisa, pesquisa_binaria, pesquisa_sequencial_lista_ordenada
from package_ficheiros.ficheiros import gerar_arquivo_aleatorio, ordenar_arquivo
import sys

# Set the maximum recursion depth to a higher value (e.g., 5000)
sys.setrecursionlimit(100000)

# Tamanhos dos arquivos a serem testados
tamanhos_arquivos = [100, 1000]

# Número de passagens que deseja realizar
num_passagens = 2  # Pode ajustar o número de passagens desejado

# Dicionários para armazenar os tempos médios de cada passagem
tempos_passagens = {"Pesquisa Sequencial Não Ordenada": {"Melhor Caso": [[] for _ in range(num_passagens)],
                                                        "Pior Caso": [[] for _ in range(num_passagens)],
                                                        "Caso Intermediário": [[] for _ in range(num_passagens)]},
                   "Pesquisa Sequencial Ordenada": {"Melhor Caso": [[] for _ in range(num_passagens)],
                                                  "Pior Caso": [[] for _ in range(num_passagens)],
                                                  "Caso Intermediário": [[] for _ in range(num_passagens)]},
                   "Pesquisa Binária Não Ordenada": {"Melhor Caso": [[] for _ in range(num_passagens)],
                                                    "Pior Caso": [[] for _ in range(num_passagens)],
                                                    "Caso Intermediário": [[] for _ in range(num_passagens)]},
                   "Pesquisa Binária Ordenada": {"Melhor Caso": [[] for _ in range(num_passagens)],
                                                "Pior Caso": [[] for _ in range(num_passagens)],
                                                "Caso Intermediário": [[] for _ in range(num_passagens)]}}

for tamanho in tamanhos_arquivos:
    for passagem in range(num_passagens):
        arquivo_aleatorio = f'aleatorio_{tamanho}.txt'
        arquivo_ordenado = f'ordenado_{tamanho}.txt'

        gerar_arquivo_aleatorio(arquivo_aleatorio, tamanho)
        ordenar_arquivo(arquivo_aleatorio, arquivo_ordenado)

        df_aleatorio = pd.read_csv(arquivo_aleatorio, header=None, names=["Numero"])
        df_ordenado = pd.read_csv(arquivo_ordenado, header=None, names=["Numero"])

        item_melhor_caso = df_aleatorio["Numero"].iloc[0]  # Primeiro valor da lista
        item_pior_caso = df_aleatorio["Numero"].iloc[-1]  # Último valor da lista
        item_intermediario = df_aleatorio["Numero"].iloc[len(df_aleatorio) // 2]  # Valor aleatório da lista

        # Pesquisa Sequencial Não Ordenada
        _, tempo_medio_melhor_caso_sequencial, _ = ac.f_tempo(pesquisa, df_aleatorio["Numero"].tolist(), 2, item_melhor_caso)
        _, tempo_medio_pior_caso_sequencial, _ = ac.f_tempo(pesquisa, df_aleatorio["Numero"].tolist(), 2, item_pior_caso)
        _, tempo_medio_intermediario_sequencial, _ = ac.f_tempo(pesquisa, df_aleatorio["Numero"].tolist(), 2, item_intermediario)

        tempos_passagens["Pesquisa Sequencial Não Ordenada"]["Melhor Caso"][passagem].append(tempo_medio_melhor_caso_sequencial)
        tempos_passagens["Pesquisa Sequencial Não Ordenada"]["Pior Caso"][passagem].append(tempo_medio_pior_caso_sequencial)
        tempos_passagens["Pesquisa Sequencial Não Ordenada"]["Caso Intermediário"][passagem].append(tempo_medio_intermediario_sequencial)

        # Pesquisa Sequencial Ordenada
        _, tempo_medio_melhor_caso_sequencial_ordenado, _ = ac.f_tempo(pesquisa_sequencial_lista_ordenada, df_ordenado["Numero"], 2,
                                                                      item_melhor_caso)
        _, tempo_medio_pior_caso_sequencial_ordenado, _ = ac.f_tempo(pesquisa_sequencial_lista_ordenada, df_ordenado["Numero"],
                                                                     2, item_pior_caso)
        _, tempo_medio_intermediario_sequencial_ordenado, _ = ac.f_tempo(pesquisa_sequencial_lista_ordenada,
                                                                         df_ordenado["Numero"], 2, item_intermediario)

        tempos_passagens["Pesquisa Sequencial Ordenada"]["Melhor Caso"][passagem].append(tempo_medio_melhor_caso_sequencial_ordenado)
        tempos_passagens["Pesquisa Sequencial Ordenada"]["Pior Caso"][passagem].append(tempo_medio_pior_caso_sequencial_ordenado)
        tempos_passagens["Pesquisa Sequencial Ordenada"]["Caso Intermediário"][passagem].append(tempo_medio_intermediario_sequencial_ordenado)

        # Pesquisa Binária Não Ordenada
        _, tempo_medio_melhor_caso_binaria, _ = ac.f_tempo(pesquisa_binaria, df_aleatorio["Numero"], 2, item_melhor_caso)
        _, tempo_medio_pior_caso_binaria, _ = ac.f_tempo(pesquisa_binaria, df_aleatorio["Numero"], 2, item_pior_caso)
        _, tempo_medio_intermediario_binaria, _ = ac.f_tempo(pesquisa_binaria, df_aleatorio["Numero"], 2, item_intermediario)

        tempos_passagens["Pesquisa Binária Não Ordenada"]["Melhor Caso"][passagem].append(tempo_medio_melhor_caso_binaria)
        tempos_passagens["Pesquisa Binária Não Ordenada"]["Pior Caso"][passagem].append(tempo_medio_pior_caso_binaria)
        tempos_passagens["Pesquisa Binária Não Ordenada"]["Caso Intermediário"][passagem].append(tempo_medio_intermediario_binaria)

        # Pesquisa Binária Ordenada
        _, tempo_medio_melhor_caso_binaria_ordenada, _ = ac.f_tempo(pesquisa_binaria, df_ordenado["Numero"], 2, item_melhor_caso)
        _, tempo_medio_pior_caso_binaria_ordenada, _ = ac.f_tempo(pesquisa_binaria, df_ordenado["Numero"], 2, item_pior_caso)
        _, tempo_medio_intermediario_binaria_ordenada, _ = ac.f_tempo(pesquisa_binaria, df_ordenado["Numero"], 2,
                                                                       item_intermediario)

        tempos_passagens["Pesquisa Binária Ordenada"]["Melhor Caso"][passagem].append(tempo_medio_melhor_caso_binaria_ordenada)
        tempos_passagens["Pesquisa Binária Ordenada"]["Pior Caso"][passagem].append(tempo_medio_pior_caso_binaria_ordenada)
        tempos_passagens["Pesquisa Binária Ordenada"]["Caso Intermediário"][passagem].append(
            tempo_medio_intermediario_binaria_ordenada)

# Agora você tem os tempos de todas as passagens armazenados separadamente
# Pode realizar análises e comparações com esses tempos conforme necessário

# Plotagem dos gráficos
plt.figure(figsize=(12, 6))

plt.subplot(121)
for passagem in range(num_passagens):
    plt.plot(tamanhos_arquivos, tempos_passagens["Pesquisa Sequencial Não Ordenada"]["Melhor Caso"][passagem], marker='o',
             label=f'Passagem {passagem + 1} - Melhor Caso')
    plt.plot(tamanhos_arquivos, tempos_passagens["Pesquisa Binária Não Ordenada"]["Melhor Caso"][passagem], marker='o',
             label=f'Passagem {passagem + 1} - Melhor Caso')
    plt.plot(tamanhos_arquivos, tempos_passagens["Pesquisa Sequencial Ordenada"]["Melhor Caso"][passagem], marker='o',
             label=f'Passagem {passagem + 1} - Melhor Caso')
    plt.plot(tamanhos_arquivos, tempos_passagens["Pesquisa Binária Ordenada"]["Melhor Caso"][passagem], marker='o',
             label=f'Passagem {passagem + 1} - Melhor Caso')

plt.xlabel('Tamanho do Arquivo')
plt.ylabel('Tempo Médio de Execução')
plt.title('Complexidade Temporal - Melhor Caso')
plt.legend()

plt.subplot(122)
for passagem in range(num_passagens):
    plt.plot(tamanhos_arquivos, tempos_passagens["Pesquisa Sequencial Não Ordenada"]["Pior Caso"][passagem], marker='o',
             label=f'Passagem {passagem + 1} - Pior Caso')
    plt.plot(tamanhos_arquivos, tempos_passagens["Pesquisa Binária Não Ordenada"]["Pior Caso"][passagem], marker='o',
             label=f'Passagem {passagem + 1} - Pior Caso')
    plt.plot(tamanhos_arquivos, tempos_passagens["Pesquisa Sequencial Ordenada"]["Pior Caso"][passagem], marker='o',
             label=f'Passagem {passagem + 1} - Pior Caso')
    plt.plot(tamanhos_arquivos, tempos_passagens["Pesquisa Binária Ordenada"]["Pior Caso"][passagem], marker='o',
             label=f'Passagem {passagem + 1} - Pior Caso')

plt.xlabel('Tamanho do Arquivo')
plt.ylabel('Tempo Médio de Execução')
plt.title('Complexidade Temporal - Pior Caso')
plt.legend()

plt.tight_layout()
plt.show()
