# Informação Adicional

Para calcular o intervalo de confiança de 95%, utilizamos a distribuição \( t \)-Student, apropriada para amostras com tamanho pequeno ou quando a variância populacional é desconhecida. A fórmula da margem de erro é:

$
\text{Margem de erro} = t_{0.975} \cdot \frac{\text{Desvio Padrão}}{\sqrt{n}}
$

Onde:
- $t_{0.975}$ é o valor crítico da distribuição \( t \)-Student para 95% de confiança, considerando \( n - 1 \) graus de liberdade.
- Desvio Padrão ($\sigma$) mede a variabilidade dos tempos de execução.
- \( n \) é o número de execuções realizadas para o tamanho do vetor.

O intervalo de confiança final é definido como:

$
\text{Intervalo de confiança} = \text{Média} \pm \text{Margem de erro}
$

Isso significa que, com 95% de confiança, o valor verdadeiro da média está dentro desse intervalo.


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from time import time
from scipy.stats import t

# Funções fake para simular os algoritmos
def solver_closest(arr):
    # Simula a execução de um algoritmo (substituir pelo algoritmo real)
    return sorted(arr)[0]

def solver_kth_largest(arr, k):
    # Simula a execução de um algoritmo (substituir pelo algoritmo real)
    return sorted(arr, reverse=True)[k-1]

# Configurações
np.random.seed(42)
N = 100000  # Tamanho máximo do vetor
steps = 10  # Número de tamanhos de vetor a testar
executions_per_size = 5  # Número de execuções por tamanho de vetor

# Tamanhos dos vetores a testar
vector_sizes = np.linspace(100, N, steps, dtype=int)

# Preparação para coleta de dados
results_closest = []
results_kth_largest = []
confidence_intervals_closest = []
confidence_intervals_kth_largest = []

# Testar os algoritmos
for size in vector_sizes:
    times_closest = []
    times_kth_largest = []

    for _ in range(executions_per_size):
        data = np.random.randint(0, 1000, size)

        # Medir tempo para solver_closest
        start = time()
        solver_closest(data)
        times_closest.append(time() - start)

        # Medir tempo para solver_kth_largest
        start = time()
        solver_kth_largest(data, k=5)
        times_kth_largest.append(time() - start)

    # Calcular médias e intervalos de confiança (95%)
    mean_closest = np.mean(times_closest)
    mean_kth_largest = np.mean(times_kth_largest)
    std_closest = np.std(times_closest, ddof=1)
    std_kth_largest = np.std(times_kth_largest, ddof=1)
    ci_closest = t.ppf(0.975, executions_per_size-1) * (std_closest / np.sqrt(executions_per_size))
    ci_kth_largest = t.ppf(0.975, executions_per_size-1) * (std_kth_largest / np.sqrt(executions_per_size))

    results_closest.append(mean_closest)
    results_kth_largest.append(mean_kth_largest)
    confidence_intervals_closest.append(ci_closest)
    confidence_intervals_kth_largest.append(ci_kth_largest)

# Gerar gráfico
plt.figure(figsize=(12, 6))
plt.errorbar(vector_sizes, results_closest, yerr=confidence_intervals_closest, label='Solver Closest', fmt='-o')
plt.errorbar(vector_sizes, results_kth_largest, yerr=confidence_intervals_kth_largest, label='Solver Kth Largest', fmt='-o')
plt.xlabel('Tamanho do vetor')
plt.ylabel('Tempo médio (s)')
plt.title('Desempenho dos algoritmos')
plt.legend()
plt.grid(True)
plt.show()