# Aluno: Bruno Felipe de Souza Araujo
# Exerc: Comparação de desempenho de programas

In [1]:
import timeit
import random

# Criando uma lista grande de números aleatórios (entre 1 e 100.000)
random_numbers = [random.randint(1, 100000) for _ in range(1_000_000)]

In [2]:
# Abordagem ingênua: Usando laços for e verificações manuais
# Abordagem 1: Usando loops para garantir números únicos antes da soma

def sum_unique_slow(numbers):
    unique_numbers = []
    for num in numbers:
        if num not in unique_numbers:
            unique_numbers.append(num)
    return sum(unique_numbers)

In [3]:
# Abordagem otimizada: Usando set() para eliminar duplicatas antes de somar
# Abordagem 2: Usando set() para eliminar duplicatas rapidamente

def sum_unique_fast(numbers):
 return sum(set(numbers))


In [4]:
# Medindo o tempo de execução das duas abordagens
slow_time = timeit.timeit(lambda: sum_unique_slow(random_numbers), number=1)
fast_time = timeit.timeit(lambda: sum_unique_fast(random_numbers), number=1)

In [5]:
# Exibindo os resultados
print(f"Tempo de execução - Abordagem lenta: {slow_time:.4f} segundos")
print(f"Tempo de execução - Abordagem rápida: {fast_time:.4f} segundos")

Tempo de execução - Abordagem lenta: 936.3456 segundos
Tempo de execução - Abordagem rápida: 0.1086 segundos


In [6]:
# Comparação
print(f"A abordagem otimizada foi aproximadamente {slow_time / fast_time:.2f} vezes mais rápida.")

A abordagem otimizada foi aproximadamente 8624.60 vezes mais rápida.


# Modificação da abordagem ingênua para otimização sem o uso de set()

In [7]:
def sum_unique_optimized(numbers):
    unique_numbers = {}
    for num in numbers:
        unique_numbers[num] = True
    return sum(unique_numbers.keys())

In [8]:
# Medindo o tempo de execução da abordagem otimizada e abordagem com set()
slow_time = timeit.timeit(lambda: sum_unique_optimized(random_numbers), number=1)
fast_time = timeit.timeit(lambda: sum_unique_fast(random_numbers), number=1)

In [9]:
# Exibindo os resultados
print(f"Tempo de execução - Abordagem lenta otimizada: {slow_time:.4f} segundos")
print(f"Tempo de execução - Abordagem rápida: {fast_time:.4f} segundos")

Tempo de execução - Abordagem lenta otimizada: 0.2890 segundos
Tempo de execução - Abordagem rápida: 0.1337 segundos


# Outras implementações para estudo e comparações de tempos

In [None]:
import bisect
from collections import Counter
from collections import defaultdict
from itertools import groupby

# Abordagem com Lista Ordenada e bisect (O(n log n))
def sum_unique_bisect(numbers):
    unique_numbers = []
    for num in numbers:
        index = bisect.bisect_left(unique_numbers, num)
        if index == len(unique_numbers) or unique_numbers[index] != num:
            bisect.insort(unique_numbers, num)
    return sum(unique_numbers)

# Abordagem com Counter (O(n))
def sum_unique_counter(numbers):
    return sum(Counter(numbers).keys())

# Usando defaultdict (O(n))
def sum_unique_defaultdict(numbers):
    unique_numbers = defaultdict(bool)
    for num in numbers:
        unique_numbers[num] = True
    return sum(unique_numbers.keys())

# Usando sorted() e groupby (O(n log n))
def sum_unique_groupby(numbers):
    return sum(k for k, _ in groupby(sorted(numbers)))

# Algoritmo de Troca no Próprio Array (O(n log n), Menos Memória)
def sum_unique_inplace(numbers):
    numbers.sort()
    unique_sum = numbers[0]

    for i in range(1, len(numbers)):
        if numbers[i] != numbers[i - 1]:
            unique_sum += numbers[i]

    return unique_sum

# Usando Filtragem filter() e dict.fromkeys() (O(n))
def sum_unique_fromkeys(numbers):
    return sum(dict.fromkeys(numbers))

In [16]:
# Gerando uma lista de números aleatórios grandes
numbers = [random.randint(1, 100000) for _ in range(1_000_000)]

# Medindo tempos de execução
print("Original (O(n²)):", f"{timeit.timeit(lambda: sum_unique_slow(numbers), number=1):.4f}")
print("Otimizada com dict (O(n)):", f"{timeit.timeit(lambda: sum_unique_optimized(numbers), number=1):.4f}")
print("Ordenada + bisect (O(n log n)):", f"{timeit.timeit(lambda: sum_unique_bisect(numbers), number=1):.4f}")
print("Com Counter (O(n)):", f"{timeit.timeit(lambda: sum_unique_counter(numbers), number=1):.4f}")
print("Usando defaultdict (O(n)):", f"{timeit.timeit(lambda: sum_unique_counter(numbers), number=1):.4f}")
print("Usando sorted() e groupby (O(n log n)):", f"{timeit.timeit(lambda: sum_unique_counter(numbers), number=1):.4f}")
print("Troca no Próprio Array (O(n log n):", f"{timeit.timeit(lambda: sum_unique_counter(numbers), number=1):.4f}")
print("Usando Filtragem filter() e dict.fromkeys() (O(n)):", f"{timeit.timeit(lambda: sum_unique_counter(numbers), number=1):.4f}")

Original (O(n²)): 919.2476
Otimizada com dict (O(n)): 0.2047
Ordenada + bisect (O(n log n)): 3.5582
Com Counter (O(n)): 0.2307
Usando defaultdict (O(n)): 0.2297
Usando sorted() e groupby (O(n log n)): 0.2278
Troca no Próprio Array (O(n log n): 0.2438
Usando Filtragem filter() e dict.fromkeys() (O(n)): 0.2306


# Estudo funcionamento de Set()

In [17]:
# 1-Criar um conjunto e remover duplicatas:
numeros = [1, 2, 3, 3, 4, 5, 5, 6]
conjunto = set(numeros) # Converte a lista em um conjunto
print(conjunto) # Saída: {1, 2, 3, 4, 5, 6}

{1, 2, 3, 4, 5, 6}


In [18]:
# 2- Verificar se um elemento está no conjunto:
print(3 in conjunto) # Saída: True
print(10 in conjunto) # Saída: False

True
False


In [19]:
# 3-Adicionar e remover elementos
conjunto.add(7) # Adiciona um novo elemento
conjunto.remove(2) # Remove um elemento existente
print(conjunto) # Saída: {1, 3, 4, 5, 6, 7}

{1, 3, 4, 5, 6, 7}


In [20]:
# 4-Operações entre conjuntos
A = {1, 2, 3, 4}
B = {3, 4, 5, 6}
print(A | B) # União: {1, 2, 3, 4, 5, 6}
print(A & B) # Interseção: {3, 4}
print(A - B) # Diferença: {1, 2} (elementos de A que não estão em B)
print(A ^ B) # Diferença simétrica: {1, 2, 5, 6} (elementos que estão em um dos conjuntos, mas não em ambos)

{1, 2, 3, 4, 5, 6}
{3, 4}
{1, 2}
{1, 2, 5, 6}
