Você tem uma lista de 1 milhão de registros de usuários. Implemente um sistema de busca eficiente que permita consultar por: ID, email ou nome.

 - Criar 3 índices (dicionários) para acesso O(1)
 - Função buscar_usuario(criterio, valor) que use o índice correto
 - Comparar performance: busca com índice vs busca linear

Arquivo .py com código + benchmarks

In [None]:
usuarios = [
    {"id": 1, "email": "alice.silva@email.com", "nome": "Alice Silva"},
    {"id": 2, "email": "bruno.souza@email.com", "nome": "Bruno Souza"},
    {"id": 3, "email": "carla.mello@email.com", "nome": "Carla Mello"},
    {"id": 4, "email": "daniel.pereira@email.com", "nome": "Daniel Pereira"},
    {"id": 5, "email": "elisa.santos@email.com", "nome": "Elisa Santos"},
    {"id": 6, "email": "fabio.gomes@email.com", "nome": "Fabio Gomes"},
    {"id": 7, "email": "gabriela.costa@email.com", "nome": "Gabriela Costa"},
    {"id": 8, "email": "henrique.oliveira@email.com", "nome": "Henrique Oliveira"},
    {"id": 9, "email": "isabela.lima@email.com", "nome": "Isabela Lima"},
    {"id": 10, "email": "joao.rodrigues@email.com", "nome": "João Rodrigues"},
    {"id": 11, "email": "karina.ramos@email.com", "nome": "Karina Ramos"},
    {"id": 12, "email": "lucas.almeida@email.com", "nome": "Lucas Almeida"},
    {"id": 13, "email": "marina.azevedo@email.com", "nome": "Marina Azevedo"},
    {"id": 14, "email": "natalia.ferreira@email.com", "nome": "Natália Ferreira"},
    {"id": 15, "email": "otavio.martins@email.com", "nome": "Otavio Martins"},
    {"id": 16, "email": "paula.cardoso@email.com", "nome": "Paula Cardoso"},
    {"id": 17, "email": "rafael.barros@email.com", "nome": "Rafael Barros"},
    {"id": 18, "email": "sabrina.teixeira@email.com", "nome": "Sabrina Teixeira"},
    {"id": 19, "email": "thiago.monteiro@email.com", "nome": "Thiago Monteiro"},
    {"id": 20, "email": "ursula.vieira@email.com", "nome": "Ursula Vieira"},
    {"id": 21, "email": "victor.cunha@email.com", "nome": "Victor Cunha"},
    {"id": 22, "email": "wilson.morais@email.com", "nome": "Wilson Morais"},
    {"id": 23, "email": "xuxa.amorim@email.com", "nome": "Xuxa Amorim"},
    {"id": 24, "email": "yasmin.pinto@email.com", "nome": "Yasmin Pinto"},
    {"id": 25, "email": "zeca.magalhaes@email.com", "nome": "Zeca Magalhães"},
    {"id": 26, "email": "aline.freitas@email.com", "nome": "Aline Freitas"},
    {"id": 27, "email": "beto.araujo@email.com", "nome": "Beto Araújo"},
    {"id": 28, "email": "clarice.lopes@email.com", "nome": "Clarice Lopes"},
    {"id": 29, "email": "davi.queiroz@email.com", "nome": "Davi Queiroz"},
    {"id": 30, "email": "emily.castro@email.com", "nome": "Emily Castro"},
]

In [None]:
# Essa linha cria um dicionário chamado "ids" onde a chave é o id do usuário e o valor é o próprio dicionário do usuário.
# Assim, podemos buscar rapidamente um usuário pelo seu id: ids[5] retorna o usuário com id 5.
ids = {u["id"]: u for u in usuarios}
emails = {u["email"]: u for u in usuarios}
nomes = {u["nome"]: u for u in usuarios}

obs: Os dois-pontos : em um dicionário por compreensão ({chave:valor for ...}) separam a chave do valor em cada item criado no dicionário.

In [None]:
def buscar_usuario(key:str, value):
    if key == "id":
        return ids[value]
    elif key == "email":
        return emails[value]
    elif key == "nome":
        return nomes[value]

    raise ValueError(f"Usuário com {key}={value} não encontrado.")

In [40]:
buscar_usuario("nome", "Beto Araújo")

{'id': 27, 'email': 'beto.araujo@email.com', 'nome': 'Beto Araújo'}

In [42]:
import time

def buscar_usuario_linear(key: str, value):
    for usuario in usuarios:
        if usuario[key] == value:
            return usuario
    raise ValueError(f"Usuário com {key}={value} não encontrado.")

# Benchmark das duas funções
key = "nome"
value = "Beto Araújo"

# Benchmark busca em dicionário (O(1))
start = time.time()
for _ in range(1000000): # emular uma busca de 1000000 registros
    buscar_usuario(key, value)
end = time.time()
print(f"Tempo busca O(1) dicionários: {end - start:.6f} segundos")

# Benchmark busca linear (O(n))
start = time.time()
for _ in range(1000000):
    buscar_usuario_linear(key, value)
end = time.time()
print(f"Tempo busca O(n) linear: {end - start:.6f} segundos")


Tempo busca O(1) dicionários: 0.054723 segundos
Tempo busca O(n) linear: 0.302145 segundos
