# Bloom Filter em Python

In [1]:
import hashlib


class BloomFilter:
    def __init__(self, tamanho=1000, num_hashes=3):
        self.tamanho = tamanho
        self.num_hashes = num_hashes
        self.bits = [0] * tamanho

    def _hashes(self, item):
        for i in range(self.num_hashes):
            hash_input = f"{item}-{i}".encode()
            digest = hashlib.sha256(hash_input).hexdigest()
            yield int(digest, 16) % self.tamanho

    def adicionar(self, item):
        for posicao in self._hashes(item):
            self.bits[posicao] = 1

    def contem(self, item):
        return all(self.bits[posicao] == 1 for posicao in self._hashes(item))

In [2]:
bloom = BloomFilter(tamanho=5000, num_hashes=4)

### Simulando usernames já cadastrados

In [3]:
usuarios_existentes = ["alice", "bob", "carol"]

for usuario in usuarios_existentes:
    bloom.adicionar(usuario)

### Verificações

- True (provavelmente existe)

In [4]:
print(bloom.contem("alice"))

True


- True (provavelmente existe)

In [5]:
print(bloom.contem("bob"))

True


- False (com certeza não existe)

In [6]:
print(bloom.contem("dave"))

False
