In [1]:
def funcao_hash(chave, tamanho_tabela):
    # Soma os valores ASCII de cada caractere da chave
    soma = sum(ord(c) for c in chave)
    # Usa módulo para garantir que o índice esteja dentro dos limites da tabela
    indice = soma % tamanho_tabela
    return indice

# Exemplo de uso
chave = "Carlos"
tamanho = 10
indice_hash = funcao_hash(chave, tamanho)

print(f"Chave: {chave}")
print(f"Índice na tabela: {indice_hash}")

Chave: Carlos
Índice na tabela: 2


In [2]:
calc = ord('J') + ord('o') + ord('ã') + ord('o')
#calc = ord('C') + ord('a') + ord('r') + ord('l') + ord('o') + ord('s')

# 67 + 97 + 114 + 108 + 111 + 115 = 612

calc % tamanho

# 612 % 10 = 2

3

# Tabelas Hash

A estrutura de dados hash, ou tabela hash (em inglês hash table), é uma das estruturas mais eficientes para armazenar e acessar dados de forma rápida. Ela é amplamente utilizada quando há a necessidade de buscar, inserir ou deletar elementos com complexidade média constante $O(1)$, em condições ideais.

<img width="500" src="https://blog.pantuza.com/uploads/a90f6d24797c07ea242d55410b92ce5c8c8f4c79" />


Fonte: <a href="https://blog.pantuza.com/uploads/a90f6d24797c07ea242d55410b92ce5c8c8f4c79">https://blog.pantuza.com/uploads/a90f6d24797c07ea242d55410b92ce5c8c8f4c79</a>

## Conceitos Básicos

1. Hashing

  Hashing é o processo de converter uma entrada (chave) em um valor de tamanho fixo, geralmente um índice, que pode ser usado para localizar a entrada na tabela de hash. Isso é feito por meio de uma função hash.

2. Função Hash

  Uma função hash recebe uma chave e retorna um valor hash, que é usado como índice na tabela hash. A função hash deve distribuir as chaves uniformemente para evitar colisões.

3. Tamanho da Tabela

O tamanho da tabela hash afeta seu desempenho. Uma tabela muito pequena pode levar a muitas colisões, enquanto uma tabela muito grande desperdiça memória. A escolha do tamanho geralmente é um número primo para reduzir a probabilidade de colisões.

Operações Básicas

  - Inserção

  Para inserir um elemento, a chave é passada pela função hash para determinar o índice onde o valor será armazenado. Se ocorrer uma colisão, uma das estratégias de resolução de colisões é aplicada.

  - Busca

  Para buscar um elemento, a chave é novamente passada pela função hash para determinar o índice. Se houver uma colisão, a mesma estratégia de resolução de colisões usada na inserção é aplicada para localizar o elemento correto.

  - Remoção

  Para remover um elemento, a chave é usada para localizar o índice, e o elemento é removido. Em caso de colisão, a estratégia de resolução de colisões ajuda a encontrar o elemento correto para remoção.

4. Tratamento de Colisões

Uma colisão ocorre quando duas chaves diferentes produzem o mesmo valor hash. Existem várias estratégias para resolver colisões:

  <img width="500" src="https://blog.pantuza.com/uploads/9e933b61ada71f7368d8f7ac7e8450f4b25961cf" />


  - Fonte: <a href="https://blog.pantuza.com/uploads/9e933b61ada71f7368d8f7ac7e8450f4b25961cf">https://blog.pantuza.com/uploads/9e933b61ada71f7368d8f7ac7e8450f4b25961cf</a>





## Encadeamento (Chaining)

Encadeamento é uma estratégia para resolver colisões em uma tabela hash, onde cada posição da tabela contém uma estrutura de dados dinâmica (normalmente uma lista encadeada ou uma lista comum) que armazena todos os elementos que mapeiam para o mesmo índice.

Cada índice da tabela aponta para uma lista vinculada de entradas que têm o mesmo valor hash.
  

  <img width="500" src="https://media.geeksforgeeks.org/wp-content/uploads/chain-hashing-1.png" />


  - Fonte: <a href="https://media.geeksforgeeks.org/wp-content/uploads/chain-hashing-1.png"> https://media.geeksforgeeks.org/wp-content/uploads/chain-hashing-1.png </a>

  



In [3]:
# Exemplo Prático

# Função hash simples: retorna o índice baseado no tamanho da tabela
def hash_func(valor, tamanho_tabela):
    return valor % tamanho_tabela

# Classe da Tabela Hash com encadeamento
class TabelaHash:
    def __init__(self, tamanho):
        self.tamanho = tamanho
        self.tabela = [[] for _ in range(tamanho)]  # Cria uma lista de listas (encadeamento)

    # Método para inserir um valor na tabela
    def inserir(self, valor):
        indice = hash_func(valor, self.tamanho)  # Aplica a função hash
        if valor not in self.tabela[indice]:     # Evita inserção duplicada
            self.tabela[indice].append(valor)    # Adiciona o valor no índice correto (chaining)

    # Método para buscar um valor na tabela
    def buscar(self, valor):
        indice = hash_func(valor, self.tamanho)  # Calcula o índice
        return valor in self.tabela[indice]      # Retorna True se o valor está na lista desse índice

    # Método para remover um valor da tabela
    def remover(self, valor):
        indice = hash_func(valor, self.tamanho)  # Localiza o índice
        if valor in self.tabela[indice]:         # Se o valor existir na lista...
            self.tabela[indice].remove(valor)    # Remove o valor
            return True
        return False                             # Retorna False se o valor não foi encontrado

    # Método para exibir o conteúdo da tabela
    def mostrar(self):
        for i, lista in enumerate(self.tabela):
            print(f"Índice {i}: {lista}")

In [4]:
# Criar uma tabela com 5 posições
tabela = TabelaHash(5)

# Inserir valores
valores = [1, 6, 11, 2]
for v in valores:
    tabela.inserir(v)

# Mostrar a tabela
print("Tabela após inserções:")
tabela.mostrar()

# Buscar valores
print("\nBuscar 6:", tabela.buscar(6))    # Deve retornar True
print("Buscar 10:", tabela.buscar(10))    # Deve retornar False

# Remover valor
print("\nRemover 6:", tabela.remover(6))  # Deve retornar True
print("Remover 10:", tabela.remover(10))  # Deve retornar False

# Mostrar a tabela após remoção
print("\nTabela após remoções:")
tabela.mostrar()


Tabela após inserções:
Índice 0: []
Índice 1: [1, 6, 11]
Índice 2: [2]
Índice 3: []
Índice 4: []

Buscar 6: True
Buscar 10: False

Remover 6: True
Remover 10: False

Tabela após remoções:
Índice 0: []
Índice 1: [1, 11]
Índice 2: [2]
Índice 3: []
Índice 4: []


In [5]:
tabela.mostrar()

Índice 0: []
Índice 1: [1, 11]
Índice 2: [2]
Índice 3: []
Índice 4: []


## Sondagem Linear (Linear Probing)

Sondagem Linear (em inglês, Linear Probing) é uma técnica para resolver colisões em uma tabela hash aberta (sem encadeamento).

### Como funciona?

Quando ocorre uma colisão (ou seja, a posição calculada já está ocupada), a sondagem linear procura sequencialmente a próxima posição livre na tabela.

  - Se a posição h(k) estiver ocupada, tenta h(k) + 1, h(k) + 2, ..., até encontrar um espaço vazio.

  - Exemplo:
  
  Suponha uma tabela hash de tamanho 7 e a função h(k) = k % 7. Se uma colisão ocorrer, a próxima posição disponível na tabela é usada.

    - Inserindo os valores: 10, 17, 24, 5

    - 10 % 7 = 3 → posição 3:  livre → armazena 10

    - 17 % 7 = 3 → colisão em 3 → tenta 4:  livre → armazena 17

    - 24 % 7 = 3 → colisão em 3 → 4 (ocupado) → 5:  livre → armazena 24

    - 5 % 7 = 5 → colisão em 5 → 6:  livre → armazena 5



  <img width="500" src="https://media.geeksforgeeks.org/wp-content/uploads/Linear-Probing-1-1.jpg" />


  Fonte: <a href="https://media.geeksforgeeks.org/wp-content/uploads/Linear-Probing-1-1.jpg"> https://media.geeksforgeeks.org/wp-content/uploads/Linear-Probing-1-1.jpg </a>

  ## Exemplo prático:

In [6]:
# Classe que implementa tabela hash com sondagem linear
class TabelaHashLinear:
    def __init__(self, tamanho):
        self.tamanho = tamanho
        self.tabela = [None] * tamanho  # Inicializa a tabela com 'None'

    # Função hash básica: retorna o índice baseado no tamanho da tabela
    def hash(self, chave):
        return chave % self.tamanho

    # Método para inserir uma chave usando sondagem linear
    def inserir(self, chave):
        indice = self.hash(chave)  # Calcula o índice base

        # Tenta encontrar uma posição livre (sondagem linear)
        for i in range(self.tamanho):
            novo_indice = (indice + i) % self.tamanho  # Soma linear com wrap-around (tabela circular)
            if self.tabela[novo_indice] is None or self.tabela[novo_indice] == "REMOVIDO":
                self.tabela[novo_indice] = chave  # Insere a chave
                return True  # Inserção bem-sucedida

        return False  # Tabela cheia, não foi possível inserir

    # Método para buscar uma chave na tabela
    def buscar(self, chave):
        indice = self.hash(chave)  # Calcula o índice base

        # Percorre a tabela a partir do índice, com wrap-around
        for i in range(self.tamanho):
            novo_indice = (indice + i) % self.tamanho
            if self.tabela[novo_indice] is None:
                return False  # Parou porque encontrou espaço vazio (não está na tabela)
            if self.tabela[novo_indice] == chave:
                return True  # Encontrou a chave

        return False  # Chegou ao fim sem encontrar

    # Método para remover uma chave da tabela
    def remover(self, chave):
        indice = self.hash(chave)  # Calcula o índice base

        for i in range(self.tamanho):
            novo_indice = (indice + i) % self.tamanho
            if self.tabela[novo_indice] == chave:
                self.tabela[novo_indice] = "REMOVIDO"  # Marca como removido (não usa None para não quebrar a sondagem)
                return True  # Remoção bem-sucedida
            if self.tabela[novo_indice] is None:
                return False  # Se encontrar um espaço vazio, a chave não está na tabela

        return False  # Não encontrou a chave

    # Método para exibir o conteúdo da tabela
    def mostrar(self):
        for i, v in enumerate(self.tabela):
            print(f"Índice {i}: {v}")


In [7]:
tabela = TabelaHashLinear(7)

for valor in [10, 17, 24, 5]:
    tabela.inserir(valor)

print("\nTabela após inserção:")
tabela.mostrar()

print("\nBuscar 24:", tabela.buscar(24))  # True
print("Remover 24:", tabela.remover(24))  # True
print("Buscar 24 após remoção:", tabela.buscar(24))  # False

print("\nTabela final:")
tabela.mostrar()


Tabela após inserção:
Índice 0: None
Índice 1: None
Índice 2: None
Índice 3: 10
Índice 4: 17
Índice 5: 24
Índice 6: 5

Buscar 24: True
Remover 24: True
Buscar 24 após remoção: False

Tabela final:
Índice 0: None
Índice 1: None
Índice 2: None
Índice 3: 10
Índice 4: 17
Índice 5: REMOVIDO
Índice 6: 5



  

## Sondagem Quadrática (Quadratic Probing)

A sondagem quadrática é uma técnica de endereçamento aberto para resolver colisões em uma tabela hash.

Diferente da sondagem linear, que verifica posições consecutivas, a sondagem quadrática usa saltos com incrementos quadráticos para evitar agrupamento primário.

Similar à sondagem linear, mas o próximo índice é determinado por uma função quadrática.

### Fórmula do índice:
   
   Se a posição h(k) estiver ocupada, tenta-se:

   - (h(k) + 1²) % M  
   - (h(k) + 2²) % M  
   - (h(k) + 3²) % M  
   ... até encontrar um espaço livre.

  <img width="500" src="https://miro.medium.com/v2/resize:fit:720/format:webp/1*OTAsXpSiDdOqEzP_KrJPhw.jpeg" />


  Fonte: <a href="https://miro.medium.com/v2/resize:fit:720/format:webp/1*OTAsXpSiDdOqEzP_KrJPhw.jpeg">  https://miro.medium.com/v2/resize:fit:720/format:webp/1*OTAsXpSiDdOqEzP_KrJPhw.jpeg </a>

In [8]:
# Classe da Tabela Hash com Sondagem Quadrática
class TabelaHashQuadratica:
    def __init__(self, tamanho):
        self.tamanho = tamanho
        self.tabela = [None] * tamanho  # Inicializa a tabela com None

    # Função hash simples
    def hash(self, chave):
        return chave % self.tamanho

    # Método para inserir uma chave com sondagem quadrática
    def inserir(self, chave):
        indice = self.hash(chave)  # Índice base calculado pela função hash

        # Tenta encontrar uma posição livre com incrementos quadráticos
        for i in range(self.tamanho):
            novo_indice = (indice + i * i) % self.tamanho  # fórmula da sondagem quadrática

            if self.tabela[novo_indice] is None or self.tabela[novo_indice] == "REMOVIDO":
                self.tabela[novo_indice] = chave  # Insere a chave
                return True

        return False  # Tabela cheia, não foi possível inserir

    # Método para buscar uma chave
    def buscar(self, chave):
        indice = self.hash(chave)

        for i in range(self.tamanho):
            novo_indice = (indice + i * i) % self.tamanho

            if self.tabela[novo_indice] is None:
                return False  # Parou: não encontrou e chegou em espaço vazio
            if self.tabela[novo_indice] == chave:
                return True  # Encontrou a chave

        return False  # Não encontrou após todas as tentativas

    # Método para remover uma chave
    def remover(self, chave):
        indice = self.hash(chave)

        for i in range(self.tamanho):
            novo_indice = (indice + i * i) % self.tamanho

            if self.tabela[novo_indice] == chave:
                self.tabela[novo_indice] = "REMOVIDO"  # Marca como removido
                return True
            if self.tabela[novo_indice] is None:
                return False  # Parou: chave não está na tabela

        return False  # Não encontrou

    # Método para mostrar a tabela
    def mostrar(self):
        for i, v in enumerate(self.tabela):
            print(f"Índice {i}: {v}")


In [9]:
# Criar tabela com tamanho 7
tabela = TabelaHashQuadratica(7)

# Inserir valores
for valor in [10, 17, 24, 31]:
    tabela.inserir(valor)

print("\nTabela após inserções:")
tabela.mostrar()

# Buscar um valor
print("\nBuscar 24:", tabela.buscar(24))  # True

# Remover um valor
print("Remover 24:", tabela.remover(24))  # True

# Mostrar tabela após remoção
print("\nTabela após remoção:")
tabela.mostrar()



Tabela após inserções:
Índice 0: 24
Índice 1: None
Índice 2: None
Índice 3: 10
Índice 4: 17
Índice 5: 31
Índice 6: None

Buscar 24: True
Remover 24: True

Tabela após remoção:
Índice 0: REMOVIDO
Índice 1: None
Índice 2: None
Índice 3: 10
Índice 4: 17
Índice 5: 31
Índice 6: None


## Dupla Hashing (Double Hashing)

Dupla Hashing é uma técnica de endereçamento aberto que usa duas funções hash para resolver colisões.
É considerada uma das estratégias mais eficientes para reduzir agrupamentos em tabelas hash.

🧠 Como funciona?
Se h1(k) causar uma colisão, usa-se uma segunda função h2(k) para determinar o "passo" (offset) de sondagem:



$$novo\_indice=(h1(k)+i⋅h2(k)) \% M$$

 - $h1(k)$ → primeira função hash

 - $h2(k)$ → segunda função hash, não pode retornar 0

 - $i$ → número da tentativa (0, 1, 2, ...)

## Exemplo Visual:

  <img width="500" src=" https://courses.cs.washington.edu/courses/cse326/00wi/handouts/lecture16/img025.gif" />


  Fonte: <a href="https://courses.cs.washington.edu/courses/cse326/00wi/handouts/lecture16/img025.gif">  https://courses.cs.washington.edu/courses/cse326/00wi/handouts/lecture16/img025.gif </a>




In [10]:
# Classe TabelaHash com Dupla Hashing
class TabelaHashDupla:
    def __init__(self, tamanho):
        self.tamanho = tamanho
        self.tabela = [None] * tamanho

    # Primeira função hash
    def hash1(self, chave):
        return chave % self.tamanho

    # Segunda função hash — deve ser diferente de zero
    def hash2(self, chave):
        return 1 + (chave % (self.tamanho - 1))  # Garante passo ≠ 0

    # Inserção com dupla hashing
    def inserir(self, chave):
        indice1 = self.hash1(chave)
        passo = self.hash2(chave)

        # Tenta encontrar uma posição livre usando h1 + i*h2
        for i in range(self.tamanho):
            novo_indice = (indice1 + i * passo) % self.tamanho

            if self.tabela[novo_indice] is None or self.tabela[novo_indice] == "REMOVIDO":
                self.tabela[novo_indice] = chave
                return True

        return False  # Tabela cheia

    # Busca com dupla hashing
    def buscar(self, chave):
        indice1 = self.hash1(chave)
        passo = self.hash2(chave)

        for i in range(self.tamanho):
            novo_indice = (indice1 + i * passo) % self.tamanho

            if self.tabela[novo_indice] is None:
                return False  # Parou: valor não está
            if self.tabela[novo_indice] == chave:
                return True

        return False

    # Remoção com dupla hashing
    def remover(self, chave):
        indice1 = self.hash1(chave)
        passo = self.hash2(chave)

        for i in range(self.tamanho):
            novo_indice = (indice1 + i * passo) % self.tamanho

            if self.tabela[novo_indice] == chave:
                self.tabela[novo_indice] = "REMOVIDO"
                return True
            if self.tabela[novo_indice] is None:
                return False  # Parou: não está

        return False

    # Mostrar a tabela
    def mostrar(self):
        for i, valor in enumerate(self.tabela):
            print(f"Índice {i}: {valor}")


In [11]:
# Criando a tabela com tamanho primo (recomendado para double hashing)
tabela = TabelaHashDupla(7)

# Inserindo elementos
for valor in [10, 22, 31, 4, 15]:
    tabela.inserir(valor)

print("\nTabela após inserção:")
tabela.mostrar()

# Buscar e remover
print("\nBuscar 31:", tabela.buscar(31))  # True
print("Remover 31:", tabela.remover(31))  # True
print("Buscar 31:", tabela.buscar(31))    # False

print("\nTabela final:")
tabela.mostrar()



Tabela após inserção:
Índice 0: None
Índice 1: 22
Índice 2: 15
Índice 3: 10
Índice 4: 4
Índice 5: 31
Índice 6: None

Buscar 31: True
Remover 31: True
Buscar 31: False

Tabela final:
Índice 0: None
Índice 1: 22
Índice 2: 15
Índice 3: 10
Índice 4: 4
Índice 5: REMOVIDO
Índice 6: None




## Vantagens e Desvantagens

### Vantagens

Velocidade: As operações de inserção, busca e remoção geralmente têm complexidade $O$(1).
- Facilidade de Implementação: Tabelas hash são relativamente fáceis de implementar e usar.

### Desvantagens

- Colisões: A resolução de colisões pode aumentar a complexidade e afetar o desempenho.
- Uso de Memória: Pode haver desperdício de memória se a tabela for muito grande.
- Não Ordenada: Os elementos não são armazenados de forma ordenada, o que pode ser uma limitação em alguns casos.

### Exemplos de Uso
- Tabelas de símbolos em compiladores
- Implementação de dicionários em linguagens de programação
- Armazenamento em cache para acesso rápido a dados.


# Exercícios

1. Adicione um método à classe HashTableChaining para contar quantos elementos estão presentes em cada lista de encadeamento.

2. Altere o hash do algoritmo LinearProbingHashTable, para o metodo da mulplicação abaixo mencionado. Moste o resultado da tabela de hash após a inserção dos valores da lista (10,15,0,8,19,26,14,21).

3. Implemente uma função para medir o tempo de execução dos algoritmos:

  a) Sondagem Linear

  b) Sondagem Quadrática

  c) Dupla Hashing

  Faça a inserção de 100 elementos aleatórios sem repetições.



In [12]:
def hash_multiplicação(key,size):
    # Método de multiplicação
    A = 0.3
    # A = 0.6180339887  # Constante de multiplicação (cerca de (sqrt(5) - 1) / 2)
    hash_value = hash(key)
    return int(size * ((hash_value * A) % 1))

hash_multiplicação(2,10)

6

# Funções Úteis

In [13]:
# Encontrar o valor primo
import numpy as np

def primos_ate_n(n):
    if n < 2:
        return np.array([])

    primos = np.ones(n+1, dtype=bool)
    primos[:2] = False

    for i in range(2, int(n**0.5) + 1):
        if primos[i]:
            primos[i*i : n+1 : i] = False

    return np.nonzero(primos)[0]

def primo_acima(valor, limite=10000):
    primos = primos_ate_n(limite)

    # Busca o menor primo >= valor
    idx = np.searchsorted(primos, valor, side='left')

    if idx < len(primos):
        return primos[idx]
    else:
        return None  # Não há primo no intervalo

In [14]:
# Exemplo prático para criar uma tabela hash de contatos
class ContactHashTable:
    def __init__(self, size=10):
        self.size = size
        self.table = [[] for _ in range(size)]

    def _hash(self, key):
        return hash(key) % self.size

    def insert(self, name, phone, email):
        hash_index = self._hash(name)
        for item in self.table[hash_index]:
            if item[0] == name:
                print(item[0])
                item[1] = phone
                item[2] = email
                return
        self.table[hash_index].append([name, phone, email])

    def get(self, name):
        hash_index = self._hash(name)
        for item in self.table[hash_index]:
            if item[0] == name:
                return {"name": item[0], "phone": item[1], "email": item[2]}
        return None

    def remove(self, name):
        hash_index = self._hash(name)
        for index, item in enumerate(self.table[hash_index]):
            if item[0] == name:
                del self.table[hash_index][index]
                return True
        return False

    def __str__(self):
        return str(self.table)

# Exemplo de uso
contacts = ContactHashTable()

# Inserir contatos
contacts.insert("Alice", "123-456-7890", "alice@example.com")
contacts.insert("Bob", "987-654-3210", "bob@example.com")
contacts.insert("Charlie", "555-555-5555", "charlie@example.com")
contacts.insert("Charlie", "555-555-5556", "charlie@example.com.br")

# Obter contatos
print(contacts.get("Alice"))    # Output: {'name': 'Alice', 'phone': '123-456-7890', 'email': 'alice@example.com'}
print(contacts.get("Bob"))      # Output: {'name': 'Bob', 'phone': '987-654-3210', 'email': 'bob@example.com'}
print(contacts.get("Charlie"))  # Output: {'name': 'Charlie', 'phone': '555-555-5555', 'email': 'charlie@example.com'}

# Remover um contato
contacts.remove("Bob")

# Tentar obter o contato removido
print(contacts.get("Bob"))  # Output: None

# Mostrar a tabela hash
print(contacts)  # Output: Tabela hash com os contatos restantes


Charlie
{'name': 'Alice', 'phone': '123-456-7890', 'email': 'alice@example.com'}
{'name': 'Bob', 'phone': '987-654-3210', 'email': 'bob@example.com'}
{'name': 'Charlie', 'phone': '555-555-5556', 'email': 'charlie@example.com.br'}
None
[[], [], [], [], [], [], [], [], [['Charlie', '555-555-5556', 'charlie@example.com.br']], [['Alice', '123-456-7890', 'alice@example.com']]]
