# Tabelas Hash

Tabelas hash são estruturas de dados que fornecem uma maneira eficiente de armazenar e recuperar dados de forma rápida, usando uma técnica de hashing.

## Conceitos Básicos

1. Hashing

  Hashing é o processo de converter uma entrada (chave) em um valor de tamanho fixo, geralmente um índice, que pode ser usado para localizar a entrada na tabela de hash. Isso é feito por meio de uma função hash.

2. Função Hash

  Uma função hash recebe uma chave e retorna um valor hash, que é usado como índice na tabela hash. A função hash deve distribuir as chaves uniformemente para evitar colisões.

3. Colisão

  Uma colisão ocorre quando duas chaves diferentes produzem o mesmo valor hash. Existem várias estratégias para resolver colisões:

  - Encadeamento (Chaining): Cada índice da tabela aponta para uma lista vinculada de entradas que têm o mesmo valor hash.
  - Sondagem Linear (Linear Probing): Se uma colisão ocorrer, a próxima posição disponível na tabela é usada.
  - Sondagem Quadrática (Quadratic Probing): Similar à sondagem linear, mas o próximo índice é determinado por uma função quadrática.
  - Dupla Hashing (Double Hashing): Usa uma segunda função hash para determinar a distância do próximo índice em caso de colisão.

4. Tamanho da Tabela

O tamanho da tabela hash afeta seu desempenho. Uma tabela muito pequena pode levar a muitas colisões, enquanto uma tabela muito grande desperdiça memória. A escolha do tamanho geralmente é um número primo para reduzir a probabilidade de colisões.

Operações Básicas
1. Inserção
Para inserir um elemento, a chave é passada pela função hash para determinar o índice onde o valor será armazenado. Se ocorrer uma colisão, uma das estratégias de resolução de colisões é aplicada.

2. Busca
Para buscar um elemento, a chave é novamente passada pela função hash para determinar o índice. Se houver uma colisão, a mesma estratégia de resolução de colisões usada na inserção é aplicada para localizar o elemento correto.

3. Remoção
Para remover um elemento, a chave é usada para localizar o índice, e o elemento é removido. Em caso de colisão, a estratégia de resolução de colisões ajuda a encontrar o elemento correto para remoção.

## Vantagens e Desvantagens

### Vantagens
Velocidade: As operações de inserção, busca e remoção geralmente têm complexidade $O$(1).
- Facilidade de Implementação: Tabelas hash são relativamente fáceis de implementar e usar.

### Desvantagens

- Colisões: A resolução de colisões pode aumentar a complexidade e afetar o desempenho.
- Uso de Memória: Pode haver desperdício de memória se a tabela for muito grande.
- Não Ordenada: Os elementos não são armazenados de forma ordenada, o que pode ser uma limitação em alguns casos.

### Exemplos de Uso
- Tabelas de símbolos em compiladores
- Implementação de dicionários em linguagens de programação
- Armazenamento em cache para acesso rápido a dados.



## Exemplos:



In [None]:
# método de encadeamento (chaining)
class HashTableChaining:
    def __init__(self, size=10):
        self.size = size
        self.table = [[] for _ in range(size)]

    def _hash(self, key):
        return hash(key) % self.size

    def insert(self, key, value):
        hash_index = self._hash(key)
        for item in self.table[hash_index]:
            if item[0] == key:
                item[1] = value
                return
        self.table[hash_index].append([key, value])

    def get(self, key):
        hash_index = self._hash(key)
        for item in self.table[hash_index]:
            if item[0] == key:
                return item[1]
        return None

    def remove(self, key):
        hash_index = self._hash(key)
        for index, item in enumerate(self.table[hash_index]):
            if item[0] == key:
                del self.table[hash_index][index]
                return True
        return False

    def __str__(self):
        return str(self.table)

# Exemplo de uso
hash_table = HashTableChaining()

# Inserir elementos
hash_table.insert(1, "1") # 1 % 10 = 1
print(hash_table)
hash_table.insert(9, "9") # 9 % 10 = 9
print(hash_table)
hash_table.insert(18, "18") # 18 % 10 = 8
print(hash_table)
hash_table.insert(2, "2")  # 2 % 10 = 2
print(hash_table)
hash_table.insert(3, "3") # 3 % 10 = 3
print(hash_table)
hash_table.insert(4, "4") # 4 % 10 = 4
print(hash_table)
hash_table.insert(10, "10") # 10 % 10 = 0
print(hash_table)
hash_table.insert(28, "28") # 28 % 10 = 8
print(hash_table)



# Obter elementos
# print(hash_table.get(1))  # Output: 1
# print(hash_table.get(2))  # Output: 2
# print(hash_table.get(3))  # Output: 3

# Remover um elemento
#hash_table.remove("2")

# Tentar obter o elemento removido
#print(hash_table.get("2"))  # Output: None

# Mostrar a tabela hash
print(hash_table)  # Output: Tabela hash com os elementos restantes


[[], [[1, '1']], [], [], [], [], [], [], [], []]
[[], [[1, '1']], [], [], [], [], [], [], [], [[9, '9']]]
[[], [[1, '1']], [], [], [], [], [], [], [[18, '18']], [[9, '9']]]
[[], [[1, '1']], [[2, '2']], [], [], [], [], [], [[18, '18']], [[9, '9']]]
[[], [[1, '1']], [[2, '2']], [[3, '3']], [], [], [], [], [[18, '18']], [[9, '9']]]
[[], [[1, '1']], [[2, '2']], [[3, '3']], [[4, '4']], [], [], [], [[18, '18']], [[9, '9']]]
[[[10, '10']], [[1, '1']], [[2, '2']], [[3, '3']], [[4, '4']], [], [], [], [[18, '18']], [[9, '9']]]
[[[10, '10']], [[1, '1']], [[2, '2']], [[3, '3']], [[4, '4']], [], [], [], [[18, '18'], [28, '28']], [[9, '9']]]
[[[10, '10']], [[1, '1']], [[2, '2']], [[3, '3']], [[4, '4']], [], [], [], [[18, '18'], [28, '28']], [[9, '9']]]


In [None]:
# Exemplo prático para criar uma tabela hash de contatos
class ContactHashTable:
    def __init__(self, size=10):
        self.size = size
        self.table = [[] for _ in range(size)]

    def _hash(self, key):
        return hash(key) % self.size

    def insert(self, name, phone, email):
        hash_index = self._hash(name)
        for item in self.table[hash_index]:
            if item[0] == name:
                print(item[0])
                item[1] = phone
                item[2] = email
                return
        self.table[hash_index].append([name, phone, email])

    def get(self, name):
        hash_index = self._hash(name)
        for item in self.table[hash_index]:
            if item[0] == name:
                return {"name": item[0], "phone": item[1], "email": item[2]}
        return None

    def remove(self, name):
        hash_index = self._hash(name)
        for index, item in enumerate(self.table[hash_index]):
            if item[0] == name:
                del self.table[hash_index][index]
                return True
        return False

    def __str__(self):
        return str(self.table)

# Exemplo de uso
contacts = ContactHashTable()

# Inserir contatos
contacts.insert("Alice", "123-456-7890", "alice@example.com")
contacts.insert("Bob", "987-654-3210", "bob@example.com")
contacts.insert("Charlie", "555-555-5555", "charlie@example.com")
contacts.insert("Charlie", "555-555-5556", "charlie@example.com.br")

# Obter contatos
print(contacts.get("Alice"))    # Output: {'name': 'Alice', 'phone': '123-456-7890', 'email': 'alice@example.com'}
print(contacts.get("Bob"))      # Output: {'name': 'Bob', 'phone': '987-654-3210', 'email': 'bob@example.com'}
print(contacts.get("Charlie"))  # Output: {'name': 'Charlie', 'phone': '555-555-5555', 'email': 'charlie@example.com'}

# Remover um contato
contacts.remove("Bob")

# Tentar obter o contato removido
print(contacts.get("Bob"))  # Output: None

# Mostrar a tabela hash
print(contacts)  # Output: Tabela hash com os contatos restantes


Charlie
{'name': 'Alice', 'phone': '123-456-7890', 'email': 'alice@example.com'}
{'name': 'Bob', 'phone': '987-654-3210', 'email': 'bob@example.com'}
{'name': 'Charlie', 'phone': '555-555-5556', 'email': 'charlie@example.com.br'}
None
[[], [['Charlie', '555-555-5556', 'charlie@example.com.br']], [], [], [['Alice', '123-456-7890', 'alice@example.com']], [], [], [], [], []]


In [None]:
hash('Alice')%10

4

## Técnica de Sondagem Linear (linear probing)

A técnica de sondagem linear (linear probing) é uma maneira de resolver colisões em uma tabela hash. Em vez de usar listas ligadas, como no encadeamento, a sondagem linear resolve colisões procurando a próxima posição disponível na tabela.

In [None]:
# Divisão
class LinearProbingHashTable:
    def __init__(self, size=12):
        self.size = size
        self.table = [None] * size

    def _hash(self, key):
        # Função hash utilizando o operador módulo (resto da divisão)
        return hash(key) % self.size

    def insert(self, key, value):
        hash_index = self._hash(key)
        original_index = hash_index
        while self.table[hash_index] is not None and self.table[hash_index][0] != key:
            hash_index = (hash_index + 1) % self.size
            if hash_index == original_index:
                raise Exception("Hash table is full")
        self.table[hash_index] = (key, value)

    def get(self, key):
        hash_index = self._hash(key)
        original_index = hash_index
        while self.table[hash_index] is not None:
            if self.table[hash_index][0] == key:
                return self.table[hash_index][1]
            hash_index = (hash_index + 1) % self.size
            if hash_index == original_index:
                break
        return None

    def remove(self, key):
        hash_index = self._hash(key)
        original_index = hash_index
        while self.table[hash_index] is not None:
            if self.table[hash_index][0] == key:
                self.table[hash_index] = None
                # Reorganiza a tabela após a remoção para evitar buracos
                self._rehash_from(hash_index)
                return True
            hash_index = (hash_index + 1) % self.size
            if hash_index == original_index:
                break
        return False

    def _rehash_from(self, start_index):
        index = (start_index + 1) % self.size
        while self.table[index] is not None:
            key, value = self.table[index]
            self.table[index] = None
            self.insert(key, value)
            index = (index + 1) % self.size

    def __str__(self):
        return str(self.table)

# Exemplo de uso
hash_table = LinearProbingHashTable()

# Inserir elementos

hash_table.insert(10, 10) # 10 % 12 = 10
print(hash_table)
hash_table.insert(15, 15) # 15 % 12 = 3
print(hash_table)
hash_table.insert(0, 0) # 0 % 12 = 0
print(hash_table)
hash_table.insert(8, 8) # 8 % 12 = 8
print(hash_table)
hash_table.insert(19, 19) # 19 % 12 = 7
print(hash_table)
hash_table.insert(26, 26) # 26 % 12 = 2
print(hash_table)
hash_table.insert(14, 14) # 14 % 12 = 2 colisão
print(hash_table)
hash_table.insert(21, 21) # 21 % 12 = 9
print(hash_table)
hash_table.insert(23, 23) # 23 % 12 = 11
print(hash_table)
hash_table.insert(29, 29) # 29 % 12 = 5
print(hash_table)
hash_table.insert(3, 3) # 3 % 12 = 3 colisão
print(hash_table)
hash_table.insert(4, 4) # 4 % 12 = 4 colisão
print(hash_table)
hash_table.insert(30, 0) # 30 % 12 = 6 colisão
print(hash_table)
# hash_table.insert(1, 1) # 1 % 12 = 1
# print(hash_table)
# Obter elementos
# print(hash_table.get("10"))    # Output: 10
# print(hash_table.get("15"))    # Output: 15
# print(hash_table.get("19"))    # Output: 19

# Remover um elemento
#hash_table.remove("10")

# Tentar obter o elemento removido
#print(hash_table.get("10"))    # Output: None

# Mostrar a tabela hash
print(hash_table)  # Output: Tabela hash com os elementos restantes


[None, None, None, None, None, None, None, None, None, None, (10, 10), None]
[None, None, None, (15, 15), None, None, None, None, None, None, (10, 10), None]
[(0, 0), None, None, (15, 15), None, None, None, None, None, None, (10, 10), None]
[(0, 0), None, None, (15, 15), None, None, None, None, (8, 8), None, (10, 10), None]
[(0, 0), None, None, (15, 15), None, None, None, (19, 19), (8, 8), None, (10, 10), None]
[(0, 0), None, (26, 26), (15, 15), None, None, None, (19, 19), (8, 8), None, (10, 10), None]
[(0, 0), None, (26, 26), (15, 15), (14, 14), None, None, (19, 19), (8, 8), None, (10, 10), None]
[(0, 0), None, (26, 26), (15, 15), (14, 14), None, None, (19, 19), (8, 8), (21, 21), (10, 10), None]
[(0, 0), None, (26, 26), (15, 15), (14, 14), None, None, (19, 19), (8, 8), (21, 21), (10, 10), (23, 23)]
[(0, 0), None, (26, 26), (15, 15), (14, 14), (29, 29), None, (19, 19), (8, 8), (21, 21), (10, 10), (23, 23)]
[(0, 0), None, (26, 26), (15, 15), (14, 14), (29, 29), (3, 3), (19, 19), (8, 8),

Exception: Hash table is full

In [None]:
size = 19
hash_value = 8
A = 0.3
print((hash_value * A) % 1)
print(int(size * ((hash_value * A) % 1)))

0.3999999999999999
7


In [None]:
# Multiplicação
class LinearProbingHashTable:
    def __init__(self, size=12):
        self.size = size
        self.table = [None] * size

    def _hash(self, key):
        # Método de multiplicação
        A = 0.3
        # A = 0.6180339887  # Constante de multiplicação (cerca de (sqrt(5) - 1) / 2)
        hash_value = hash(key)
        return int(self.size * ((hash_value * A) % 1))

    def insert(self, key, value):
        hash_index = self._hash(key)
        original_index = hash_index
        while self.table[hash_index] is not None and self.table[hash_index][0] != key:
            hash_index = (hash_index + 1) % self.size
            if hash_index == original_index:
                raise Exception("Hash table is full")
        self.table[hash_index] = (key, value)

    def get(self, key):
        hash_index = self._hash(key)
        original_index = hash_index
        while self.table[hash_index] is not None:
            if self.table[hash_index][0] == key:
                return self.table[hash_index][1]
            hash_index = (hash_index + 1) % self.size
            if hash_index == original_index:
                break
        return None

    def remove(self, key):
        hash_index = self._hash(key)
        original_index = hash_index
        while self.table[hash_index] is not None:
            if self.table[hash_index][0] == key:
                self.table[hash_index] = None
                # Reorganiza a tabela após a remoção para evitar buracos
                self._rehash_from(hash_index)
                return True
            hash_index = (hash_index + 1) % self.size
            if hash_index == original_index:
                break
        return False

    def _rehash_from(self, start_index):
        index = (start_index + 1) % self.size
        while self.table[index] is not None:
            key, value = self.table[index]
            self.table[index] = None
            self.insert(key, value)
            index = (index + 1) % self.size

    def __str__(self):
        return str(self.table)

# Exemplo de uso
hash_table = LinearProbingHashTable()

# Inserir elementos = formula = Size * ((key * A) % 1)
hash_table.insert(10, 10) # 12 * ((10 * 0.3) % 1) = 0
print(hash_table)
hash_table.insert(15, 15) # 12 * ((15 * 0.3) % 1) = 6
print(hash_table)
hash_table.insert(0, 0) # 12 * ((0 * 0.3) % 1) = 0 -> "Colisão" -> # 0 + 1 % 12 = 1
print(hash_table)
hash_table.insert(8, 8) # 12 * ((8* 0.3) % 1 ) = 4
print(hash_table)
hash_table.insert(19, 19) #12 * ((19* 0.3) %1) = 8
print(hash_table)
hash_table.insert(26, 26) # 12
print(hash_table)
hash_table.insert(14, 14)
print(hash_table)
hash_table.insert(21, 21)
print(hash_table)

# Obter elementos
print(hash_table.get(10))    # Output: 10
print(hash_table.get(15))    # Output: 15
print(hash_table.get(0))    # Output: 0

# Remover um elemento
#hash_table.remove("10")

# Tentar obter o elemento removido
#print(hash_table.get("10"))    # Output: None

# Mostrar a tabela hash
print(hash_table)  # Output: Tabela hash com os elementos restantes


[(10, 10), None, None, None, None, None, None, None, None, None, None, None]
[(10, 10), None, None, None, None, None, (15, 15), None, None, None, None, None]
[(10, 10), (0, 0), None, None, None, None, (15, 15), None, None, None, None, None]
[(10, 10), (0, 0), None, None, (8, 8), None, (15, 15), None, None, None, None, None]
[(10, 10), (0, 0), None, None, (8, 8), None, (15, 15), None, (19, 19), None, None, None]
[(10, 10), (0, 0), None, None, (8, 8), None, (15, 15), None, (19, 19), (26, 26), None, None]
[(10, 10), (0, 0), (14, 14), None, (8, 8), None, (15, 15), None, (19, 19), (26, 26), None, None]
[(10, 10), (0, 0), (14, 14), (21, 21), (8, 8), None, (15, 15), None, (19, 19), (26, 26), None, None]
10
15
0
[(10, 10), (0, 0), (14, 14), (21, 21), (8, 8), None, (15, 15), None, (19, 19), (26, 26), None, None]


# Exercícios

1. Adicione um método à classe HashTableChaining para contar quantos elementos estão presentes em cada lista de encadeamento.

2. Altere os parametros do LinearProbingHashTable size para size = 20, e A de _hash para valor de A = 0.5. Verifique e moste o resultado da tabela de hash após a inserção dos valores da lista (10,15,0,8,19,26,14,21).
