## Tabela hash

É uma estrutura de dados que é utilizada para armazenar e recuperar valores associados a chaves. Ela é projetada para permitir a recuperação eficiente de valores com base em uma chave, sem a necessidade de percorrer todos os elementos da estrutura de dados. Isso a torna particularmente útil para implementar dicionários, bancos de dados, caches e outras aplicações em que a velocidade de pesquisa é crítica.


Aqui estão alguns conceitos-chave relacionados a tabelas hash:

1. Função de Hash: É a função que transforma a chave em um valor numérico (hash code). O objetivo é distribuir as chaves de maneira uniforme na tabela hash para minimizar colisões (duas chaves diferentes mapeando para o mesmo slot).

2. Colisão: Ocorre quando duas ou mais chaves diferentes produzem o mesmo valor hash, resultando em uma tentativa de armazenar valores em um mesmo slot. Lidar com colisões é uma parte crítica da implementação de tabelas hash.

3. Operações Principais: As operações principais em uma tabela hash incluem a inserção de pares chave-valor, a recuperação de um valor com base em uma chave e a remoção de pares chave-valor.

In [1]:
# hash pelo professor

class Hash_table:
    
    def __init__(self, s):
        self.size = int(s* 1.25)
        self.T = [[] for _ in range(self.size)]
     
    def __hash_str(self, key_str):
        num = 0
        for c in key_str:
            num += ord(c)
        return num
    
    def __hash(self, key_str):
        key = self.__hash_str(key_str)
        return key % self.size
    
    def insert(self, key, value):
        pos = self.__hash(key)
        self.T[pos].append(value)
    
    def get(self, key):
        pos = self.__hash(key)
        L = self.T[pos]
        for value in L:
            if(value.matricula == key):
                return value
        return None
            
    def print(self):
        print("{")
        for i in range(self.size):
            alunos = self.T[i]
            _str = ""
            for aluno in alunos:
                _str += aluno.to_string() + " "
            print("[" + _str + "]")
        
        print("}")

In [2]:
# main pelo professor

class Aluno:
    def __init__(self, nome, matricula):
        self.nome = nome
        self.matricula = matricula
   
    def to_string(self):
        return self.nome + " - " + str(self.matricula)

a1 = Aluno("Maria", 12)
a2 = Aluno("João", 6)
a3 = Aluno("José", 24)
a4 = Aluno("Lucas", 36)
a5 = Aluno("Matheus", 3)
a6 = Aluno("Simão", 7)


ht = Hash_table(10)
ht.insert(a1.nome, a1)
ht.insert(a2.nome, a2)
ht.insert(a3.nome, a3)
ht.insert(a4.nome, a4)
ht.insert(a5.nome, a5)
ht.insert(a6.nome, a6)


ht.print()
#aluno = ht.get()
#print(aluno.to_string())

{
[Lucas - 36 ]
[]
[]
[]
[]
[José - 24 ]
[]
[João - 6 Matheus - 3 ]
[]
[]
[Maria - 12 ]
[Simão - 7 ]
}


### Exercício 

"Implemente uma estrutura de tabela hash para armazenar n objetos com encadeamento separado duplo. No encadeamento duplo existem dois níveis de endereçamento, nos dois o mapeamento da chave ao endereço se dá por uma função hash. 

a. No primeiro nível crie um vetor com 10 ponteiros para vetores.  Aplique a função hash para direcionar o elemento da chave c em uma das outras tabelas do segundo nível;

b. No segundo nível cada tabela é composta por um vetor de n/10 listas de objetos a serem armazenados. Uma segunda função hash diferente da primeira deve ser definida para 
 direcionar a chave c em uma das listas específicas"

In [3]:
class HashTableDoubleHashing:
    
    def __init__(self, size):
        self.size = size
        self.first_level = [None] * 10
        for i in range(10):
            self.first_level[i] = [None] * (size // 10)
            for j in range(size // 10):
                self.first_level[i][j] = []

    def first_level_hash(self, key):
        return key % 10

    def second_level_hash(self, key):
        return (key // 10) % (self.size // 10)

    def insert(self, key, value):
        first_index = self.first_level_hash(key)
        second_index = self.second_level_hash(key)
        self.first_level[first_index][second_index].append((key, value))

    def search(self, key):
        first_index = self.first_level_hash(key)
        second_index = self.second_level_hash(key)
        for k, v in self.first_level[first_index][second_index]:
            if k == key:
                return v
        return None

    def remove(self, key):
        first_index = self.first_level_hash(key)
        second_index = self.second_level_hash(key)
        for item in self.first_level[first_index][second_index]:
            if item[0] == key:
                self.first_level[first_index][second_index].remove(item)
                return
        raise KeyError("Key not found")

# Exemplo de uso:
hash_table = HashTableDoubleHashing(100)

hash_table.insert(42, "Valor 1")
hash_table.insert(52, "Valor 2")
hash_table.insert(62, "Valor 3")

print(hash_table.search(42))  # Deve imprimir "Valor 1"
print(hash_table.search(52))  # Deve imprimir "Valor 2"
print(hash_table.search(62))  # Deve imprimir "Valor 3"

hash_table.remove(52)

print(hash_table.search(52))  # Deve retornar None, pois o elemento foi removido


Valor 1
Valor 2
Valor 3
None
