##Hashing

In [None]:
class HashTable:
    def __init__(self):
        # Inicializa a tabela hash com um tamanho fixo de 11 slots
        self.size = 11
        # Cria uma lista de slots vazios para as chaves
        self.slots = [None] * self.size
        # Cria uma lista de slots vazios para os dados associados às chaves
        self.data = [None] * self.size

    def put(self, key, data):
        # Calcula o valor do hash para a chave
        hashvalue = self.hashfunction(key, len(self.slots))

        # Se o slot está vazio, insere a chave e os dados
        if self.slots[hashvalue] is None:
            self.slots[hashvalue] = key
            self.data[hashvalue] = data
        else:
            # Se o slot contém a mesma chave, substitui os dados
            if self.slots[hashvalue] == key:
                self.data[hashvalue] = data  # substitui os dados
            else:
                # Caso contrário, procura o próximo slot vazio
                nextslot = self.rehash(hashvalue, len(self.slots))
                while self.slots[nextslot] is not None and self.slots[nextslot] != key:
                    nextslot = self.rehash(nextslot, len(self.slots))

                # Insere a chave e os dados no próximo slot vazio encontrado
                if self.slots[nextslot] is None:
                    self.slots[nextslot] = key
                    self.data[nextslot] = data
                else:
                    # Se encontrar a mesma chave, substitui os dados
                    self.data[nextslot] = data  # substitui os dados

    def hashfunction(self, key, size):
        # Função de hash simples que usa o operador de módulo
        return key % size

    def rehash(self, oldhash, size):
        # Função de rehash que incrementa o valor do hash antigo
        return (oldhash + 1) % size

    def get(self, key):
        # Calcula o valor do hash para a chave
        startslot = self.hashfunction(key, len(self.slots))

        data = None
        stop = False
        found = False
        position = startslot
        # Percorre os slots até encontrar a chave ou voltar ao slot inicial
        while self.slots[position] is not None and not found and not stop:
            if self.slots[position] == key:
                found = True
                data = self.data[position]
            else:
                position = self.rehash(position, len(self.slots))
                if position == startslot:
                    stop = True
        return data

    def __getitem__(self, key):
        # Permite usar a sintaxe hash_table[key] para obter dados
        return self.get(key)

    def __setitem__(self, key, data):
        # Permite usar a sintaxe hash_table[key] = data para inserir dados
        self.put(key, data)


#Testando!

In [None]:
# Criação da tabela hash
hash_table = HashTable()

In [None]:
# Adicionar valores
hash_table[54] = "gato"
hash_table[26] = "cachorro"
hash_table[93] = "leão"
hash_table[17] = "tigre"
hash_table[77] = "pássaro"
hash_table[31] = "peixe"
hash_table[44] = "cavalo"
hash_table[55] = "vaca"



####Qual é a razão de

In [None]:
# Recuperar valores
print(hash_table[54])  # Saída: gato
print(hash_table[26])  # Saída: cachorro
print(hash_table[93])  # Saída: leão
print(hash_table[31])  # Saída: peixe

pantera
cachorro
leão
peixe


In [None]:
# Atualizar valor existente
hash_table[54] = "pantera"
print(hash_table[54])  # Saída: pantera

pantera


# Um pouco mais sobre fator de Carga em Hash Table (λ = n/N)

**Definição:**  
O fator de carga é a razão entre o número de elementos armazenados (n) e o tamanho total da tabela (N).

**Importância:**  
Manter esse valor abaixo de certos limites é crucial para evitar muitas colisões, o que pode degradar a eficiência da tabela hash.

## Encadeamento Separado

Cada posição da tabela armazena uma lista (ou outro tipo de coleção) de elementos que compartilham o mesmo valor hash.

**Limite Recomendado:**  
Manter λ < 0,9 evita que as listas fiquem muito longas, garantindo que as operações permaneçam eficientes. Se o fator de carga se aproximar de 1, a chance de colisões aumenta e, com isso, o tempo necessário para buscar elementos também aumenta, pois será preciso percorrer listas maiores.

## Endereçamento Aberto

Em vez de usar listas, os elementos são armazenados diretamente na tabela. Em caso de colisão, são procurados outros espaços vazios segundo uma estratégia de sondagem.

**Problema dos Agrupamentos (Clustering):**  
À medida que λ aumenta (especialmente acima de 0,5), formam-se agrupamentos de elementos. Esses agrupamentos fazem com que a sondagem percorra longas sequências na tabela até encontrar um espaço vazio, aumentando o tempo de inserção e busca.

**Limite Recomendado:**  
Para sondagem linear, manter λ < 0,5 é ideal. Outros métodos de sondagem, como a sondagem quadrática, podem tolerar um fator um pouco maior (por exemplo, a implementação do Python impõe λ < 2/3).

## Rehashing (Redimensionamento da Tabela)

Se uma inserção faz com que o fator de carga ultrapasse o limite desejado, a tabela é redimensionada para restaurar a eficiência.

Cria-se uma nova tabela (geralmente com o dobro do tamanho da anterior), e todos os elementos são reinseridos nela utilizando uma nova função de compressão que considera o novo tamanho.

**Benefício:**  
Ao dobrar o tamanho da tabela a cada redimensionamento, o custo do rehashing é amortizado, ou seja, o tempo extra gasto nessa operação se distribui entre muitas inserções, mantendo a eficiência geral da tabela hash.
