# Tabela de Dispersão (Tabela Hash) com Encadeamento Simples

### O que é Tabela Hash?
Tabela Hash é a uma forma de busca eficiente que visa diminuir bastante o tempo de busca em relação aos outros meios de busca de valores em um determinado arranjo de valores (arrays).

Dois conceitos importantes a serem aprendidos aqui são os conceitos de **"Chave e Valor"** e **"Função de Espalhamento"**.

#### Chave e Valor

Imagine que você quer descobrir o significado de uma palavra em um dicionário. O que acontecerá nos momentos seguintes será você abrindo o dicionário e buscando pela palavra que você quer utilizando mecanismos de busca como a ordenação de páginas e das letras do alfabeto. No final da sua tarefa, encontrará a palavra em seguida do seu significado.

Pois bem, tentaremos, dessa forma, transformar esse exercício mental em algo computacional. Assim, a palavra que você buscava no dicionário será encarado como chave (ou 'key') e o seu significado ficará conhecido como valor (ou value).

Para um exemplo inicial, faremos um recorte em uma página fictícia de um dicionário comum.

In [None]:
{
    'caribe': 'indígena pertencente a qualquer dos grupos caribes',
    'começo': 'ato ou efeito de começar',
    'correto': 'isento de falha, erro ou defeito',
}

Ao observar esse recorte de um dicionário, podemos perceber uma atribuição de cada valor (significado) a cada chave (palavra). Essa abordagem não é muito diferente do que veremos uma Hash Table. Observe a lista de chaves a seguir.

In [4]:
nomes = ["João", "Guilherme", "Huilde", "Marcos"]

Caso quiséssemos popular em um outro dicionário fictício essa mesma lista, juntamente com seus significados, poderíamos criar um laço que fizesse a leitura de todas as chaves e criasse uma nova posição para um conjunto de chave e valor em um array. Entretanto, poderia ser um problema se, diferente de um dicionário do mundo real, nós fossemos adicionar um nome que já exista nesse array: haveria duas chaves iguais.

Além disso, também teríamos mais problemas, primeiro não sabemos o que exatamente teria dentro das chaves desses conjuntos, caso nós permitíssemos nomes iguais. Segundo, não conseguiríamos fazer uma busca pelo valor de um index (identificador), gerando ainda mais problemas e limitações.

### Função de Espalhamento

Tendo em vista tudo isso, a abordagem de Hash Table, portanto, nos obriga a criar uma função injetora que crie chaves (indexes) que obedeçam determinadas regras de criação. Em outras palavras, precisamos de algum nível de criptografia que traduza o nosso nome em uma combinação de caracteres única, permitindo dessa forma uma infinidade de nomes.

Em um exemplo rápido e inofensivo, imaginemos que a criptografia da nossa função injetora é que o valor das chaves é a quantidade de caracteres de cada nome, que por definição, é a nossa **Função de Espalhamento**. Nesse caso e considerando a lista **nomes**, teríamos o array a seguir.

In [7]:
nomes = {
    '4': {
        'nome': 'João',
    },
    '6': {
        'nome': 'Huilde',
    },
    '6': {
        'nome': 'Marcos',
    },
    '9': {
        'nome': 'Guilherme',
    }
}

Percebam que nesse exemplo tivemos um problema: duas chaves iguais. E isso nós chamamos de **Colisão**.

### Colisão

Resumindo, uma colisão é quando dois ou mais valores são postos em um mesmo lugar na Tabela Hash, como aconteceu no exemplo anterior.

In [8]:
print(nomes)

{'4': {'nome': 'João'}, '6': {'nome': 'Marcos'}, '9': {'nome': 'Guilherme'}}


Ao ver o que há na tabela de nomes, perceba que "Huilde" foi apagado, justamente por ter a mesma chave(número de letras) que "Marcos".

Toda Função de Espalhamento está sujeita a colisões, porém, há certos jeitos de lidar com elas.

### Lidando com Colisões

Há três formas de se lhe dar com colisões, sendo elas:

* Fingir que elas não existem
* Melhorar o algorítimo da Função de Espalhamento
* Realizar operações caso ocorram colisões

A primeira forma é a mais auto-explicativa, mas que deve ser levada em consideração caso os outros dois métodos tenham sido implementados corretamente.

A segunda forma visa o melhoramento da Função de Espalhamento tendo em mente a sua lógica, por exemplo: *E se ao invés das nossas chaves serem apenas o número de letras, nós pégarmos os valores de cada letra no nome na tabela ASCII, somar e dividir por 10 arredondando para cima?*
"Hulide" então ficaria: (104 + 117 + 105 + 108 + 100 + 101) / 10 = 63.5 que arredondando pra cima ficaria 64.
Já "Marcos" ficaria: (109 + 97 + 114 + 99 + 111 + 115) / 10 = 64.5 que arredondando pra cima ficaria 65.

In [None]:
# Nova tabela hash gerada com a nova lógica da função de espalhamento
nomes = {
	'43' :{
		'nome':'João'
	},
	'64' :{
		'nome':'Marcos'
	},
	'65' :{
		'nome': 'Huilde'
	},
	'97' :{
		'nome': 'Guilherme'
	}
	
}


Já a terceira forma lida diretamente com as colisões, realizando a alocação delas na tabela de alguma forma específica, como por exemplo:

* Se acontecer colisão, vá ao início da tabela e veja se a entrada está vazia, caso estiver, alocar o valor lá, se não, vá para a próxima linha da tabela.

Um problema com essa forma de lidar é que dependendo dos valores buscados, uma tabela hash pode sem querer se transformar em uma busca linear, já que o programa vai ter que ir comparando linha por linha até achar o valor que se é buscado.

* Se acontecer colisão, vá até ao espaço predestinado às colisões, verifique se a primeira linha está vazia, e se estiver, alocar o valor ali, se não, verifique a próxima linha.*

"Espaço predestinado ás colisões" seria basicamente um espaço extra na tabela que você teria que alocar justamente para mandar as colisões, o que custa mais memória, além do mesmo problema de busca linear que seu programa teria que fazer para achar valores que colidem.

### Material Extra / Questões para praticar

* Tabela Hash - Deinição e Exemplos https://youtu.be/5pYYy3Z0m9I
* Hash Table - Data Structures & Algorithms Tutorials In Python #5 - https://youtu.be/ea8BRGxGmlA
* Data Structures - Hash Tables - https://youtu.be/shs0KM3wKv8
* https://leetcode.com/problems/two-sum/
* https://leetcode.com/problems/longest-substring-without-repeating-characters/