## Tabela Hash
***

Tabela hash é uma estrutura de dados que associa chaves de pesquisa a valores.

É também chamada de tabela de dispersão ou tabela de espalhamento.

**Objetivo**: Fazer uma busca rápida e obter o valor desejado

Problema de se utilizar um array (vetor):

* Embora os arrays permitam acessar uma posição com custo O(1), eles não possuem mecanismo que permita calcular a posição onde uma informação está armazenada, portanto, a operação de busca não é O(1).


* Uma solução seria a utilização de tabelas hash.

A tabela hash é uma generalização da ideia de array.

* Utiliza uma função para espalhar os elementos que queremos armazenar na tabela.


* Os elementos ficam dispersos de forma não ordenada.


* **Importante**: função de hashing


* A função de hashing é responsável por espalhar os elementos.


* A tabela hash permite a associação de chaves e valores


* Através da chave é possível obter uma informação de forma rápida.

O ideial é escolher um número primo como tamanho da tabela hash e evitar valores que sejam potência de dois.

Um número primo reduz a probabilidade de colisões e potência de dois pode gerar mais colisões

Sempre ao fazer inserção e busca, tem-se que calcular a posição dos dados dentro da tabela.

A função de hashing serve para calcular uma posição a partir de uma chave. Essa função é muito importante quanto a eficiência. Ela é responsável por distribuir as informações na tabela.

Uma boa função de hash é simples e barata de se calcular, garante que valores diferentes produzam posições diferentes e tem distribuição equilibrada dos dados (máximo espalhamento)

![img](https://user-images.githubusercontent.com/14116020/44692764-d6995c00-aa3a-11e8-9c29-8619884cc822.png)

***
#### Dicionários vs Tabela Hash
***

Dicionários é um exemplo de tabela hash.

Hash Table é uma estrutura de dados utilizada para implementar um array associativo.

Cada valor tem uma chave associada a ele

Utiliza uma função hash para computar um índice no array de slots

Dicionários em python são implementados utilizando hash table.

![img](https://user-images.githubusercontent.com/14116020/44693087-6095f480-aa3c-11e8-9095-8792335a62bb.png)

Cada chave (key) vai ser mapeada através da função hash (hash function) para um indice da lista (buckets)

***
#### Análise Assintota
***

O custo de obter um valor, em média, é O(1).

Isso acontece porque é calculada a posição onde está o elemento.

**Vantagens**: eficiência na operação de busca.

**Desvantagem**: alto custo para obter os elementos de forma ordenada.

O objetivo é diminuir o número de **colisões** para evitar o pior caso: O(N) onde N é o tamanho da tabela.

**Colisões**: dois elementos tentando ocupar a mesma posição dentro da tabela.

***
#### Aplicações
***

Verificação de integridade dos dados.

Armazenamento seguro de senhas (armazena-se o resultado da função hash e não a senha propriamente dita.)

Criptografia.

***
#### Função de Hash
***

mod $M$ é o resto da divisão por $M$.

Método bastante utilizado: $H(K) = K.mod.M$. Onde $K$ é um inteiro correspondente à chave.

***
#### Colisões
***

Existe duas estratégias básicas para o tratamento de colisões: Encadeamento e Endereçamento aberto.

No encadeamento, cada posição da tabela mantém uma lista encadeada.

As chaves são inseridas ao final de cada lista, que é percorrida para verificar se a chave já está na tabela.

***

In [1]:
import sys

class HashTable(object):
    """
    Tabela Hash
    """
    
    def __init__(self, table_size):
        """
        Construtor da tabela hash: M = table size
        """
        
        if table_size < 1:
            print("Error: o tamanho da tabela tem que ser positivo")
            sys.exit(1)
            
        self.table_size = table_size
        # Cria todas as listas vazias
        self.table = [[] for i in range(table_size)]
        
    def hash_function(self, key):
        """
        Função de hash para consulta na tabela
        """
        
        return key % self.table_size
    
    def insert(self, key):
        """
        Inserir um valor na tabela
        """
        
        self.table[self.hash_function(key)].append(key)
        
    def show(self):
        """
        Mostrar tabela.
        """
        
        for linked_list in self.table:
            if linked_list:
                for key in linked_list:
                    print("%d" % key, end = " ")
                print("")
                
    def search(self, key):
        """
        Buscar pela chave
        """
        
        if key in self.table[self.hash_function(key)]:
            return True
        
        return False

In [2]:
table = HashTable(9)
table.insert(19)
table.insert(28)
table.insert(20)
table.insert(5)
table.insert(33)
table.insert(15)

In [3]:
table.show()

19 28 
20 
5 
33 15 
