![Algoritmos e Estrutura de Dados II - Prof Piva](AED2_banner.jpg)

## Aulas 17 - Tabela Hash ou Tabela de Dispersão

![Imagem Tabela Hash](hash.jpg)

Função `hash()` em Pyhton...

In [5]:
# Exemplo de string
print(hash("abc"))

-5986641210068151483


In [6]:
# Exemplo de string numérica
print(hash("123"))

-4787113322705975440


In [7]:
# Exemplo de inteiro
print(hash(45))

45


In [8]:
# Exemplo de número de ponto flutuante
print(hash(45.0))

45


In [9]:
# Exemplo de outro número de ponto flutuante
print(hash(45.3))

691752902764101677


In [10]:
# Exemplo de booleano True
print(hash(True))

1


In [11]:
# Exemplo de booleano False
print(hash(False))

0


In [14]:
try:
    # Exemplo de lista (imutável)
    print(hash([1, 2, 3]))
except TypeError as e:
    print(e)

unhashable type: 'list'


#### Definindo a Classe HashSet

In [15]:
class HashSet:
    class __Placeholder:
        def __init__(self):
            pass

        def __eq__(self, other):
            return False

    def __init__(self, contents=[]):
        """
        Inicializa a tabela hash.

        :param contents: lista opcional de itens para inicializar o HashSet
        """
        self.items = [None] * 10  # Inicializa a lista com 10 posições, todas definidas como None
        self.numItems = 0  # Inicializa o contador de itens com 0
        for item in contents:
            self.add(item)  # Adiciona os itens iniciais ao conjunto

No código acima, a classe **__Placeholder** é definida dentro da classe HashSet. 

O **__Placeholder** é usado para marcar posições que foram liberadas por remoções, mas que precisam ser ignoradas durante a inserção de novos elementos.

O método **__init__** cria uma lista com 10 posições, todas inicialmente definidas como None, e um contador de itens numItems que começa em 0. 

O laço for percorre os itens fornecidos na lista contents e os adiciona ao conjunto usando o **método add**, que implementaremos a seguir.

In [16]:
class HashSet:
    class __Placeholder:
        def __init__(self):
            pass

        def __eq__(self, other):
            return False

    def __init__(self, contents=[]):
        """
        Inicializa a tabela hash.

        :param contents: lista opcional de itens para inicializar o HashSet
        """
        self.items = [None] * 10  # Inicializa a lista com 10 posições, todas definidas como None
        self.numItems = 0  # Inicializa o contador de itens com 0
        for item in contents:
            self.add(item)  # Adiciona os itens iniciais ao conjunto

    def add(self, item):
        """
        Adiciona um item à tabela hash.
        
        :param item: item a ser adicionado
        """
        if self.__add(item, self.items):
            self.numItems += 1
            load = self.numItems / len(self.items)
            if load >= 0.75:
                self.items = self.__rehash(self.items, [None] * 2 * len(self.items))

O método **add** insere um item na tabela hash. 

Primeiro, calcula-se o índice na lista usando o código hash do item. Se a posição está vazia (None), o item é inserido diretamente. Se não, é necessário lidar com colisões.

Aqui, o método add chama a função **__add** para inserir o item. Se o item é inserido com sucesso, incrementamos o contador numItems. Se a taxa de ocupação (load factor) exceder 75%, refazemos o hash da lista para o dobro do tamanho atual.

**Função Estática de Adição (add)**

A função estática __add insere um item em uma lista de itens, lidando com colisões usando *linear probing*.


In [17]:
class HashSet:
    class __Placeholder:
        def __init__(self):
            pass

        def __eq__(self, other):
            return False

    def __init__(self, contents=[]):
        """
        Inicializa a tabela hash.

        :param contents: lista opcional de itens para inicializar o HashSet
        """
        self.items = [None] * 10  # Inicializa a lista com 10 posições, todas definidas como None
        self.numItems = 0  # Inicializa o contador de itens com 0
        for item in contents:
            self.add(item)  # Adiciona os itens iniciais ao conjunto

    def add(self, item):
        """
        Adiciona um item à tabela hash.
        
        :param item: item a ser adicionado
        """
        if self.__add(item, self.items):
            self.numItems += 1
            load = self.numItems / len(self.items)
            if load >= 0.75:
                self.items = self.__rehash(self.items, [None] * 2 * len(self.items))

    @staticmethod
    def __add(item, items):
        """
        Função estática para adicionar um item a uma lista de itens com tratamento de colisão.

        :param item: item a ser adicionado
        :param items: lista de itens
        :return: True se o item foi adicionado, False se o item já estava na lista
        """
        idx = hash(item) % len(items)  # Calcula o índice usando o código hash e o operador mod
        loc = -1  # Inicializa a variável loc para rastrear posições de placeholders
        while items[idx] is not None:
            if items[idx] == item:
                return False  # Item já está no conjunto
            if loc < 0 and isinstance(items[idx], HashSet.__Placeholder):
                loc = idx  # Marca a posição do placeholder
            idx = (idx + 1) % len(items)  # Avança para o próximo índice (linear probing)

        if loc < 0:
            loc = idx  # Define a posição de inserção como o índice atual se nenhum placeholder foi encontrado
        items[loc] = item  # Insere o item na posição determinada
        return True

**Função Estática de Rehash (rehash)**

Se a taxa de ocupação exceder 75%,  precisamos aumentar o tamanho da lista e redistribuir os itens. 

A função __rehash percorre a lista antiga e refaz o hash de cada item não-nulo e que não seja um placeholder na nova lista.


In [18]:
class HashSet:
    class __Placeholder:
        def __init__(self):
            pass

        def __eq__(self, other):
            return False

    def __init__(self, contents=[]):
        """
        Inicializa a tabela hash.

        :param contents: lista opcional de itens para inicializar o HashSet
        """
        self.items = [None] * 10  # Inicializa a lista com 10 posições, todas definidas como None
        self.numItems = 0  # Inicializa o contador de itens com 0
        for item in contents:
            self.add(item)  # Adiciona os itens iniciais ao conjunto

    def add(self, item):
        """
        Adiciona um item à tabela hash.
        
        :param item: item a ser adicionado
        """
        if self.__add(item, self.items):
            self.numItems += 1
            load = self.numItems / len(self.items)
            if load >= 0.75:
                self.items = self.__rehash(self.items, [None] * 2 * len(self.items))

    @staticmethod
    def __add(item, items):
        """
        Função estática para adicionar um item a uma lista de itens com tratamento de colisão.

        :param item: item a ser adicionado
        :param items: lista de itens
        :return: True se o item foi adicionado, False se o item já estava na lista
        """
        idx = hash(item) % len(items)  # Calcula o índice usando o código hash e o operador mod
        loc = -1  # Inicializa a variável loc para rastrear posições de placeholders
        while items[idx] is not None:
            if items[idx] == item:
                return False  # Item já está no conjunto
            if loc < 0 and isinstance(items[idx], HashSet.__Placeholder):
                loc = idx  # Marca a posição do placeholder
            idx = (idx + 1) % len(items)  # Avança para o próximo índice (linear probing)

        if loc < 0:
            loc = idx  # Define a posição de inserção como o índice atual se nenhum placeholder foi encontrado
        items[loc] = item  # Insere o item na posição determinada
        return True

    @staticmethod
    def __rehash(oldList, newList):
        """
        Re-hash dos itens de uma lista antiga para uma nova lista.

        :param oldList: lista antiga de itens
        :param newList: nova lista de itens
        :return: nova lista com itens re-hashados
        """
        for x in oldList:
            if x is not None and not isinstance(x, HashSet.__Placeholder):
                HashSet.__add(x, newList)  # Adiciona os itens não-nulos e não-placeholders à nova lista
        return newList

**Excluindo um Item**

Para excluir um item, precisamos encontrar sua posição na lista. Se o item estiver no meio de uma cadeia, substituímos pelo objeto ` __Placeholde`r.


In [19]:
class HashSet:
    class __Placeholder:
        def __init__(self):
            pass

        def __eq__(self, other):
            return False

    def __init__(self, contents=[]):
        """
        Inicializa a tabela hash.

        :param contents: lista opcional de itens para inicializar o HashSet
        """
        self.items = [None] * 10  # Inicializa a lista com 10 posições, todas definidas como None
        self.numItems = 0  # Inicializa o contador de itens com 0
        for item in contents:
            self.add(item)  # Adiciona os itens iniciais ao conjunto

    def add(self, item):
        """
        Adiciona um item à tabela hash.
        
        :param item: item a ser adicionado
        """
        if self.__add(item, self.items):
            self.numItems += 1
            load = self.numItems / len(self.items)
            if load >= 0.75:
                self.items = self.__rehash(self.items, [None] * 2 * len(self.items))

    @staticmethod
    def __add(item, items):
        """
        Função estática para adicionar um item a uma lista de itens com tratamento de colisão.

        :param item: item a ser adicionado
        :param items: lista de itens
        :return: True se o item foi adicionado, False se o item já estava na lista
        """
        idx = hash(item) % len(items)  # Calcula o índice usando o código hash e o operador mod
        loc = -1  # Inicializa a variável loc para rastrear posições de placeholders
        while items[idx] is not None:
            if items[idx] == item:
                return False  # Item já está no conjunto
            if loc < 0 and isinstance(items[idx], HashSet.__Placeholder):
                loc = idx  # Marca a posição do placeholder
            idx = (idx + 1) % len(items)  # Avança para o próximo índice (linear probing)

        if loc < 0:
            loc = idx  # Define a posição de inserção como o índice atual se nenhum placeholder foi encontrado
        items[loc] = item  # Insere o item na posição determinada
        return True

    @staticmethod
    def __rehash(oldList, newList):
        """
        Re-hash dos itens de uma lista antiga para uma nova lista.

        :param oldList: lista antiga de itens
        :param newList: nova lista de itens
        :return: nova lista com itens re-hashados
        """
        for x in oldList:
            if x is not None and not isinstance(x, HashSet.__Placeholder):
                HashSet.__add(x, newList)  # Adiciona os itens não-nulos e não-placeholders à nova lista
        return newList

    def remove(self, item):
        """
        Remove um item da tabela hash.

        :param item: item a ser removido
        :raises KeyError: se o item não estiver na tabela
        """
        if HashSet.__remove(item, self.items):
            self.numItems -= 1
            load = max(self.numItems, 10) / len(self.items)
            if load <= 0.25:
                self.items = HashSet.__rehash(self.items, [None] * int(len(self.items) / 2))
        else:
            raise KeyError("Item não está no HashSet")

    @staticmethod
    def __remove(item, items):
        """
        Função estática para remover um item de uma lista de itens.

        :param item: item a ser removido
        :param items: lista de itens
        :return: True se o item foi removido, False se o item não estava na lista
        """
        idx = hash(item) % len(items)
        while items[idx] is not None:
            if items[idx] == item:
                nextIdx = (idx + 1) % len(items)
                if items[nextIdx] is None:
                    items[idx] = None
                else:
                    items[idx] = HashSet.__Placeholder()
                return True
            idx = (idx + 1) % len(items)
        return False

**Encontrando um Item**

Para encontrar um item, usamos o método **_ _contains_ _** que verifica se o item está na lista.

In [20]:
class HashSet:
    class __Placeholder:
        def __init__(self):
            pass

        def __eq__(self, other):
            return False

    def __init__(self, contents=[]):
        """
        Inicializa a tabela hash.

        :param contents: lista opcional de itens para inicializar o HashSet
        """
        self.items = [None] * 10  # Inicializa a lista com 10 posições, todas definidas como None
        self.numItems = 0  # Inicializa o contador de itens com 0
        for item in contents:
            self.add(item)  # Adiciona os itens iniciais ao conjunto

    def add(self, item):
        """
        Adiciona um item à tabela hash.
        
        :param item: item a ser adicionado
        """
        if self.__add(item, self.items):
            self.numItems += 1
            load = self.numItems / len(self.items)
            if load >= 0.75:
                self.items = self.__rehash(self.items, [None] * 2 * len(self.items))

    @staticmethod
    def __add(item, items):
        """
        Função estática para adicionar um item a uma lista de itens com tratamento de colisão.

        :param item: item a ser adicionado
        :param items: lista de itens
        :return: True se o item foi adicionado, False se o item já estava na lista
        """
        idx = hash(item) % len(items)  # Calcula o índice usando o código hash e o operador mod
        loc = -1  # Inicializa a variável loc para rastrear posições de placeholders
        while items[idx] is not None:
            if items[idx] == item:
                return False  # Item já está no conjunto
            if loc < 0 and isinstance(items[idx], HashSet.__Placeholder):
                loc = idx  # Marca a posição do placeholder
            idx = (idx + 1) % len(items)  # Avança para o próximo índice (linear probing)

        if loc < 0:
            loc = idx  # Define a posição de inserção como o índice atual se nenhum placeholder foi encontrado
        items[loc] = item  # Insere o item na posição determinada
        return True

    @staticmethod
    def __rehash(oldList, newList):
        """
        Re-hash dos itens de uma lista antiga para uma nova lista.

        :param oldList: lista antiga de itens
        :param newList: nova lista de itens
        :return: nova lista com itens re-hashados
        """
        for x in oldList:
            if x is not None and not isinstance(x, HashSet.__Placeholder):
                HashSet.__add(x, newList)  # Adiciona os itens não-nulos e não-placeholders à nova lista
        return newList

    def remove(self, item):
        """
        Remove um item da tabela hash.

        :param item: item a ser removido
        :raises KeyError: se o item não estiver na tabela
        """
        if HashSet.__remove(item, self.items):
            self.numItems -= 1
            load = max(self.numItems, 10) / len(self.items)
            if load <= 0.25:
                self.items = HashSet.__rehash(self.items, [None] * int(len(self.items) / 2))
        else:
            raise KeyError("Item não está no HashSet")

    @staticmethod
    def __remove(item, items):
        """
        Função estática para remover um item de uma lista de itens.

        :param item: item a ser removido
        :param items: lista de itens
        :return: True se o item foi removido, False se o item não estava na lista
        """
        idx = hash(item) % len(items)
        while items[idx] is not None:
            if items[idx] == item:
                nextIdx = (idx + 1) % len(items)
                if items[nextIdx] is None:
                    items[idx] = None
                else:
                    items[idx] = HashSet.__Placeholder()
                return True
            idx = (idx + 1) % len(items)
        return False

    def __contains__(self, item):
        """
        Verifica se o item está na tabela hash.

        :param item: item a ser verificado
        :return: True se o item está na tabela, False caso contrário
        """
        idx = hash(item) % len(self.items)
        while self.items[idx] is not None:
            if self.items[idx] == item:
                return True
            idx = (idx + 1) % len(self.items)
        return False


**Iterando Sobre os Itens**

Para iterar sobre os itens do conjunto, definimos o método **_ _iter_ _** que percorre a lista de itens.

In [21]:
class HashSet:
    class __Placeholder:
        def __init__(self):
            pass

        def __eq__(self, other):
            return False

    def __init__(self, contents=[]):
        """
        Inicializa a tabela hash.

        :param contents: lista opcional de itens para inicializar o HashSet
        """
        self.items = [None] * 10  # Inicializa a lista com 10 posições, todas definidas como None
        self.numItems = 0  # Inicializa o contador de itens com 0
        for item in contents:
            self.add(item)  # Adiciona os itens iniciais ao conjunto

    def add(self, item):
        """
        Adiciona um item à tabela hash.
        
        :param item: item a ser adicionado
        """
        if self.__add(item, self.items):
            self.numItems += 1
            load = self.numItems / len(self.items)
            if load >= 0.75:
                self.items = self.__rehash(self.items, [None] * 2 * len(self.items))

    @staticmethod
    def __add(item, items):
        """
        Função estática para adicionar um item a uma lista de itens com tratamento de colisão.

        :param item: item a ser adicionado
        :param items: lista de itens
        :return: True se o item foi adicionado, False se o item já estava na lista
        """
        idx = hash(item) % len(items)  # Calcula o índice usando o código hash e o operador mod
        loc = -1  # Inicializa a variável loc para rastrear posições de placeholders
        while items[idx] is not None:
            if items[idx] == item:
                return False  # Item já está no conjunto
            if loc < 0 and isinstance(items[idx], HashSet.__Placeholder):
                loc = idx  # Marca a posição do placeholder
            idx = (idx + 1) % len(items)  # Avança para o próximo índice (linear probing)

        if loc < 0:
            loc = idx  # Define a posição de inserção como o índice atual se nenhum placeholder foi encontrado
        items[loc] = item  # Insere o item na posição determinada
        return True

    @staticmethod
    def __rehash(oldList, newList):
        """
        Re-hash dos itens de uma lista antiga para uma nova lista.

        :param oldList: lista antiga de itens
        :param newList: nova lista de itens
        :return: nova lista com itens re-hashados
        """
        for x in oldList:
            if x is not None and not isinstance(x, HashSet.__Placeholder):
                HashSet.__add(x, newList)  # Adiciona os itens não-nulos e não-placeholders à nova lista
        return newList

    def remove(self, item):
        """
        Remove um item da tabela hash.

        :param item: item a ser removido
        :raises KeyError: se o item não estiver na tabela
        """
        if HashSet.__remove(item, self.items):
            self.numItems -= 1
            load = max(self.numItems, 10) / len(self.items)
            if load <= 0.25:
                self.items = HashSet.__rehash(self.items, [None] * int(len(self.items) / 2))
        else:
            raise KeyError("Item não está no HashSet")

    @staticmethod
    def __remove(item, items):
        """
        Função estática para remover um item de uma lista de itens.

        :param item: item a ser removido
        :param items: lista de itens
        :return: True se o item foi removido, False se o item não estava na lista
        """
        idx = hash(item) % len(items)
        while items[idx] is not None:
            if items[idx] == item:
                nextIdx = (idx + 1) % len(items)
                if items[nextIdx] is None:
                    items[idx] = None
                else:
                    items[idx] = HashSet.__Placeholder()
                return True
            idx = (idx + 1) % len(items)
        return False

    def __contains__(self, item):
        """
        Verifica se o item está na tabela hash.

        :param item: item a ser verificado
        :return: True se o item está na tabela, False caso contrário
        """
        idx = hash(item) % len(self.items)
        while self.items[idx] is not None:
            if self.items[idx] == item:
                return True
            idx = (idx + 1) % len(self.items)
        return False

    def __iter__(self):
        """
        Itera sobre os itens na tabela hash.

        :yield: próximo item na tabela
        """
        for i in range(len(self.items)):
            if self.items[i] is not None and not isinstance(self.items[i], HashSet.__Placeholder):
                yield self.items[i]

#### Exemplo de Uso

Vamos ver um exemplo de uso da classe HashSet:

In [22]:
# Criando um HashSet com alguns itens iniciais
hash_set = HashSet([1, 2, 3])

In [23]:
# Adicionando itens ao HashSet
hash_set.add(4)
hash_set.add(5)

In [24]:
# Exibindo os itens do HashSet
print(list(hash_set))

[1, 2, 3, 4, 5]


In [25]:
# Tentando adicionar um item duplicado
hash_set.add(3)

In [27]:
# Exibindo os itens do HashSet
print(list(hash_set))

[1, 2, 3, 4, 5]


In [26]:
# Exibindo o número de itens no HashSet
print(hash_set.numItems)

5


In [28]:
# Removendo um item
hash_set.remove(3)
print(list(hash_set))

[1, 2, 4, 5]


In [29]:
# Verificando se um item está no HashSet
print(2 in hash_set) 

True


In [30]:
# Verificando se um item está no HashSet
print(3 in hash_set)

False


In [31]:
# Iterando sobre os itens do HashSet
for item in hash_set:
    print(item)

1
2
4
5


A implementação de uma tabela hash em Python envolve a criação de uma função hash eficiente e métodos para inserção, busca e exclusão de elementos. 

O tratamento de colisões é essencial para garantir que a tabela funcione corretamente em casos onde múltiplas chaves geram o mesmo índice. 

Embora existam várias técnicas avançadas para tratamento de colisões e otimização do desempenho da tabela hash, a implementação básica apresentada aqui é suficiente para fornecer uma noção inicial sobre o funcionamento dessas estruturas.

## Fim da Aula 17