# Хэш таблицы и методы разрешения коллизий

## Рехэширование

### Рехэширование -- метод разрешения коллизий в хэш таблице. В нем мы добавляем 1 к индексу элемента и хэшиируем повтороно, пока не найдем место
### Рехэширование псевдослучайными числами -- метод разрешения коллизий в хэш таблице. Мы для каждой таблицы генерируем массив с индексами размером с таблицу и если происходит коллизия, то мы обращаемся к случайному элементу массива за индексом
### Сложность поиска по Хэш таблице -- O(1), так как мы обращаемся по вычисленному индексу

### Я реализовал 2 метода в одном классе. При проверке нужно, чтобы один был закомментирован

In [4]:
import random as rand

In [5]:
# Класс хэш-таблицы 
class HashTable:
    
    # Инициализация
    def __init__(self, size):
        self.size = size
        self.table = [None] * size
        self.rand_nums = rand.sample(range(self.size), self.size)
        
    # Хэш функция
    def hash_function(self, key):
        return key % self.size

    # Вставка в хэш таблицу
    def insert(self, key, value):
        index = self.hash_function(key)
        
        # Метод рехэширования в случае коллизии
        while self.table[index] is not None:

            # Простое рехэширование
            #index = (index + 1) % self.size

            # Рехэширование с помощью псевдослучайных чисел
            index = self.rand_nums[index]
            
        
        self.table[index] = [key, value]
        
    # Поиск по таблице
    def search(self, key):
        index = self.hash_function(key)
        # Если занято, то рехэшируем ключи
        while self.table[index] is not None:
            if self.table[index][0] == key:
                # Нашли
                return self.table[index][1] 
                
            # Не нашли
            
             # Простое рехэширование
            #index = (index + 1) % self.size

            # Рехэширование с помощью псевдослучайных чисел
            index = self.rand_nums[index]
                

    # Удаление
    def delete(self, key):
        index = self.hash_function(key)
        while self.table[index] is not None:
            if self.table[index][0] == key:
                self.table[index][1] = None
                
            # Простое рехэширование
            #index = (index + 1) % self.size

            # Рехэширование с помощью псевдослучайных чисел
            index = self.rand_nums[index]

In [6]:
# Инициализация
ht = HashTable(100)

In [7]:
# Вставка
ht.insert(1, 'bebra')
ht.insert(11, 'velosiped')
ht.insert(5, 'beliberda')

In [8]:
# Поиск
print(ht.search(1))
print(ht.search(11))
print(ht.search(5))

bebra
velosiped
beliberda


### Коллизии разрешились, таблица работает как надо

In [9]:
# Удаление
ht.delete(1)
print(ht.search(1))

None


## Метод цепочек

### Метод цепочек -- метод разрешения коллизий в хэш таблице. Если индекс занят, то мы вставляем в ячейку еще одно значение, создавая цепочку

In [10]:
class HashTable_2:
    # Инициализация
    def __init__(self, size):
        self.size = size
        self.table = [[] for _ in range(size)]

    # Хэш функция
    def hash_function(self, key):
        return key % self.size

    # Вставка
    def insert(self, key, value):
        index = self.hash_function(key)
        self.table[index].append((key, value))

    # Поиск
    def search(self, key):
        index = self.hash_function(key)
        for k, v in self.table[index]:
            if k == key:
                # Нашли
                return v
        # Не нашли
        return None

    # Удаление
    def delete(self, key):
        index = self.hash_function(key)
        for i, (k, _) in enumerate(self.table[index]):
            if k == key:
                del self.table[index][i]

In [11]:
# Инициализация
ht = HashTable_2(100)

In [12]:
# Вставка
ht.insert(1, 'bebra')
ht.insert(11, 'velosiped')
ht.insert(5, 'beliberda')

In [13]:
# Поиск
print(ht.search(1))
print(ht.search(11))
print(ht.search(5))

bebra
velosiped
beliberda


In [14]:
# Удаление
ht.delete(1)
print(ht.search(1))

None
