## Hash Table 介绍

这是一个地址空间寻址：

![image.png](attachment:6d1487df-19e6-4820-8795-44710d347e3e.png)

Python内置了字典，我们创建这样的一个键值对：

![image.png](attachment:a506b512-a4ab-4a1d-a029-8eff2bb55a2c.png)

通过散列表的执行：

![image.png](attachment:a4538e77-ec43-48e5-adc2-5384909580d6.png)

我们获得需要被寻找的键值对：

![image.png](attachment:28962519-46f2-4466-a125-3a42cce6a754.png)

## Collisions

假设现状如下所示：

![image.png](attachment:86eae8d1-fa4f-463b-90a4-8835b9c710ad.png)

如果我们要将键值对存到已经存在键值对的地址的时候，就会发生冲突。


如何让第二个键值进入地址而不覆盖第一个键值？

方法一是：将这两个键值对都存在于另一个列表中。

方法二是：查找到一个空地址，然后将键值对映射进去。

## Constructor

In [3]:
class HashTable:
    
    def __init__(self, size = 7):  # 从0到6构建列表
        self.data_map = [None] * size  # 包含七个None的列表
    
    def __hash(self, key):  # hash用来存储密钥的位置
        my_hash = 0  # 初始化为0
        for letter in key:  # 进行遍历
            my_hash = (my_hash + ord(letter) * 23) % len(self.data_map)
        return my_hash
    
    def print_table(self):
        for i, val in enumerate(self.data_map):
            print(i, ": ", val)

我们测试一下：

In [4]:
my_hash_table = HashTable()

In [5]:
my_hash_table.print_table()

0 :  None
1 :  None
2 :  None
3 :  None
4 :  None
5 :  None
6 :  None


## Set

In [6]:
def set_item(self, key, value):
    index = self.__hash(key)
    
    if self.data_map[index] == None:
        self.data_map[index] = []
    self.data_map[index].append([key, value])

合并：

In [18]:
class HashTable:
    
    def __init__(self, size = 7):  # 从0到6构建列表
        self.data_map = [None] * size  # 包含七个None的列表
    
    def __hash(self, key):  # hash用来存储密钥的位置
        my_hash = 0  # 初始化为0
        for letter in key:  # 进行遍历
            my_hash = (my_hash + ord(letter) * 23) % len(self.data_map)
        return my_hash
    
    def print_table(self):
        for i, val in enumerate(self.data_map):
            print(i, ": ", val)
            
    def set_item(self, key, value):
        index = self.__hash(key)

        if self.data_map[index] == None:
            self.data_map[index] = []
        self.data_map[index].append([key, value])

In [16]:
my_hash_table = HashTable()

my_hash_table.set_item("bolts", 1400)
my_hash_table.set_item("washers", 50)
my_hash_table.set_item("lumber", 70)

In [17]:
my_hash_table.print_table()

0 :  None
1 :  None
2 :  None
3 :  None
4 :  [['bolts', 1400], ['washers', 50]]
5 :  None
6 :  [['lumber', 70]]


## Get

In [20]:
def get_item(self, key):
    index = self.__hash(key)
    if self.data_map[index] is not None:
        for i in range(len(self.data_map[index])):
            if self.data_map[index][i][0] == key:
                return self.data_map[index][i][1]
    return None

合并：

In [21]:
class HashTable:
    
    def __init__(self, size = 7):  # 从0到6构建列表
        self.data_map = [None] * size  # 包含七个None的列表
    
    def __hash(self, key):  # hash用来存储密钥的位置
        my_hash = 0  # 初始化为0
        for letter in key:  # 进行遍历
            my_hash = (my_hash + ord(letter) * 23) % len(self.data_map)
        return my_hash
    
    def print_table(self):
        for i, val in enumerate(self.data_map):
            print(i, ": ", val)
            
    def set_item(self, key, value):
        index = self.__hash(key)

        if self.data_map[index] == None:
            self.data_map[index] = []
        self.data_map[index].append([key, value])
        
    def get_item(self, key):
        index = self.__hash(key)
        if self.data_map[index] is not None:
            for i in range(len(self.data_map[index])):
                if self.data_map[index][i][0] == key:
                    return self.data_map[index][i][1]
        return None

In [22]:
my_hash_table = HashTable()

In [23]:
my_hash_table.set_item("bolts", 1400)
my_hash_table.set_item("washers", 50)

In [24]:
print(my_hash_table.get_item("bolts"))
print(my_hash_table.get_item("washers"))

1400
50


## Keys

In [26]:
def keys(self):
    all_keys = []
    for i in range(len(self.data_map)):
        if self.data_map[i] is not None:
            for j in range(len(self.data_map[i])):
                all_keys.append(self.data_map[i][j][0])
    return all_keys

合并：

In [31]:
class HashTable:
    
    def __init__(self, size = 7):  # 从0到6构建列表
        self.data_map = [None] * size  # 包含七个None的列表
    
    def __hash(self, key):  # hash用来存储密钥的位置
        my_hash = 0  # 初始化为0
        for letter in key:  # 进行遍历
            my_hash = (my_hash + ord(letter) * 23) % len(self.data_map)
        return my_hash
    
    def print_table(self):
        for i, val in enumerate(self.data_map):
            print(i, ": ", val)
            
    def set_item(self, key, value):
        index = self.__hash(key)

        if self.data_map[index] == None:
            self.data_map[index] = []
        self.data_map[index].append([key, value])
        
    def get_item(self, key):
        index = self.__hash(key)
        if self.data_map[index] is not None:
            for i in range(len(self.data_map[index])):
                if self.data_map[index][i][0] == key:
                    return self.data_map[index][i][1]
        return None
    
    def keys(self):
        all_keys = []
        for i in range(len(self.data_map)):
            if self.data_map[i] is not None:
                for j in range(len(self.data_map[i])):
                    all_keys.append(self.data_map[i][j][0])
        return all_keys

In [32]:
my_hash_table = HashTable()

In [33]:
my_hash_table.set_item("bolts", 1400)
my_hash_table.set_item("washers", 50)
my_hash_table.set_item("lumber", 70)

In [34]:
print(my_hash_table.keys())

['bolts', 'washers', 'lumber']
