# 哈希表
- 又称散列表，通过建立key-value之间的映射，高效查询
- 哈希表，数组，链表的比较
   
   ![alt text](image.png)
- 哈希函数的作用是将一个较大的输入空间映射到一个较小的输出空间
- 

In [5]:
#1.初始化
hmap = {}
#2.添加
hmap['张三'] = 1000
hmap['peter'] = 900
hmap['lisi'] = 800
#3.查询
print(hmap['peter'])
#4.删除
hmap.pop('peter')
print('删除之后的hmap是',hmap)

900
删除之后的hmap是 {'张三': 1000, 'lisi': 800}


In [8]:
#5.常用的三种遍历方式，遍历键值对，遍历键，遍历值
for key,value in hmap.items():
    print(key,value)
for key in hmap.keys():
    print(key)
for value in hmap.values():
    print(value)

张三 1000
lisi 800
张三
lisi
1000
800


## 简单实现
- 通过一个数组实现hash table
- 示意图如下
   ![alt text](image-1.png)
- 

In [17]:
class Pair():
    def __init__(self,key,value):
        self.key = key
        self.value = value

class ArrayHashTable():
    def __init__(self):
        self._nums = []
        self.capacity = 1000
    def append(self,Pair1):
        self._nums.append(Pair1)
    def get(self,key):
        #hash函数
        index = key % self.capacity
        return self._nums[index].value

test1 = ArrayHashTable()
test1.append(Pair('zhangsan',100))
test1.append(Pair('lisi',10000))
test1.get(2)

IndexError: list index out of range

In [None]:
#标准答案
class Pair:
    """键值对"""

    def __init__(self, key: int, val: str):
        self.key = key
        self.val = val

class ArrayHashMap:
    """基于数组实现的哈希表"""

    def __init__(self):
        """构造方法"""
        # 初始化数组，包含 100 个桶,初始化固定长度
        self.buckets: list[Pair | None] = [None] * 100

    def hash_func(self, key: int) -> int:
        """哈希函数"""
        index = key % 100
        return index

    def get(self, key: int) -> str:
        """查询操作"""
        index: int = self.hash_func(key)
        pair: Pair = self.buckets[index]
        if pair is None:
            return None
        return pair.val

    def put(self, key: int, val: str):
        """添加操作"""
        pair = Pair(key, val)
        index: int = self.hash_func(key)
        self.buckets[index] = pair

    def remove(self, key: int):
        """删除操作"""
        index: int = self.hash_func(key)
        # 置为 None ，代表删除
        self.buckets[index] = None

    def entry_set(self) -> list[Pair]:
        """获取所有键值对"""
        result: list[Pair] = []
        for pair in self.buckets:
            if pair is not None:
                result.append(pair)
        return result

    def key_set(self) -> list[int]:
        """获取所有键"""
        result = []
        for pair in self.buckets:
            if pair is not None:
                result.append(pair.key)
        return result

    def value_set(self) -> list[str]:
        """获取所有值"""
        result = []
        for pair in self.buckets:
            if pair is not None:
                result.append(pair.val)
        return result

    def print(self):
        """打印哈希表"""
        for pair in self.buckets:
            if pair is not None:
                print(pair.key, "->", pair.val)

## 哈希冲突
- 多个输入key，经过哈希函数后得到一个输出index
- 容易想到，哈希表容量n越大，多个key被分配到同一个桶中的概率就越低，冲突就越少。因此，我们可以通过扩容哈希表来减少哈希冲突
- 类似于数组扩容，哈希表扩容需将所有键值对从原哈希表迁移至新哈希表，非常耗时；并且由于哈希表容量 capacity 改变，我们需要通过哈希函数来重新计算所有键值对的存储位置，这进一步增加了扩容过程的计算开销。为此，编程语言通常会预留足够大的哈希表容量，防止频繁扩容
- 负载因子（load factor）是哈希表的一个重要概念，其定义为哈希表的元素数量除以桶数量，用于衡量哈希冲突的严重程度，也常作为哈希表扩容的触发条件。例如在 Java 中，当负载因子超过0.75时，系统会将哈希表扩容至原先的2倍。