# 哈希表理论基础


- 哈希表是根据关键码的值而直接进行访问的数据结构（其实数组就是一张哈希表，哈希表中关键码就是数组的索引下标，然后通过下标直接访问数组中的元素）

- 一般哈希表都是用来快速判断一个元素是否出现在集合里

- 哈希函数是用来将数据映射到哈希表上的

- 哈希碰撞：哈希函数映射的两个数据到了哈希表的同一个索引处，解决办法有拉链法和

    -  拉链法：将发生冲突的元素用链表存储起来（拉链法要选择适当的哈希表的大小，这样既不会因为数组空值而浪费大量内存，也不会因为链表太长而在查找上浪费太多时间）
    
    -  线性探测法：依靠哈希表中的空位来解决碰撞问题（一定要保证哈希表大小（tableSize）大于数据规模大小（dataSize））
 
- 常见的三种哈希结构：数组、set（集合）、map（映射）

| 集合               | 底层实现 | 是否有序 | 数值是否可以重复 | 能否更改数值 | 查询效率 | 增删效率 |
| ------------------ | -------- | -------- | ---------------- | ------------ | -------- | -------- |
| std::set           | 红黑树   | 有序     | 否               | 否           | O(log n) | O(log n) |
| std::multiset      | 红黑树   | 有序     | 是               | 否           | O(logn)  | O(logn)  |
| std::unordered_set | 哈希表   | 无序     | 否               | 否           | O(1)     | O(1)     |

- std::unordered_set 底层实现为哈希表，std::set 和 std::multiset 的底层实现是红黑树，红黑树是一种平衡二叉搜索树，所以 key 值是有序的，但 key 不可以修改，改动key 值会导致整棵树的错乱，所以只能删除和增加

| 映射               | 底层实现 | 是否有序 | 数值是否可以重复 | 能否更改数值 | 查询效率 | 增删效率 |
| ------------------ | -------- | -------- | ---------------- | ------------ | -------- | -------- |
| std::map           | 红黑树   | key有序  | key不可重复      | key不可修改  | O(logn)  | O(logn)  |
| std::multimap      | 红黑树   | key有序  | key可重复        | key不可修改  | O(log n) | O(log n) |
| std::unordered_map | 哈希表   | key无序  | key不可重复      | key不可修改  | O(1)     | O(1)     |

- std::unordered_map 底层实现为哈希表，std::map 和 std::multimap 的底层实现是红黑树。同理，std::map 和 std::multimap 的 key 也是有序的（这个问题也经常作为面试题，考察对语言容器底层的理解）

- 当我们要使用集合来解决哈希问题的时候，优先使用 unordered_set，因为它的查询和增删效率是最优的，如果需要集合是有序的，那么就用set，如果要求不仅有序还要有重复数据的话，那么就用 multiset

- 那么再来看一下 map，在 map 是一个 key value 的数据结构，map中，对 key 是有限制，对 value 没有限制的，因为 key 的存储方式使用红黑树实现的