## dict中的hash表

在3.7+中，dict是有序的，这是一个语言特性。

### 3.6之前的无序字典

可以把hash表看成一个列表，列表的每个元素有三个数据项：哈希值（hash），key，value

> 这里为了方便说明有所简化，实际上第二个元素和第三个元素是key的引用和value的引用

```python
entries = [
    ['--', '--', '--'],
    [hash, key, value],
    ['--', '--', '--'],
    ['--', '--', '--'],
    [hash, key, value],
]
```

在一个空的dict中添加元素的过程如下

```python
# 给字典添加一个值，key为hello，value为word
my_dict['name'] = 'leo'

# 假设是一个空列表，hash表初始如下
entries = [
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
]
```

1. 计算key的hash值`hash_value = hash('name')`，假设值为 1234543
2. 通过hash值，算出在hash表中index的位置：`index = hash_value & ( len(entries) - 1)`，假设算出来为3

之后，插入值，entries变成

```python
entries = [
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
    [12343543, 'name', 'leo'],
    ['--', '--', '--'],
]
```

### 3.7+中的hash表

3.7+中，除了entries之外，还有一个indices列表来记录顺序

```python
# 假设是一个空列表，hash表初始如下
indices = [None, None, None, None, None, None]
entries = []
```

1. 计算key的hash值`hash_value = hash('name')`，假设值为 1234543
2. 通过hash值，算出在hash表中index的位置：`index = hash_value & ( len(entries) - 1)`，假设算出来为3

```python
# 会找到indices的index为3的位置，并插入entries的长度
indices = [None, None, None, 0, None, None]
# 此时entries会插入第一个元素
entries = [
    [12343543, 'name', 'leo']
]
```

再插入一个元素

```python
my_dict['hanmeimei'] = 'lihua'

hash_value = hash('hanmeimei')  # 假设值为 34323545
index = hash_value & ( len(indices) - 1)  # 假设index值计算后同样等于 0
```

此时hash表会变成下面这样
```python
# 会找到indices的index为0的位置，并插入entries的长度
indices = [1, None, None, 0, None, None]
# 此时enteies会插入第一个元素
entries = [
    [12343543, 'name', 'leo'],
    [34323545, 'hanmeimei', 'lihua']
]
```

### 3.6和3.7+ 字典实现比较

- 3.7+新加indices
- 3.6中直接用hash值算出的index就是entries中的索引，3.7+中算出的index是indices中的索引，indices对应的值才是entries中的索引。
- 3.6hash表是稀疏表，3.7+中是满的。
- 3.7中entries就是插入时的顺序，所以是有序的

## Set中的hash表

其实和dict一样，只是每项没有value，只有key