In [3]:
def keyToIndexes(keys, n):
    """Returns the indexes corresponding to
    the keys for an array of length n."""
    return list(map(lambda key: key % n, keys))

In [4]:
keyToIndexes([3,5,8,10], 4)

[3, 1, 0, 2]

In [5]:
keyToIndexes([3, 4, 8, 10], 4)

[3, 0, 0, 2]

In [6]:
keyToIndexes([3,5,8,10], 8)

[3, 5, 0, 2]

In [7]:
keyToIndexes([3, 4, 8, 10], 8)

[3, 4, 0, 2]

由此可见，较小的装载因子，数组长度是素数，这都是有帮助的。

##### 非数字键的哈希
常规的字符串，可以考虑返回字符串中的ASCII值的加和。
但回文字符串或包含相同的字符但字符顺序不同的字符串，
以及英语中很多单词首字母分布的不平均，使这种方法效果并不理想。
因此，如果字符串的长度大于某一个阈值，可以将首字母从字符串中丢弃，然后再计算加和。
此外，如果字符串长度超过了某一个长度，可以减去最后一个字符的ASCII值。

In [8]:
def stringHash(item):
    """Generates an integer key from a string."""
    if len(item) > 4 and \
    (item[0].islower() or item[0].isupper()):
        item = item[1:]
    sum = 0
    for ch in item:
        sum += ord(ch)
    if len(item) > 2:
        sum -= 2 * ord(item[-1])
    return sum

In [9]:
stringHash('cinema')

328

In [10]:
stringHash('iceman')

296

In [11]:
def keysToIndexs(keys, n, hash = lambda key: key):
    """Returns the array indexes corresponding to the
    hashed keys for an array of length n."""
    return list(map(lambda key: hash(key) % n, keys))

In [12]:
keysToIndexs([3, 5, 8, 10], 4)

[3, 1, 0, 2]

In [13]:
keysToIndexs(['cinema', 'iceman'], 2, stringHash)

[0, 0]

In [14]:
keysToIndexs(['cinema', 'iceman'], 3, stringHash)

[1, 2]

##### 线性探测
对于插入来说，解决冲突的最简单方式，就是从冲突位置开始搜索数组，找到第一个可能的位置，这个过程叫做线性探测。

一开始的时候，数组单元格填满了EMPTY值。当一个键被删除之后，单元格的值设置为DELETED。在开始插入的时候，运行哈希函数来计算项的主索引。如果主索引的单元格不可用，算法会将索引向右移动以探测一个可用的单元格。

假设数组没有变满并且没有重复的项，那么，向一个名为table的数组进行插入的代码如下：
```python
# get the home index
index = abs(hash(item)) % len(tables)

# Stop searching when an empty cell is encountered
while not table[index] in (EMPTY, DELETED):

    # Increment the index and wrap around to first
    # position if necessary
    index = (index + 1) % len(table)
    
# An empty cell is found, so store the item
table[index] = item
```

访问和删除的工作方式使类似的。对于访问来说，当前的数组单元格为空或者它包含目标项的时候，就停止探测过程。

##### 二次探测
避免和线性探测相关的聚簇的一种方式是，从冲突位置将对空位置的搜索向前推进一定的距离。
二次探测通过将主索引增加每一次尝试的距离的平方，从而实现这一点。如果从主索引k开始并且距离为d，每一轮使用的公式为$ k+d^2 $.

以下是使用二次探索的插入过程的代码：
```python
# set the initial key, index, and distance
key = abs(hash(item))
distance = 1
homeIndex = key % len(table)
index = homeIndex

# Stop searching when an unocuppied cell is encountered
while not table[index] in [EMPTY, DELETED]:
    # Increment the index and wrap around to the
    # first position if necessary
    index = (homeIndex + distance ** 2) % len(table)
    distance += 1
    
# An empty cell is found, so store the item
table[index] = item
```

##### 链化
在一种叫做链化的冲突处理策略中，项都存储在链表或链的一个数组中。每一项的键都会找到该项已经插入到链中的桶或索引。  
使用链来插入一项的代码如下：
```python
# Get the home index
index = abs(hash(item)) % len(table)

# Access a bucket and store the item at the head
# of its linked list
table[index] = Node(item, table[index])