# 散列表

散列技术是在记录的储存位置和它的关键字之间建立一个确定的对应关系f，使得每个关键字key对应一个储存位置f（key）

我们把f称为散列函数。采用散列技术将记录储存在一块连续的储存空间，储存空间称为散列表或哈希表

散列技术既是储存方法，也是查找方法。最适合查找与给定值相等的记录。

但存在冲突的问题，如果key1 != key2，但f（key1）=f(key2)就为冲突。此时key1和key2为散列函数的同义词。

### 常用方法

计算简单，地址分布均匀

1.直接地址法
f(key)=a*key+b

优点是简单、均匀、不产生冲突

缺点是需要事先知道关键字的分布情况

适合查找表较小且连续的情况

2.数字分析法

适合处理关键字位数比较大的情况（事先知道关键字的分布，且分布均匀）

3.平方取中法

适合不知道关键字的分布，位数不是很大的情况

4.折叠法

事先不知道关键字的分布，且关键字位数比较多的情况

5.除留余数法(最常用)
f（key）=key mod p（p<=m)

mod为求余
若散列表表长为m，那么p最好为小于等于表长的最小质数或不包含小于20质因子的合数

6.随机数法
f(key) = random(key)

当关键字的长度不等时，采用这个方法较合适

### 解决冲突方法

1.开放定址法

如果发生冲突，就去寻找下一个空的散列地址

f(key)=(f(key)+d) mod m(d=1,2,3,...,m-1)线性探测法，会出现堆积

f(key)=(f(key)+d) mod m(d=1方，2方，3方，...,q方，-q方，q<=m/2 二次探测法

f(key)=(f(key)+d) mod m(d为随机数列) 随机探测法


2.再散列函数法

事先准备多个散列函数

3.链地址法

将重复的词储存在单链表里

4.公共溢出区法

建立公共的溢出区

# 散列表（基于链表法解决冲突）

In [105]:
class Node():
    def __init__(self,key):
        self.key = key
        self.next = None

class HashTable:
    def __init__(self, cap=11):
        self._table = [None] * cap
        self._n = 0
        
    def __len__(self):
        return self._n
        
    def _hash(self,key):
        return abs(hash(key))%len(self._table)
    
    def __getitem__(self,key):
        j = self._hash(key)
        node = self._table[j]
        while node is not None and node.key!= key:
            node = node.next
        if node is None:
            raise KeyError('not inside')
        return node
    
    def insert(self,key):
        try:
            self[key]
        except KeyError:
            j = self._hash(key)
            node = self._table[j]
            self._table[j] = Node(key)
            self._table[j].next = node
            self._n +=1
    
    def __delitem__(self,key):
        j = self._hash(key)
        node = self._table[j]
        if node is not None:
            if node.key == key:
                self._table[j] = node.next
                self._n -=1
            else:
                while node.next!= None:
                    pre = node
                    node = node.next
                    if node.key == key:
                        pre.next = node.next
                        self._n -=1
                        break
        

In [106]:
table = HashTable()

In [107]:
table.insert(2)
table.insert(10)
table.insert('a')

In [109]:
table['a']

<__main__.Node at 0x23b033f6048>

# Trie树

In [14]:
class Trie:
    def __init__(self):
        self.root = {}
        self.end = -1
    #添加字符串词
    def insert(self,word):
        curNode = self.root
        for c in word:
            if not c in curNode:
                curNode[c] = {}
            curNode = curNode[c]
        curNode[self.end] = True
    #搜索
    def search(self,word):
        curNode = self.root
        for c in word:
            if not c in curNode:
                return False
            curNode = curNode[c]
        
        if not self.end in curNode:
            return False
        return True
    
    def startswith(self,prefix):
        curNode = self.root
        for c in prefix:
            if not c in curNode:
                return False
            curNode = curNode[c]
        return True

## 朴素字符串匹配算法

In [68]:
#对于字符串str1和str2，查看str2是否在str1中，位置在哪里

def match(str1,str2):
    i = 0
    j = 0
    size1 = len(str1)
    size2 = len(str2)
    if size2 > size1:
        return False
    while i < size1-size2+1:
        if str1[i+j] == str2[j]:
            if j == size2-1:
                return i
            j += 1
        else:
            i = i+1
            j = 0
    return False

In [71]:
a = 'abbbbbba'
b = 'ba'
match(a,b)

6

## 习题

### 两数之和

给定一个整数数组 nums 和一个目标值 target，请你在该数组中找出和为目标值的那 两个 整数，并返回他们的数组下标。

你可以假设每种输入只会对应一个答案。但是，你不能重复利用这个数组中同样的元素。

示例:

给定 nums = [2, 7, 11, 15], target = 9

因为 nums[0] + nums[1] = 2 + 7 = 9
所以返回 [0, 1]

In [2]:
class Solution(object):
    def twoSum(self, nums, target):
        """
        :type nums: List[int]
        :type target: int
        :rtype: List[int]
        """
        if len(nums) <= 1:
            return False
        keys = {}
        for i,v in enumerate(nums):
            if target-v in keys:
                return [keys[target-v],i]
            else:
                keys[v] = i
        return None

### 反转字符串

编写一个函数，其作用是将输入的字符串反转过来。输入字符串以字符数组 char[] 的形式给出。

不要给另外的数组分配额外的空间，你必须原地修改输入数组、使用 O(1) 的额外空间解决这一问题。

你可以假设数组中的所有字符都是 ASCII 码表中的可打印字符。

 

示例 1：

输入：["h","e","l","l","o"]
输出：["o","l","l","e","h"]


示例 2：

输入：["H","a","n","n","a","h"]
输出：["h","a","n","n","a","H"]

In [15]:
class Solution(object):
    def reverseString(self, s):
        """
        :type s: List[str]
        :rtype: None Do not return anything, modify s in-place instead.
        """
        s[0::] = s[::-1]

In [16]:
class Solution(object):
    def reverseString(self, s):
        """
        :type s: List[str]
        :rtype: None Do not return anything, modify s in-place instead.
        """
        i = 0
        j = len(s)-1
        while i<j:
            s[i],s[j] = s[j],s[i]
            i += 1
            j -= 1

### 反转字符串里的单词

给定一个字符串，逐个翻转字符串中的每个单词。

 

示例 1：

输入: "the sky is blue"
输出: "blue is sky the"


示例 2：

输入: "  hello world!  "
输出: "world! hello"
解释: 输入字符串可以在前面或者后面包含多余的空格，但是反转后的字符不能包括。


示例 3：

输入: "a good   example"
输出: "example good a"
解释: 如果两个单词间有多余的空格，将反转后单词间的空格减少到只含一个。


 

说明：


	无空格字符构成一个单词。
	输入字符串可以在前面或者后面包含多余的空格，但是反转后的字符不能包括。
	如果两个单词间有多余的空格，将反转后单词间的空格减少到只含一个。

In [35]:
class Solution(object):
    def reverseWords(self, s):
        """
        :type s: str
        :rtype: str
        """
        a = s.strip()
        tmp = a.split(' ')
        tmp = tmp[::-1]
        result = tmp[0]
        for i in range(1,len(tmp)):
            if tmp[i] != '':
                result = result + ' ' + tmp[i]
        return result

In [36]:
class Solution(object):
    def reverseWords(self, s):
        """
        :type s: str
        :rtype: str
        """
        return ' '.join(s.split()[::-1])