# KMP
KMP算法的关键是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的。函数本身包含了模式串的局部匹配信息。时间复杂度O(m+n)。

In [4]:
def kmp(string, substring):
    m = len(string)
    n = len(substring)
    cur = 0 #起始指针cur
    table = partialTable(substring)
    while cur <= m - n:
        for i in range(n):
            if string[i+cur] != substring[i]:
                cur += max(i - table[i-1], 1)
                break
        else:
            return True, cur
    return False


def partialTable(substring):
    '''partialTable("ABCDABD") -> [0, 0, 0, 0, 1, 2, 0]'''
    prefix = set()
    postfix = set()
    step = [0]
    for i in range(1,len(substring)):
        #前缀：指除最后一个字符外，一个字符串的全部头部组合
        #后缀：指除第一个字符外的全部尾部组合
        prefix.add(substring[:i]) 
        postfix = {substring[j:i+1] for j in range(1,i+1)}
        step.append(max([len(item) for item in (prefix & postfix \
                                                or {''})]))
    return step

def naiveMatch(string, substring):
    m = len(string)
    n = len(substring)
    for i in range(m - n + 1):
        if string[i: i+n] == substring:
            return True
    return False

In [6]:
print(naiveMatch("ABC ABCDAB ABCDABCDABDE", "ABCDABD"))
#print(partialTable("ABCDABD"))
print(kmp("BBC ABCDAB ABCDABCDABDE", "ABCDABD"))

True
(True, 15)


# [KMP的改进](https://blog.csdn.net/qq_33160271/article/details/68065605)


KMP算法中有一个不足的地方，子串的出现是随机的，如果子串在主串中的位置靠后时，KMP算法就会变得比较低效。比如：

主串为：aspowqeursoolksnkhiozbgwoinpweuirabaac
子串为：abaac

显然，子串要到最后才会得到匹配．

因此，可以选择从主串的首和尾同时开始匹配，且不需要比较到最末才判断是否存在匹配的子串，而是通过剩下的字符数，来判断是否存在足够的字符与子串匹配，如果不足的话，那样就不存在，否则就继续匹配下去。