# クヌース–モリス–プラット法 (KMP法)
https://algoful.com/Archive/Algorithm/KMPSearch

クヌース–モリス–プラット法 (KMP法) は文字列探索アルゴリズムの一種で、発明者3名の名前を冠しています。   
力まかせ探索に比べ、余計な探索(比較)をしないような工夫をすることで、計算量 O(N) を実現します。  

このアルゴリズムでは、複数回文字への探索(比較)をしないようにあらかじめ、部分マッチ用の表を作成しておく必要があります。  
この前処理や複雑な処理のせいで単純な力まかせ探索に比べ、余計なオーバーヘッドが発生し、  
実用上力まかせ探索より処理速度が遅くなったりもします。ですが理論上は高速です。  

### KMP法で用いるずらし表の

パターン文字列(一致してほしいキーワード)において、不一致になった文字(位置)ごとに、
パターン文字の比較再開位置(ずらし位置)を保持した対照表を用意しなければなりません。これを**ずらし表**と呼ぶことにします。

In [9]:
def make_kmp_table(pattern: str):
    len_p = len(pattern)
    table = [0] * (len_p)

    # 一致する数をjに格納
    j = 0

    for i in range(1, len_p):
        if pattern[i] == pattern[j]:
            table[i] = j
            j += 1
        else:
            table[i] = j
            j = 0

    return table

In [10]:
def kmp(target, pattern):
    kmp_table = make_kmp_table(pattern)

    i, p = 0, 0
    while i < len(target) and p < len(pattern):
        if target[i] == pattern[p]:
            # 文字が一致していれば次に進む
            i += 1
            p += 1
        elif p == 0:
            # パターンの先頭において不一致の場合、kmp_tableを使うまでもなく次の比較に進む
            i += 1
        else:
            # patternのうち、いくつかが一致した後に不一致となった場合、kmp_tableによってずらした位置から比較を再開する
            p = kmp_table[p]

    if p == len(pattern):
        return i - p
    return -1


In [13]:
target = "AABABBABABCAB"
pattern = "ABABCA"

kmp(target, pattern)


6