# ボイヤー・ムーア法 (BM法) 
https://algoful.com/Archive/Algorithm/BMSearch

ボイヤー・ムーア法 (BM法) は文字列探索アルゴリズムの一種で、発明者2名の名前を冠しています。  
KMP法と同様に、予め余計な探索をを行わなくて済むようにずらし表を作成する必要があります。  
KMP法では理論上高速とされるわりに実用上速度が出にくいという欠点がありましたが、BM法は実用上高速に動作するとされています。  

## KMP法との違い
KMP法との大きな違いは、探索するパターン文字列の先頭ではなく、**末尾から照合**を行うという点にあります。  
例えば末尾が一致しなければ、パターン文字数分一気に探索位置を飛ばすことができるかもしれません。  

### BM法で用いるずらし表
単純にパターン文字列の末尾からの距離で表します。  
ただし、同じ文字が出てくる場合、より後ろの位置(ずらす大きさが小さい値)を優先します。  
したがってパターン文字列 "ABBC" の場合、次のようになります。


各文字の末尾からの距離は次のようになるので、これの各文字での最小値をとったものがずらし表となります。


|A|B|B|C|
|---|---|---|---|
|3|2|1|0|

In [9]:
from typing import Dict

def make_bm_table(pattern: str) -> Dict:
    pattern_len = len(pattern)
    table = {}
    for i in range(pattern_len):
        table[pattern[i]] = pattern_len - i - 1
    return table

In [10]:
def bm_serach(target, pattern):
    table = make_bm_table(pattern)
    pattern_len = len(pattern)
    target_len = len(target)

    i, p = pattern_len-1, 0

    while i < target_len:
        # パターン末尾に位置を合わせる
        p = pattern_len - 1

        while p >= 0:
            if target[i] == pattern[p]:
                p -= 1
                i -= 1
            else:
                break

        if p < 0:
            return i + 1

        shift_1 = table.get(pattern[p], pattern_len)
        shift_2 = pattern_len - p
        i += max(shift_1, shift_2)

    return -1

In [11]:
bm_serach("AAAXABAABBCAC","ABBC")

7