In [10]:
def character_positions(T, pattern):
    # テキストTにおける対象となる各文字に対する位置を格納する辞書を初期化
    L = {char: -1 for char in set(list(T))}

    # パターンの文字ごとの位置を計算
    for j, char in enumerate(pattern):
        L[char] = j  # 複数回現れる場合は最も右の位置が記録される
    
    return L


def boyer_moore(text, pattern):
    m = len(pattern)
    n = len(text)
    L = character_positions(text, pattern)
    result = []  # 照合結果を保存するリスト
    
    print(f"\n{'='*50}")
    print(f"テキスト: {text}")
    print(f"パターン: {pattern}")
    print(f"{'='*50}\n")
    


    k = 0  # テキストの照合開始位置
    trial_count = 0
    
    while k <= n - m:
        j = m - 1  # パターンの末尾から照合開始
        print(f"\n照合位置 k = {k}")
        print(f"テキスト位置: {text[k:k+m]}")
        print(f"パターン    : {pattern}")
        
        while j >= 0:
            if text[k + j] != pattern[j]:
                alpha = text[k + j]
                old_k = k
                k = adjust_position(k, j, alpha, L)
                shift = k - old_k
                
                print(f"不一致: パターン位置 j = {j}, 文字 = {alpha}")
                print(f"右に {shift} 文字ずらします")
                
                result.append((trial_count, old_k, j, alpha))
                break
            j -= 1
        else:
            print("\nパターンが一致しました！")
            result.append((trial_count, k, j, None))
            break
            
        trial_count += 1
    
    return result

def adjust_position(k, j, alpha, L):
    if L[alpha] < j:
        return k + j - L[alpha]
    else:
        return k + 1



text = "なまなまずなまなまこなまなめこ"
pattern = "こなま"
# num_trials = 1

results = boyer_moore(text, pattern)




テキスト: なまなまずなまなまこなまなめこ
パターン: こなま


照合位置 k = 0
テキスト位置: なまな
パターン    : こなま
不一致: パターン位置 j = 2, 文字 = な
右に 1 文字ずらします

照合位置 k = 1
テキスト位置: まなま
パターン    : こなま
不一致: パターン位置 j = 0, 文字 = ま
右に 1 文字ずらします

照合位置 k = 2
テキスト位置: なまず
パターン    : こなま
不一致: パターン位置 j = 2, 文字 = ず
右に 3 文字ずらします

照合位置 k = 5
テキスト位置: なまな
パターン    : こなま
不一致: パターン位置 j = 2, 文字 = な
右に 1 文字ずらします

照合位置 k = 6
テキスト位置: まなま
パターン    : こなま
不一致: パターン位置 j = 0, 文字 = ま
右に 1 文字ずらします

照合位置 k = 7
テキスト位置: なまこ
パターン    : こなま
不一致: パターン位置 j = 2, 文字 = こ
右に 2 文字ずらします

照合位置 k = 9
テキスト位置: こなま
パターン    : こなま

パターンが一致しました！


In [11]:
print(results)



[(0, 0, 2, 'な'), (1, 1, 0, 'ま'), (2, 2, 2, 'ず'), (3, 5, 2, 'な'), (4, 6, 0, 'ま'), (5, 7, 2, 'こ'), (6, 9, -1, None)]
