##### 보이어무어법 알아보기
보이어무어법 : KMP법보다 효율적이어서 실제 문자열 검색에서 널리 사용하는 알고리즘
- 패턴에 포함되지 않는 문자를 만난 경우
    - 패턴 이동량이 곧 n입니다. 패턴에 포함되지 않는만큼 밀어냅니다
  
  
- 패턴에 포함되는 문자를 만난 경우
    - 마지막에 나오는 위치의 인덱스가 k이면 이동량이 n - k - 1입니다.
    - 같은 문자가 패턴 안에 중복해서 존재하지 않으면 패턴의 맨 끝 문자의 이동량은 n입니다.

###### 7-3

In [4]:
# 보이어무어법으로 문자열 검색하기(문자열 길이는 0 ~ 255개)

def bm_match(txt : str, pat: str) -> int:
    """보이어무어법으로 문자열 검색"""
    skip = [None] * 256                 # 건너뛰기 표

    # 건너뛰기 표 만들기
    for pt in range(256):
        skip[pt] = len(pat)
    for pt in range(len(pat)):
        skip[ord(pat[pt])] = len(pat) - pt - 1

    # 검색하기
    while pt < len(txt):
        pp = len(pat) - 1
        while txt[pt] == pat[pp]:
            if pp == 0:
                return pt
            pt -= 1
            pp -= 1
        pt += skip[ord(txt[pt])] if skip[ord(txt[pt])] > len(pat) - pp else len(pat) - pp

    return -1


if __name__ == "__main__":
    s1 = input('텍스트를 입력하세요 : ')        # 텍스트용 문자열
    s2 = input('패턴을 입력하세요 : ')          # 패턴용 문자열

    idx = bm_match(s1, s2)                      # 문자열 s1 ~ s2를 보이어무어법으로 검색

    if idx == -1:
        print('텍스트 안에 패턴이 존재하지 않습니다.')
    else:
        print(f'{s1}\n{s2}')
        print(f'{(idx + 1)}번째 문자가 일치합니다')

ABABCDEFGHA
ABC
3번째 문자가 일치합니다


##### 문자열 검색 알고리즘의 시간 복잡도
텍스트의 길이 : n
패턴의 길이 : m
  
  
- 브루트 포스법
    - O(mn) 이지만 일부로 꾸며낸 패턴이 아니라면 O(n)

- KMP법
    - 최악의 경우에도 O(n)
    - 패턴 안에 반복이 없으면 효율은 좋지 않음

- 보이어무어법
    - 최악의 경우 O(n), 평균 O(n / m)
    - 배열 2개로 알고리즘을 구현하면 효율성이 떨어짐
    

###### 보충 수업 7-2 : 문자 코드를 다루는 ord() 함수와 chr() 함수
ord() : 문자의 유니코드포인트를 정수로 반환  
chr() : 유니코드를 문자로 반환

In [14]:
print(ord('A'))
print(chr(97))

65
a
