## 예제 6.3

## 1. 문제 정의
- 호스풀 알고리즘

## 2. 알고리즘 설명

- 호스풀 알고리즘(Horspool Algorithm)을 사용하여 문자열 패턴 매칭을 수행하는 코드이다. 이 알고리즘의 목적은 텍스트 내에서 주어진 패턴을 효율적으로 찾는 것

1. NO_OF_CHARS: 사용되는 문자 집합의 크기를 정의
2. shift_table: 패턴 문자열 pat에 대한 이동 테이블을 생성
    - m은 패턴 문자열의 길이
3. search_horspool 함수는 텍스트 T 내에서 패턴 P를 찾는다.

#### 동작원리
- shift_table 테이블은 각 문자가 패턴 내에서 발견되었을 때, 패턴을 얼마나 이동시킬지를 결정
- search_horspool 패턴의 끝에서부터 비교를 시작하며, 불일치가 발생하면 이동 테이블을 참고하여 패턴을 오른쪽으로 이동시킨다.
- 패턴의 끝에서부터 문자를 비교하면서 일치 여부를 확인
- 일치하는 경우 패턴의 시작 위치를 반환
- 불일치가 발생하면 이동 테이블을 참고하여 패턴을 이동시킨다.
- 동 거리는 현재 위치에서 불일치 문자의 이동 거리와 비교 위치까지의 거리를 고려하여 계산된다.

## 3. 손으로 푼 예제

![KakaoTalk_20240522_220821297.jpg](attachment:KakaoTalk_20240522_220821297.jpg)

## 4. 알고리즘 개요

#### 입력변수
1. shift_table
    - pat: 문자열에 대한 이동 테이블을 생성
2. search_horspool
    - T: 패턴을 검색할 텍스트
    - P: 텍스트 내에서 찾고자 하는 문자열

#### 출력
1. shift_table
    - list of int: 주어진 패턴 문자열에 대한 이동 테이블을 반환, 각 ASCII 문자에 대해 이동 거리를 저장
2. search_horspool
    - int: 패턴이 텍스트 내에서 처음 발견된 위치(인덱스)를 반환, 만약 패턴이 텍스트 내에 존재하지 않으면 -1을 반환

## 5. 코드

In [None]:
NO_OF_CHARS = 128
def shift_table(pat):
    m = len(pat)
    tbl = [m]*NO_OF_CHARS

    for i in range(m-1):
        tbl[ord(pat[i])] = m-1-i

    return tbl

def search_horspool(T, P):
    m = len(P)
    n = len(T)
    t = shift_table(P)
    i = m-1
    while(i <= n-1):
        k=0
        while k <= m-1 and P[m-1-k]==T[i-k]:
            k += 1
        if k == m :
            return i-m+1
        else :
            tc = t[ord(T[i-k])]
            i += (tc-k)
    return -1

## 6. 테스트 코드

In [None]:
NO_OF_CHARS = 128
def shift_table(pat):
    m = len(pat)
    tbl = [m]*NO_OF_CHARS

    for i in range(m-1):
        tbl[ord(pat[i])] = m-1-i

    return tbl

def search_horspool(T, P):
    m = len(P)
    n = len(T)
    t = shift_table(P)
    i = m-1
    while(i <= n-1):
        k=0
        while k <= m-1 and P[m-1-k]==T[i-k]:
            k += 1
        if k == m :
            return i-m+1
        else :
            tc = t[ord(T[i-k])]
            i += (tc-k)
    return -1


print("패턴의 위치: ", search_horspool("APPLEMANGOBANANAGRAPE", "BANAN"))

## 7. 출력 결과

![image.png](attachment:image.png)

## 8. 복잡도 분석

### 1. shift_table
- 테이블 tbl을 길이 NO_OF_CHARS로 초기화하는 데 O(NO_OF_CHARS) 시간이 걸린다.
- 패턴의 각 문자에 대해 이동 거리를 계산하는 루프는 O(m) 시간이 걸린다.

따라서 O(m + NO_OF_CHARS)이며 NO_OF_CHARS는 상수(ASCII 문자 집합의 크기 128)로 간주되므로 시간 복잡도는 O(m)이다.
### 2. search_horspool
- 외부 while 루프는 텍스트의 길이 n에 비례하여 실행되며, 이 루프는 텍스트에서 패턴을 찾기 위해 n번 반복할 수 있다.
- 내부 while 루프는 패턴의 길이 m에 비례하여 실행되며, 최악의 경우, 모든 문자가 비교될 수 있다.
- 패턴이 일치하지 않는 경우, 이동 테이블을 사용하여 패턴을 이동시키는 시간은 상수 시간 O(1)이다.

- 최악의 경우, 모든 문자가 비교되고 계속해서 한 문자씩 이동하는 상황이 발생할 수 있다. 이 경우 시간 복잡도는 O(m * n)

하지만 보이어-무어 호스풀 알고리즘은 일반적으로 효율적으로 동작하며, 평균적으로 O(n)의 시간 복잡도를 가진다.

