# 호스풀 알고리즘

## 1) 문제 정의
주어진 텍스트 내에서 특정 패턴이 나타나는 위치를 찾는 문자열 매칭 문제를 해결하기 위해 호스풀 알고리즘을 사용합니다. 이 알고리즘은 시프트 테이블을 이용하여 미스매치가 발생할 경우 패턴을 얼마나 멀리 이동할지를 미리 계산합니다.

## 2) 알고리즘 설명
호스풀 알고리즘은 다음과 같은 단계로 동작합니다:
1. 시프트 테이블을 생성합니다. 이 테이블은 패턴 내의 각 문자에 대해 미스매치가 발생했을 때 얼마나 멀리 이동할지를 나타냅니다.
2. 텍스트를 순회하며 패턴을 매칭시킵니다. 만약 미스매치가 발생하면 시프트 테이블을 참고하여 패턴을 오른쪽으로 이동시킵니다.

## 3) 손으로 푼 예제
- 손으로 푼 결과 이미지 삽입 ![손으로 푼 예제](img/horspool_example.jpg)

## 4) 코드 개요
- 입력 변수:
  - `T`: 텍스트 문자열
  - `P`: 패턴 문자열
- 출력: 패턴이 처음 나타나는 위치의 인덱스 (없을 경우 -1)
- 함수 설명:
  - `shift_table(pat)`: 패턴 문자열을 입력으로 받아 시프트 테이블을 생성하여 반환합니다.
  - `search_horspool(T, P)`: 텍스트 `T` 내에서 패턴 `P`를 호스풀 알고리즘을 사용하여 검색하고, 패턴이 처음 나타나는 위치의 인덱스를 반환합니다.

## 5) 코드

In [5]:
NO_OF_CHARS = 128

def shift_table(pat):
    m = len(pat)
    tbl = [m] * NO_OF_CHARS  # 시프트 테이블을 패턴의 길이로 초기화
    for i in range(m-1):  # 패턴의 마지막 문자를 제외하고 반복
        tbl[ord(pat[i])] = m - i - 1  # 패턴 내 각 문자에 대한 시프트 값을 설정
    return tbl

def search_horspool(T, P):
    m = len(P)
    n = len(T)
    t = shift_table(P)
    i = m - 1
    while i <= n - 1:
        k = 0
        while k <= m - 1 and P[m - 1 - k] == T[i - k]:
            k += 1
        if k == m:
            return i - m + 1
        else:
            tc = t[ord(T[i])]
            i += max(1, tc - k)
    return -1
    
# 예제 사용
text = "THIS IS A SIMPLE EXAMPLE"
pattern = "EXAMPLE"
result = search_horspool(text, pattern)
print("패턴이 처음 나타나는 위치:", result)

패턴이 처음 나타나는 위치: 17


# 6) 테스트 코드

In [4]:
# 예제 사용
text = "THIS IS A SIMPLE EXAMPLE"
pattern = "EXAMPLE"
result = search_horspool(text, pattern)
print("패턴이 처음 나타나는 위치:", result)

패턴이 처음 나타나는 위치: 17


# 7) 수행 결과
결과 캡춰하여 이미지로 삽입 
# 8) 복잡도 분석
시프트 테이블 생성의 시간 복잡도는 패턴의 길이에 비례하여 O(m) 입니다. 여기서 m은 패턴의 길이입니다.
검색 과정의 시간 복잡도는 최악의 경우 O(mn)입니다. 하지만 일반적으로 호스풀 알고리즘은 매우 효율적으로 작동하여 평균적으로 O(n)에 가까운 성능을 보입니다.
# 9) 협력 내용
이 프로젝트는 팀별로 협력하여 진행되었습니다. 각 팀원은 다음과 같은 역할을 담당했습니다: