### KMP
- 문자열을 비교할 때, 불일치가 발생하면 틀린 문자의 index 이전까지는 일치하는 것을 응용한 알고리즘.
- 상태전이함수(failure function)를 이용하여 일치하지 않는 문자가 발생했을 때, 어디로 이동할지를 결정한다.
  - pi혹은 prefix table이라고 불리는 list를 반환한다.
  - pi[i] = 문자열의 i번째 문자까지 일치하는 가장긴 "proper"한 접두사와 접미사의 최대 길이 = 불일치 발견시 얼마나 skip할 수 있는지의 갯수가 적힌 list
    - proper은 접두사와 접미사 중에서 `전체 문자열이 아닌` 부분 문자열을 의미한다.
      - `abcabc`일 경우 proper = `abc`이다. `abcabcabc`일 경우 proper = `abcabc`이다.

### 실패함수(Failure Function)
- 실패함수는 문자열의 접두사와 접미사가 일치하는 최대길이를 저장한 배열을 반환한다.
  - 이때 자기 자신은 제외한다.
- 예를 들어, `abcabc`의 경우 `a, ab, abc, abca, abcab`까지는 접두사와 접미사가 일치하지만 `abcabc`는 자기 자신이므로 제외한다.
  - `[0, 0, 1, 2, 3]`
  - F(i)가 접두사와 접미사가 같은 최대의 길이라고 했을 때, `ababa`에 대해 
  - F(1)은 `a` 자기 자신은 포함되지 않으므로 0이다.
  - F(2)은 `ab` a와 b가 다르므로 0이다.
  - F(3)은 `aba` 첫a와 마지막a가 같으므로 1이다.
  - F(4)는 `abab` 앞의 ab와 뒤의 ab가 같으므로 2이다.
  - F(5)는 `ababa` 앞의 aba와 뒤의 aba가 같으므로 3이다. (중간 지점을 넘어가도 된다)
- Failure Function의 2개의 포인터를 움직이는 것으로 동작한다.

In [1]:
def partial(s): #상태전이함수, failure function
  g, pi = 0, [0] * len(s)
  for i in range(1, len(s)):
    while g and (s[g] != s[i]): #불일치가 발견됐는데 g가 첫 문자열을 보는 상태가 아니면
      g = pi[g - 1] #상태전이 값으로 되돌림
    pi[i] = g = g + (s[g] == s[i]) #일치한 경우엔 1을 증가시킨 다음에 pi에 저장한다
  
  return pi #pi, prefix table

def match(s, p): #문자열 list반환
  pi = partial(p)

  g, idx = 0, []
  for i in range(len(s)):
    while g and p[g] != s[i]: #불일치가 발견되면
      g = pi[g - 1] #상태전이 값으로 되돌림
    g += p[g] == s[i] #일치한 경우에 한칸 전진
    if g == len(pi): #문자열이 일치하면
      idx.append(i + 1 - g)
      g = pi[g - 1]

  return idx

In [None]:
def fail(s):
  g, pi = 0, [0] * len(s)
  for i in range(1, len(s)):
    while g and (s[g] != s[i]):
      g = pi[g - 1]
    pi[i] = g = g + (s[g] == s[i])

  return pi

def kmp(s, p):
  pi = fail(p)

  g, idx = 0, []
  for i, c in enumerate(s) :
    while g and p[g] != c:
      g = pi[g - 1]
    g += p[g] == c
    if g == len(pi):
      idx.append(i + 1 - g)
      g = pi[g - 1]

  return idx

def find(s, p):
  pi = fail(p)

  g = 0
  for i in range(len(s)):
    while g and p[g] != s[i]:
      g = pi[g - 1]
    g += p[g] == s[i]
    if g == len(pi):
      return True

  return False