# KMP

`-` 길이가 $N$인 텍스트에서 길이가 $M$인 특정 문자열의 등장 위치를 최악의 경우에도 $O(N+M)$에 찾는 알고리즘

## IOIOI

- 문제 출처: [백준 5525번](https://www.acmicpc.net/problem/5525)

`-` 문자열 매칭 알고리즘을 이용해 해결하는 문제이다 (사실 아니었음)

`-` Rabin-Karp 알고리즘은 최악의 경우 $O(nm)$이기 때문에 시간 초과이다

`-` 알고리즘 시간에 배운 KMP 알고리즘을 사용하자 (공부해야 됨)

In [7]:
def KMP_search(A, P, π):
    i = 1  # pointing to A
    j = 1  # pointing to P
    count = 0
    while i <= M:
        if j == 0 or A[i] == P[j]:
            i += 1
            j += 1
        else:
            j = π[j]
        if j == 2 * N + 2:  # match
            count += 1
            j = π[j]
    return count


def KMP_failure_array(P):
    j = 1
    k = 0
    π = [-1] * (2 * N + 3)  # 0 ~ 2*N + 2
    π[1] = 0
    while j <= 2 * N + 1:
        if k == 0 or P[j] == P[k]:
            j += 1
            k += 1
            π[j] = k
        else:
            k = π[k]
    return π


N = int(input())
M = int(input())
S = ''.join(['*', input()])
Pn = ''.join(['*', ('IO' * N), 'I'])
π = KMP_failure_array(Pn)
print(KMP_search(S, Pn, π))

# input
# 2
# 13
# OOIOIOIOIIOII

 2
 13
 OOIOIOIOIIOII


2


## 찾기

- 문제 출처: [백준 1786번](https://www.acmicpc.net/problem/1786)

`-` KMP 알고리즘을 구현하는 문제이다

`-` 인터넷에 설명이 잘 되어 있으니 일부분만 간략하게 정리하겠다

`-` 매칭이 실패했다면 어디서부터 비교해야 될까?

`-` 현재 매칭이 실패한 것이므로 직전까진 일치했다는 의미이다

`-` 그럼 직전 문자열의 LPS의 길이만큼은 앞에서부터 일치하므로 비교를 생략해도 된다

`-` 예컨대 길이가 $2$라면 $0,1$번째 문자열은 일치할테니 $2$번째 문자열부터 비교를 시작하면 된다

`-` $\pi[i]$는 패턴의 $0$번째부터 $i - 1$번째 문자까지 고려했을 때 해당 부분 문자열의 LPS의 길이라고 하자

`-` 즉, 우리가 궁금한 직전 문자열의 LPS의 길이만큼 비교를 생략하기 위해 위와 같이 $\pi$ 배열을 정의하는 것이다

`-` 그럼 어디서부터 비교하면 되는지를 미리 구해둔 $\pi$ 배열을 통해 알 수 있게 된다

`-` $\pi$ 배열을 구할 때도 KMP 알고리즘의 원리를 사용한다

`-` $\pi$ 배열을 구할 때 $i$와 $j$는 현재 비교할 최장 접미사의 마지막 위치 포인터와 최장 접두사의 마지막 위치 포인터이다

`-` $j=-1$인 상황은 현재 $i$로는 가능한 LPS가 없다는 의미이다

`-` 그래서 $i$를 오른쪽으로 한 칸 옮기고 $i$가 바뀌어 LPS가 존재하지 않는지 처음부터 확인해야 하므로 $j$도 오른쪽으로 한 칸 옮겨 $0$으로 만들어주자

`-` $p[i] = p[j]$이면 LPS의 길이를 $1$만큼 더 늘린 것이다

`-` 그럼 정의상 $\pi[i + 1] = j + 1$이 된다

`-` else 문의 $j = \pi[j]$는 KMP에서 패턴 매칭이 실패했을 때와 같은 논리를 적용한 것이다

`-` KMP 알고리즘의 시간 복잡도는 $O(N + M)$인데 이것도 간략히 설명하겠다 ($N$는 패턴을 찾을 문자열의 길이, $M$은 패턴의 길이)

`-` 탐색 부분의 while 문에서 $i + (i - j)$는 매 반복마다 적어도 $1$씩 증가한다

`-` $i + (i - j) \le 2i \le 2N$이므로 탐색 부분의 시간 복잡도는 $O(N)$이다

`-` 마찬가지의 논리로 실패 배열을 만드는 코드의 시간 복잡도는 $O(M)$이다

`-` 따라서 KMP 알고리즘의 시간 복잡도는 $O(N + M)$이다

In [5]:
def kmp_search(t, p, π):
    n = len(t)
    m = len(p)
    i = 0
    j = 0
    matching_indices = []
    while i < n:
        if j == -1 or t[i] == p[j]:
            i += 1
            j += 1
        else:
            j = π[j]
        if j == m:
            matching_indices.append(i - m + 1)
            j = π[j]
    return matching_indices


def kmp_failure_array(p):
    m = len(p)
    π = [-1] * (m + 1)
    i = 0
    j = -1
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def solution():
    T = input()
    P = input()
    π = kmp_failure_array(P)
    matching_indices = kmp_search(T, P, π)
    print(len(matching_indices))
    print(*matching_indices)


solution()

# input
# ABC ABCDAB ABCDABCDABDE
# ABCDABD

 ABC ABCDAB ABCDABCDABDE
 ABCDABD


1
16


## 바이러스

- 문제 출처: [백준 7575번](https://www.acmicpc.net/problem/7575)

`-` 어떤 바이러스 코드의 길이가 $x$라고 하자

`-` $x > K$라면 해당 바이러스 코드에서 길이가 $K$인 연속된 부분 문자열도 바이러스 코드이다

`-` 따라서 $K$ 길이의 코드만 확인해도 바이러스 감염 여부를 판단할 수 있다

`-` 만약 $K$보다 $M_i$가 작으면 검사하지 않아도 바이러스에 감염되지 않았음을 알 수 있다

`-` 프로그램 $1$에 대해 가능한 모든 $K$ 길이의 코드를 순회하자

`-` 나머지 프로그램에서 해당 코드가 등장하는지 확인하자 (앞 뒤로 한 번씩 순회하며 매칭 여부를 확인하자)

`-` 이는 KMP 알고리즘을 통해 수행할 것이다

`-` 따라서 알고리즘의 시간 복잡도는 최악의 경우 $O(M(K + NM))$이다

In [21]:
def kmp_search(s, p, π):
    n = len(s)
    m = len(p)
    i = 0
    j = 0
    while i < n:
        if j == -1 or s[i] == p[j]:
            i += 1
            j += 1
        else:
            j = π[j]
        if j == m:
            return True
    return False


def kmp_failure_array(p):
    m = len(p)
    i = 0
    j = -1
    π = [-1] * (m + 1)
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def check_virus(codes, k):
    criterion = codes[0]
    m = len(criterion)
    for i in range(m - k + 1):
        p = criterion[i:i + k]
        π = kmp_failure_array(p)
        exists_virus = all(kmp_search(s, p, π) or kmp_search(s[::-1], p, π) for s in codes)
        if not exists_virus:
            continue
        return True
    return False


def solution():
    N, K = map(int, input().split())
    codes = []
    for _ in range(N):
        _ = input()
        code = list(map(int, input().split()))
        codes.append(code)
    if check_virus(codes, K):
        print("YES")
        return
    print("NO")


solution()

# input
# 3 4
# 13
# 10 8 23 93 21 42 52 22 13 1 2 3 4
# 11
# 1 3 8 9 21 42 52 22 13 41 42
# 10
# 9 21 42 52 13 22 52 42 12 21

 3 4
 13
 10 8 23 93 21 42 52 22 13 1 2 3 4
 11
 1 3 8 9 21 42 52 22 13 41 42
 10
 9 21 42 52 13 22 52 42 12 21


YES


## 광고

- 문제 출처: [백준 1305번](https://www.acmicpc.net/problem/1305)

`-` KMP의 실패 함수를 활용하는 문제라고 한다

`-` 가능한 광고 길이 중 가장 짧은 것을 $x$라고 하고 광고판에 보이는 문자열을 $s$라고 하자

`-` 그럼 $s = x[i\text{:}] + x + \cdots + x +  x[\text{:}i]$와 같은 형식일 것이다 (파이썬의 인덱싱과 문자열 덧셈)

`-` 그런데 $s = x[i\text{:}] + x[\text{:}i] + x[i\text{:}]  + \cdots + x[\text{:}i] + x[i\text{:}] +  x[\text{:}i]$로 나타낼 수 있다

`-` 그러면 $x^*( = x[i\text{:}] + x[\text{:}i])$도 가능한 광고 길이 중 가장 짧은 것이 될 수 있고 $x^*$은 $s$의 접미사이자 접두사가 된다

`-` 접미사 부분은 접두사 부분이 반복해서 나오는 것이라 볼 수 있으니 $x$는 $s$에서 접미사 부분을 생략한 것이라 볼 수 있다

`-` 가능한 광고 길이 중 가장 짧아야 하므로 $s$의 LPS를 구한 뒤 LPS의 길이를 $s$의 길이에서 뺀 것이 정답이 된다

`-` 자기 자신은 접두사이자 접미사이므로 제외해야 한다

`-` 접두사와 접미사가 겹치는 구간이 있는 경우를 고려해보자 (접미사를 제외하면 접두사의 일부분도 같이 잘려나간다)

`-` 예컨대 $s=ababab$라고 해보자

`-` 그럼 $s$의 LPS는 $abab$이다

`-` 이때 LPS의 정의에 따라 $s[0] = s[2], s[1] = s[3], s[2] = s[4], s[3] = s[5]$이고 다시 쓰면 $s[0] = s[2] = s[4], s[1] =s[3]=s[5]$이다

`-` 즉, $s[0]$과 $s[1]$이 번갈아 등장한다 

`-` 따라서 $s$에서 $s$의 LPS인 $abab$를 생략한 $ab$가 가능한 광고 길이 중 가장 짧은 것이 된다

`-` 접두사와 접미사가 겹치는 구간이 있어도 LPS의 정의에 따라 문제되지 않는다

`-` 실패 함수만 만들면 되니 $s$의 길이인 광고판의 크기를 $L$이라 할 때 시간 복잡도는 $O(L)$이다

`-` 정답은 $L - \pi[L]$이 된다

`-` 좀 더 일반화하면 다음과 같다

`-` 문구가 반복되려면 $s[0\dots k-1] = s[L-k\dots L-1]$인데 $t=L-k$라 하면 $0\le i < k$에 대해 $s[i] = s[i+t]$이다

`-` 즉, $s$는 $t$의 주기를 띄는데 같은 문구를 무한이 붙여서 광고를 하므로 $\dfrac{L}{t}$가 문구가 몇 번 붙여졌는지를 나타낸다

`-` 이는 $t$가 가능한 광고의 길이를 나타내며 $L$은 상수이므로 $k$가 최대일 때 $t$가 최소이니 가능한 광고의 길이 중 가장 짧은 것이 된다

`-` $k$의 최댓값은 $s$에서 가장 긴 공통 접두사와 접미사의 길이이다

`-` 그런데 이는 $s$의 LPS의 길이와 같고 $\pi[L]$이 $s$의 LPS의 길이이므로 $L - \pi[L]$이 정답이 된다

`-` 참고로 $\pi[i]$는 패턴의 $0$번째부터 $i - 1$번째 문자까지 고려했을 때 해당 부분 문자열의 LPS의 길이이다

`-` 옛날엔 함수 한 땀 한 땀 구현했는데 지금은 원리를 알고 있고 구현이 어느 정도 익숙해졌으면 복붙해서 가지고 온다

In [2]:
def kmp_failure_array(p):
    m = len(p)
    i = 0
    j = -1
    π = [-1] * (m + 1)
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def solution():
    L = int(input())
    s = input()
    π = kmp_failure_array(s)
    print(L - π[L])


solution()

# input
# 6
# ababab

 6
 ababab


2


## 문자열 제곱

- 문제 출처: [백준 4354번](https://www.acmicpc.net/problem/4354)

`-` $n$이 가장 크려면 $a$는 가장 짧아야 한다

`-` 즉, $s=a+a+\cdots+a + a$ 꼴이다

`-` $s$의 접두사와 접미사 모두 $a$이다

`-` 이때 $s$의 LPS를 계산하면 $a^{n-1}$이 될 것이다

`-` 만약 LPS의 길이의 $2$배가 $s$의 길이보다 짧다면 $n=1$이다

`-` $s=LPS + x + LPS$인데 $x$를 표현할 수 없다

`-` [광고](https://www.acmicpc.net/problem/1305) 문제의 풀이에서 알 수 있듯이 $s$는 $t=\operatorname{len}(s) - \operatorname{len}(LPS)$ 길이의 최소 주기를 가진다

`-` 만약 $t$가 $\operatorname{len}(s)$의 약수가 아니라면 $n=1$이고 약수라면 $n = \dfrac{\operatorname{len}(s)}{t}$이다

In [1]:
def kmp_failure_array(p):
    m = len(p)
    π = [-1] * (m + 1)
    i = 0
    j = -1
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def solve_testcase(s):
    m = len(s)
    π = kmp_failure_array(s)
    t = m - π[m]
    if m % t == 0:
        print(m // t)
        return
    print(1)


def solution():
    while True:
        s = input()
        if s == ".":
            break
        solve_testcase(s)


solution()

# input
# abcd
# aaaa
# ababab
# .

 abcd


1


 aaaa


4


 ababab


3


 .


`-` 내가 생각하지 못한 풀이가 있었다

`-` $s$의 길이를 $m$이라 할 때 가능한 $n$은 $m$의 약수이다

`-` 따라서 $m$의 약수를 큰 것부터 순회하며 $s$가 해당 약수의 주기를 띄는지 확인하면 된다

`-` $f(m)$을 $m$의 약수의 개수라고 할 때 위 알고리즘의 시간 복잡도는 $O\left(m f\left(m\right)\right)$이다

## 속타는 저녁 메뉴

- 문제 출처: [백준 11585번](https://www.acmicpc.net/problem/11585)

`-` [문자열 제곱](https://www.acmicpc.net/problem/4354) 문제를 풀었다면 이 문제도 해결할 수 있다

`-` $s$를 현재 원형 룰렛의 모양이라 하고 $x$를 저녁 메뉴로 고기를 선택하게 되는 원형 룰렛의 모양이라 하자

`-` $ s = x[i \text{:}]  + x[\text{:}i]$를 만족하는 $i(0 \le i \le N)$의 개수를 $M$이라 하자

`-` 그럼 $\dfrac{M}{N}$이 저녁 메뉴로 고기를 선택하는 확률이다

`-` $s$의 LPS의 길이를 $L$이라고 하자

`-` 그럼 $s$는 $t=N - L$ 길이의 최소 주기를 가진다

`-` 이때 $N$이 $t$의 배수라면 $x$를 적당히 재조정해 $s$로 만들 수 있으며 사이클의 길이가 $t$이므로 그 개수는 $\dfrac{N}{t}$이다

`-` 따라서 $N$이 $t$의 배수라면 $\dfrac{M}{N} = \dfrac{1}{t}$이고 그렇지 않다면 $\dfrac{1}{N}$이다

In [1]:
def kmp_failure_array(p):
    m = len(p)
    i = 0
    j = -1
    π = [-1] * (m + 1)
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def solution():
    N = int(input())
    s = input().split()
    _ = input().split()
    π = kmp_failure_array(s)
    t = N - π[N]
    if N % t == 0:
        print(f"1/{t}")
        return
    print(f"1/{N}")


solution()

# input
# 6
# A A B A A B
# B A A B A A

 6
 A A B A A B
 B A A B A A


1/3


`-` 내가 생각하지 못한 풀이가 있었다

`-` 원형에서의 매칭이므로 $s$를 $2$배 하고 KMP 알고리즘을 통해 $x$를 찾는 방식으로 풀 수 있다

`-` 단, $s$와 $x$가 같은 경우엔 결과에서 $1$을 차감해줘야 한다

`-` 조건을 만족하는 경우를 직접 센다는 점에서 이 풀이가 더 직관적이라 느껴진다

## 시저 암호

- 문제 출처: [백준 1893번](https://www.acmicpc.net/problem/1893)

`-` 주어진 조건을 만족하는 시프트 값을 모두 찾아야 한다

`-` 시프트 값이 $X$라고 해보자

`-` 그럼 $S$를 $X$만큼 앞으로 옮기고 $W$가 단 $1$개만 존재하는지 확인하면 된다

`-` 대신 $W$를 $X$만큼 뒤로 옮기고 $S$에서 $W$가 단 $1$개만 존재하는지 확인해도 된다

`-` $|A|$개의 시프트 값에 대해 매칭 개수를 KMP 알고리즘으로 찾자

`-` 알고리즘의 시간 복잡도는 $O(N|A|(|S| + |W|))$인데 $N$의 범위가 주어지지 않아서 시간 안에 동작할지 모르겠다

`-` 시간 안에 동작한다!

In [1]:
def kmp_search(s, p, π):
    n = len(s)
    m = len(p)
    i = 0
    j = 0
    count = 0
    while i < n:
        if j == -1 or s[i] == p[j]:
            i += 1
            j += 1
        else:
            j = π[j]
        if j == m:
            count += 1
            j = π[j]
    return count


def kmp_failure_array(p):
    m = len(p)
    i = 0
    j = -1
    π = [-1] * (m + 1)
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def shift(A, W, X):
    n = len(A)
    mapping = {a: A[(i + X) % n] for i, a in enumerate(A)}
    return [mapping[w] for w in W]


def check_shift_value(A, W, S, X):
    W = shift(A, W, X)
    π = kmp_failure_array(W)
    count = kmp_search(S, W, π)
    return count == 1


def solve_testcase():
    A = input()
    W = input()
    S = input()
    shift_values = [X for X in range(len(A)) if check_shift_value(A, W, S, X)]
    if not shift_values:
        print("no solution")
        return
    if len(shift_values) == 1:
        print(f"unique: {shift_values[0]}")
        return
    print("ambiguous:", *shift_values)


def solution():
    N = int(input())
    for _ in range(N):
        solve_testcase()


solution()

# input
# 3
# ABC
# ABC
# ABCBBBABC
# ABC
# ABC
# ABCBCAABC
# D7a
# D7a
# D7aaD77aDD7a

 3
 ABC
 ABC
 ABCBBBABC


no solution


 ABC
 ABC
 ABCBCAABC


unique: 1


 D7a
 D7a
 D7aaD77aDD7a


ambiguous: 1 2


## 시계 사진들

- 문제 출처: [백준 10266번](https://www.acmicpc.net/problem/10266)

`-` [속타는 저녁 메뉴](https://www.acmicpc.net/problem/11585) 문제를 풀 때 사용한 방식을 활용하여 풀 수 있다

`-` 두 시계를 $x,y$로 나타내자

`-` 각도를 증가하는 순으로 정렬하자

`-` 시계 $x$를 적당히 회전시킨 뒤 $12$시 방향부터 시계 방향으로 등장하는 시계 바늘을 읽었을 때 $y$와 동일하면 된다

`-` 원형 배열 $x$에서 $y$가 매칭되는지 확인하면 되는데 이를 용이하게 하기 위해 $x$를 $2$배 하여 비교하자

`-` 또한 시계를 회전시킬 수 있으므로 절대적인 각도가 아닌 상대 각도가 필요하다

`-` 따라서 인접한 각도의 차이 배열로 변환하자

`-` 즉, 시계 방향으로 얼마나 차이가 나는지 계산하면 된다

`-` 이때 $12$시를 넘어갈 수 있으므로 $(a[i + 1] - a[i] + 360000)$을 $360000$으로 나눈 나머지를 사용하자

`-` 이후 KMP 알고리즘을 사용해 매칭 여부를 확인하면 된다

`-` 전체 알고리즘의 시간 복잡도는 $O(n \log n)$이다

`-` 나는 KMP 문제인 걸 알고 풀었는데 시계 각도 비교에 KMP 알고리즘을 쓰는 걸 떠올리기 힘들 것 같다

`-` 문자열 또는 이터러블 객체의 연속된 부분에 대해 매칭을 선형 시간에 수행하고 싶으면 KMP 알고리즘을 시도해 보자

In [1]:
def kmp_search(s, p, π):
    n = len(s)
    m = len(p)
    i = 0
    j = 0
    count = 0
    while i < n:
        if j == -1 or s[i] == p[j]:
            i += 1
            j += 1
        else:
            j = π[j]
        if j == m:
            count += 1
            j = π[j]
    return count


def kmp_failure_array(p):
    m = len(p)
    i = 0
    j = -1
    π = [-1] * (m + 1)
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def solution():
    n = int(input())
    watch_x = sorted(map(int, input().split()))
    watch_y = sorted(map(int, input().split()))
    watch_x += watch_x
    full = 360000
    watch_x = [(watch_x[i + 1] - watch_x[i] + full) % full for i in range(2 * n - 1)]
    watch_y = [(watch_y[i + 1] - watch_y[i] + full) % full for i in range(n - 1)]
    π = kmp_failure_array(watch_y)
    count = kmp_search(watch_x, watch_y, π)
    if count >= 1:
        print("possible")
        return
    print("impossible")


solution()

# input
# 2
# 0 270000
# 180000 270000

 2
 0 270000
 180000 270000


possible


## 음식 조합 세기

- 문제 출처: [백준 10977번](https://www.acmicpc.net/problem/10977)

`-` 국어를 못하는 건지 문제 이해에 시간이 조금 걸렸다

`-` $N$가지 음식들을 하나의 원소라 생각하면 고유한 원소의 개수를 구하면 된다

`-` 단, 음식들의 순서는 상관없다

`-` 즉, $1$번, $3$번, $5$번이나 $3$번, $5$번, $1$번이나 똑같은 음식들이다

`-` 예컨대 $M=6$이고 이번 끼니에 제공된 음식들의 번호가 $1,3,5$라고 해보자

`-` 그럼 다음 끼니의 번호는 $2,4,6$이고 그 다음 끼니의 번호는 $3,5,1$로 반복된다

`-` 가능한 음식 번호 조합은 $1,3,5$와 $2,4,6$으로 $2$개이다

`-` 브루트 포스로 접근하면 매번 제공하는 끼니를 시뮬레이션 돌릴 수 있고 이것이 처음 제공한 끼니와 동일해질 때까지 반복하면 된다

`-` 이는 최악의 경우 $O(NM)$의 시간 복잡도를 가지므로 제한 시간 안에 동작할 수 없다

`-` 잘 생각해 보면 현재 끼니의 음식 번호는 이전 끼니의 음식 번호에 $1$을 더한 것이다

`-` 즉, 음식 번호의 차이는 동일하다

`-` 길이가 $N$인 음식 번호 차이 배열 $s$를 고려하자 

`-` 단, $s$의 마지막 원소는 마지막 음식이 첫 번째 음식이 되기 위해 거쳐간 끼니의 횟수이다

`-` $s$에서 앞뒤로 $k$ 크기의 부분 배열이 같아 $s[0...k-1] = s[N-k...N-1]$를 만족한다고 하자

`-` 이때 $q=N-k$라 하면 $q$는 $s[i] = s[i+q],\; (0\le i \le k-1)$를 만족한다

`-` 이때 $k$가 최대라면 $q$는 최소이므로 $t=N-\pi[N]$라고 하면 $t$는 $q$중 최소이다

`-` $t$를 주기로 $s$에서 사이클을 돌렸을 때 배열의 원소들이 기존과 같다면 더 이상의 끼니를 확인할 필요가 없다

`-` 즉, $s[i]$를 $s[(i+1) \bmod N]$으로 바꾸는 작업을 $t$번 수행했을 때 각 위치의 원소가 기존과 같아야 한다

`-` $t$는 최소 주기이며 다른 주기는 모두 $t$의 배수여야 한다

`-` 그렇지 않다면 $s[i] = s[i + p],\; (p > t)$라는 건데 그럼 $t$ 길이의 주기이면서 $p$ 길이의 주기를 가지게 된다

`-` 이는 $\operatorname{gcd}(t, p)$의 주기를 가지는 것이고 이는 $t$보다 작으므로 모순이다

`-` $N$이 $t$의 배수가 아니라면 지금부터 $M$번의 끼니를 거쳐야 기존으로 돌아오므로 현재 끼니를 포함해 $M$개의 음식 조합이 존재한다

`-` $N$이 $t$의 배수라면 $s$는 $t$번의 사이클을 돌면 기존과 같아진다 

`-` 따라서 $(\text{$t$번째 음식 번호} - \text{$0$번째 음식 번호})$만큼의 음식 조합이 존재한다 

`-` KMP 알고리즘을 사용하는 문제인 걸 알았는데 생각보다 푸는데 오래 걸렸다

In [1]:
def kmp_failure_array(p):
    m = len(p)
    i = 0
    j = -1
    π = [-1] * (m + 1)
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def solve_testcase():
    M, N = map(int, input().split())
    x = [int(input()) for _ in range(N)]
    s = [x[i + 1] - x[i] for i in range(N - 1)]
    s.append(M + x[0] - x[N - 1])
    π = kmp_failure_array(s)
    t = N - π[N]
    if π[N] > 0 and N % t == 0:
        print(x[t] - x[0])
        return
    print(M)


def solution():
    T = int(input())
    for _ in range(T):
        solve_testcase()


solution()

# input
# 2
# 6 3
# 1
# 3
# 5
# 16 4
# 1
# 3
# 9
# 11

 2
 6 3
 1
 3
 5


2


 16 4
 1
 3
 9
 11


8


## 카멜레온 부분 문자열

- 문제 출처: [백준 13506번](https://www.acmicpc.net/problem/13506)

`-` $S$의 카멜레온 부분 문자열 $T$는 일단 $S$의 접두사이면서 접미사여야 한다

`-` 이 중에서 가장 긴 문자열을 구하면 된다

`-` 이는 정의상 LPS이므로 $S$의 LPS가 접두사와 접미사를 제외한 구간에서 등장하는지 확인하면 된다

`-` 이때 $S$에서 앞뒤로 문자 $1$개씩만 제외한 구간에서 탐색해도 괜찮다

`-` 등장하면 끝이지만 만약 등장하지 않는다면 어떻게 해야 될까?

`-` 그럼 LPS 다음으로 긴 공통 접두사 접미사를 고려해야 하고 이는 LPS의 LPS이다

`-` 만약 LPS의 LPS가 존재하지 않는다면 $S$의 카멜레온 부분 문자열은 없는 것이다

`-` $S$의 LPS의 LPS를 $x$라고 하자

`-` 일단 $x$는 $S$의 접두사이면서 접미사이다

`-` 또한 $S$의 접두사에 위치한 LPS의 접미사에 위치한 $x$는 $S$의 접두사도 아니고 접미사도 아닌 위치에 존재한다

`-` 따라서 $x$는 카멜레온 부분 문자열이다

`-` 즉, 문자열 $S$의 LPS를 구한 뒤 LPS가 $S$의 접두사와 접미사를 제외한 구간에서 등장하는지 확인하자

`-` 그렇지 않다면 LPS의 LPS인 $x$를 구한 뒤 $x$가 $S$의 접두사와 접미사를 제외한 구간에서 등장하는지 확인하자

`-` 둘 모두에서 등장하지 않거나 LPS 또는 LPS의 LPS가 존재하지 않으면 카멜레온 부분 문자열은 없는 것이다

`-` 최악의 경우에도 문자열 매칭과 LPS를 구하는 작업을 $2$번만 수행하면 된다

`-` $S$의 길이를 $n$이라 할 때 매칭 여부와 LPS를 찾는데 KMP 알고리즘을 사용할 것이므로 알고리즘의 시간 복잡도는 $O(n)$이다

In [1]:
def kmp_search(s, p, π):
    n = len(s)
    m = len(p)
    i = 0
    j = 0
    while i < n:
        if j == -1 or s[i] == p[j]:
            i += 1
            j += 1
        else:
            j = π[j]
        if j == m:
            return True
    return False


def kmp_failure_array(p):
    m = len(p)
    i = 0
    j = -1
    π = [-1] * (m + 1)
    while i < m:
        if j == -1 or p[i] == p[j]:
            i += 1
            j += 1
            π[i] = j
        else:
            j = π[j]
    return π


def check_chameleon_substring(s, p):
    if not p:
        return -1
    n = len(p)
    π = kmp_failure_array(p)
    lps = p[:π[n]]
    if not lps:
        return check_chameleon_substring(s, lps)
    if kmp_search(s[1:-1], lps, π):
        return lps
    return check_chameleon_substring(s, lps)


def solution():
    S = input()
    answer = check_chameleon_substring(S, S)
    print(answer)


solution()

# input
# papapapap

 papapapap


papap
