# 문자열 매칭 알고리즘 구현

문자열 집합 S가 존재한다 ex) S = {"www","xman","yman"}. 임의의 문자열이 N개 주어졌
을때 각 임의의 문자열 내에 집합 S에 속하는 문자열이 존재하는지 판별하시오.

아래의 문제를 순서대로 작성하세요. 1번만 푸셔도 됩니다.
1. 문자열의 여러 부분 문자열 중 하나라도 집합 S에 있으면 'YES'를 출력하고, 아무것도
없으면 'NO'를 출력한다.

2. 주어진 문자열의 여러부분 문자열 중 처음 매칭된 패턴과 문자열 시작 포지션을 출력한다.

3. 주어진 문자열의 여러부분 문자열 중 매칭 가능한 모든 패턴과 문자열 시작 포지션을 출력한다.

## 입력
첫째 줄에 집합 S의 크기 N이 주어진다. (1 ≤ N ≤ 1000)
다음 N개 줄에 집합 S의 원소들이 주어진다. 이 문자열의 길이는 100을 넘지 않는다.
다음 줄에 답을 판별해야 하는 문자열의 개수 Q가 주어진다. (1 ≤ Q ≤ 1000)
다음 Q개 줄에 답을 판별해야 하는 문자열이 주어진다. 이 문자열의 길이는 10000을 넘지
않는다.
입력으로 주어지는 모든 문자열은 알파벳 소문자로만 이루어져 있다.

## 출력
Q개 줄에 각 문자열에 대한 답을 출력한다.

## 예제 입력
```
9
aaa aaaabb aabbcc abb bcc bbcc aabbccdd aaabb cccd
1
aaaabbaabbccdd
```

## 예제 출력

출력형식은 무관합니다.
1. 문자열 집합 중 “cccd”만 주어진 문자열의 부분 문자열에 속하지 않으므로 YES, YES,
YES, YES, YES, YES, YES, YES, NO 이다.
2. 아래와같이 첫번째로 매칭된 패턴의 시작포지션과 문자열 패턴을 출력한다.
```
#pos = 0, pattern = aaa
#pos = 0, pattern = aaaabb
#pos = 6, pattern = aabbcc
#pos = 3, pattern = abb
#pos = 9, pattern = bcc
#pos = 8, pattern = bbcc
#pos = 6, pattern = aabbccdd
#pos = 1, pattern = aaabb
```

3. 아래와같이 가능한 모든 문자열 패턴의 시작 포지션과 문자열 패턴을 출력한다.
```
#pos = 0, pattern = aaa
#pos = 1, pattern = aaa
#pos = 1, pattern = aaabb
#pos = 3, pattern = abb
#pos = 0, pattern = aaaabb
#pos = 7, pattern = abb
#pos = 8, pattern = bbcc
#pos = 9, pattern = bcc
#pos = 6, pattern = aabbcc
#pos = 6, pattern = aabbccdd
```

In [2]:
# 문자열 집합 S 입력
n = int(input())
s_list = list(map(str, input().split()))

# 매칭 대상 문자열 입력
q = int(input())
q_list = []
for _ in range(q):
    q_list.append(input())

assert n == len(s_list) and q == len(q_list)

ans_one = ['NO' for _ in range(n)]
ans_two = []
ans_three = []

def compute_lps(pat, lps):
    start = 0  
    i = 1 # lps[0]은 항상 0

    while i < len(pat):
        if pat[i] == pat[start]: # 패턴 일치하면 다음 인덱스 비교
            start += 1
            lps[i] = start
            i += 1
        else: # 패턴 불일치
            if start != 0:
                start = lps[start-1]
            else:
                lps[i] = 0
                i += 1

def KMP(pat, txt):
    M, N = len(pat), len(txt)
    lps = [0 for _ in range(M)]
    i, j = 0, 0 

    compute_lps(pat, lps)

    while i < N:
        # 패턴 같은 경우 양쪽 인덱스를 모두 증가시킴
        if pat[j] == txt[i]:
            i += 1
            j += 1
        # 패턴 다른 경우
        elif pat[j] != txt[i]:
            # j가 0이 아니면 앞 문자열 lps에 대해 재검사
            if j != 0:
                j = lps[j-1]
            # j가 0이면 일치하는 부분이 없으므로 인덱스 증가
            else:
                i += 1

        if j == M: # 패턴 탐색 성공
            if ans_one[s_list.index(pat)] == 'NO':
                ans_two.append(f'# pos = {i-j}, pattern = {pat}')
            ans_one[s_list.index(pat)] = 'YES'
            ans_three.append(f'# pos = {i-j}, pattern = {pat}')
            
            j = lps[j-1] # 이전 인덱스의 lps값을 참조

for query in q_list:
    for s_elem in s_list:
        KMP(s_elem, query)

print('='*72)
print('문제1 답')
for i in ans_one:
    print(i)

print('\n문제2 답')
for i in ans_two:
    print(i)

print('\n문제3')
for i in ans_three:
    print(i)
print('='*72)

9
aaa aaaabb aabbcc abb bcc bbcc aabbccdd aaabb cccd
1
aaaabbaabbccdd
문제1 답
YES
YES
YES
YES
YES
YES
YES
YES
NO

문제2 답
# pos = 0, pattern = aaa
# pos = 0, pattern = aaaabb
# pos = 6, pattern = aabbcc
# pos = 3, pattern = abb
# pos = 9, pattern = bcc
# pos = 8, pattern = bbcc
# pos = 6, pattern = aabbccdd
# pos = 1, pattern = aaabb

문제3
# pos = 0, pattern = aaa
# pos = 1, pattern = aaa
# pos = 0, pattern = aaaabb
# pos = 6, pattern = aabbcc
# pos = 3, pattern = abb
# pos = 7, pattern = abb
# pos = 9, pattern = bcc
# pos = 8, pattern = bbcc
# pos = 6, pattern = aabbccdd
# pos = 1, pattern = aaabb
