## 문자열 매칭 알고리즘 구현

문자열 집합 S가 존재한다
ex) S = {"www","xman","yman"}.
 임의의 문자열이 N개 주어졌을때 각 임의의 문자열 내에 집합 S에 속하는 문자열이 존재하는지 판별하시오.

아래의 문제를 순서대로 작성하세요. 1번만 푸셔도 됩니다.
1. 문자열의 여러 부분 문자열 중 하나라도 집합 S에 있으면 'YES'를 출력하고, 아무것도없으면 'NO'를 출력한다.
2. 주어진 문자열의 여러부분 문자열 중 처음 매칭된 패턴과 문자열 시작 포지션을 출력한다.
3. 주어진 문자열의 여러부분 문자열 중 매칭 가능한 모든 패턴과 문자열 시작 포지션을 출력한다.

## 입력
첫째 줄에 집합 S의 크기 N이 주어진다. (1 ≤ N ≤ 1000)

다음 N개 줄에 집합 S의 원소들이 주어진다. 이 문자열의 길이는 100을 넘지 않는다.
다음 줄에 답을 판별해야 하는 문자열의 개수 Q가 주어진다. (1 ≤ Q ≤ 1000)

다음 Q개 줄에 답을 판별해야 하는 문자열이 주어진다. 이 문자열의 길이는 10000을 넘지
않는다.
입력으로 주어지는 모든 문자열은 알파벳 소문자로만 이루어져 있다.

## 출력
Q개 줄에 각 문자열에 대한 답을 출력한다.


### 예제 입력
```
9(문자열 집합S의 원소 개수)
"aaa",""aaaabb", ""aabbcc", "abb", "bcc", "bbcc", "aabbccdd", "aaabb”, “cccd”
(comma, new line 구분은 자유)
1(매칭 대상 문자열 수)
"aaaabbaabbccdd"
```

### 예제 출력
출력형식은 무관합니다.
1. 문자열 집합 중 “cccd”만 주어진 문자열의 부분 문자열에 속하지 않으므로 YES, YES,
YES, YES, YES, YES, YES, YES, NO 이다.
2. 아래와같이 첫번째로 매칭된 패턴의 시작포지션과 문자열 패턴을 출력한다.
    
    #pos = 0, pattern = aaa

    #pos = 0, pattern = aaaabb
    
    #pos = 6, pattern = aabbcc
    
    #pos = 3, pattern = abb
    
    #pos = 9, pattern = bcc
    
    #pos = 8, pattern = bbcc
    
    #pos = 6, pattern = aabbccdd
    
    #pos = 1, pattern = aaabb

3. 아래와같이 가능한 모든 문자열 패턴의 시작 포지션과 문자열 패턴을 출력한다

    #pos = 0, pattern = aaa
    
    #pos = 1, pattern = aaa
    
    #pos = 1, pattern = aaabb
    
    #pos = 3, pattern = abb
    
    #pos = 0, pattern = aaaabb
    
    #pos = 7, pattern = abb
    
    #pos = 8, pattern = bbcc
    
    #pos = 9, pattern = bcc
    
    #pos = 6, pattern = aabbcc
    
    #pos = 6, pattern = aabbccdd


## 코드 설명
1. pattern_set : set 자료형으로 pattern들을 담고 있음
2. string_list : 검증하고자 하는 string 을 list 형태로 담고 있음.(set일 경우 중복 입력시 에러가 나고, 순서 정보가 담겨 있지 않아 정돈되지 않음)
3. defaultdict : 매칭되는 여러 position에 대한 정보를 담을 때, 더욱 가독성 있고 짧은 코딩을 위해 import
4. self.anaysis(1~3) : 각각의 출력 결과를 Nested dictionary 형태로 저장한 data 변수(json 변환 가능)

In [None]:
# import sys
# inp = sys.stdin.readline
import re
from collections import defaultdict

# 변수 입력 및 확인하는 작업
N = int(input())
pattern_set = {input().rstrip() for i in range(N)}
print(f'pattern set is : {pattern_set}')
Q = int(input())
str_list = [input().rstrip() for i in range(Q)]
print(f'string list is : {str_list}')


class WordMatching:
 def __init__(self,pattern_set=set, str_list=list):
  self.pattern_set=pattern_set
  self.str_list=str_list
  self.analysis1=dict() # 문제 1번의 데이터 저장소
  self.analysis2=dict() # 문제 2번의 데이터 저장소
  self.analysis3=dict() # 문제 3번의 데이터 저장소

#1. 문자열 당 패턴 유무 출력
 def match_yesno(self):
  for string in self.str_list:
   self.analysis1[string]=dict()
   print(f'Are following patterns in \'{string}\'?')
   for pattern in self.pattern_set:
    match = re.compile(pattern).search(string)
    if match==None:
     self.analysis1[string][pattern] = 'NO'
    else:
     self.analysis1[string][pattern] = 'YES'
    print(f'{pattern} : {self.analysis1[string][pattern]}')

#2. 첫 문자열 패턴 출력
 def match_findfirst(self):
  for string in self.str_list:
   self.analysis2[string]=dict()
   print(f'FIRST matching pattern of string \'{string}\' is descripted below:')
   for pattern in self.pattern_set:
    match = re.compile(pattern).search(string)
    if match!=None:
     self.analysis2[string][pattern]=match.start()
     print(f'#pos = {match.start()}, pattern = {pattern}')

 #3. 모든 문자열 패턴 출력
 def match_findall(self):
  for string in self.str_list:
   self.analysis3[string]=defaultdict(list)
   print(f'ALL matching patterns of string \'{string}\' is descripted below:')
   for pattern in self.pattern_set:
    matched = re.compile(pattern).finditer(string)
    for match in matched:
     if match != None:
      self.analysis3[string][pattern].append(match.start())
      print(f'#pos = {match.start()}, pattern = {pattern}')


# 인스턴스 생성
s1=WordMatching(pattern_set,str_list)

2
사랑
우정
pattern set is : {'우정', '사랑'}
2
사랑보다 먼, 우정보다는 가까운
사랑, 사랑, 사랑
string list is : ['사랑보다 먼, 우정보다는 가까운', '사랑, 사랑, 사랑']


In [None]:
# Yes no matching 확인
s1.match_yesno()
print(s1.analysis1)


Are following patterns in '사랑보다 먼, 우정보다는 가까운'?
우정 : YES
사랑 : YES
Are following patterns in '사랑, 사랑, 사랑'?
우정 : NO
사랑 : YES
{'사랑보다 먼, 우정보다는 가까운': {'우정': 'YES', '사랑': 'YES'}, '사랑, 사랑, 사랑': {'우정': 'NO', '사랑': 'YES'}}


In [None]:
s1.match_findfirst()
print(s1.analysis2)

FIRST matching pattern of string '사랑보다 먼, 우정보다는 가까운' is descripted below:
#pos = 8, pattern = 우정
#pos = 0, pattern = 사랑
FIRST matching pattern of string '사랑, 사랑, 사랑' is descripted below:
#pos = 0, pattern = 사랑
{'사랑보다 먼, 우정보다는 가까운': {'우정': 8, '사랑': 0}, '사랑, 사랑, 사랑': {'사랑': 0}}


In [None]:
s1.match_findall()
print(s1.analysis3)

ALL matching patterns of string '사랑보다 먼, 우정보다는 가까운' is descripted below:
#pos = 8, pattern = 우정
#pos = 0, pattern = 사랑
ALL matching patterns of string '사랑, 사랑, 사랑' is descripted below:
#pos = 0, pattern = 사랑
#pos = 4, pattern = 사랑
#pos = 8, pattern = 사랑
{'사랑보다 먼, 우정보다는 가까운': defaultdict(<class 'list'>, {'우정': [8], '사랑': [0]}), '사랑, 사랑, 사랑': defaultdict(<class 'list'>, {'사랑': [0, 4, 8]})}
