# 문자열 집합

https://www.acmicpc.net/problem/14425

## 문제

총 N개의 문자열로 이루어진 집합 S가 주어진다.  
입력으로 주어지는 M개의 문자열 중에서 집합 S에 포함되어 있는 것이 총 몇 개인지 구하는 프로그램을 작성하시오.

## 입력

첫째 줄에 문자열의 개수 N과 M (1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000)이 주어진다.   
다음 N개의 줄에는 집합 S에 포함되어 있는 문자열들이 주어진다.  
다음 M개의 줄에는 검사해야 하는 문자열들이 주어진다.  
입력으로 주어지는 문자열은 알파벳 소문자로만 이루어져 있으며, 길이는 500을 넘지 않는다. 집합 S에 같은 문자열이 여러 번 주어지는 경우는 없다.

## 출력

첫째 줄에 M개의 문자열 중에 총 몇 개가 집합 S에 포함되어 있는지 출력한다.

## 예제 입력 1

5 11  
baekjoononlinejudge  
startlink  
codeplus  
sundaycoding  
codingsh  
baekjoon  
codeplus  
codeminus  
startlink  
starlink  
sundaycoding  
codingsh  
codinghs  
sondaycoding  
startrink  
icerink

## 예제 출력 1

4

## 풀이

__Trie를 공부했으므로 Trie로 풀어보기__  
* Trie를 구현한다.
* 집합 S는 Trie의 insert를 이용한다.
* M개의 문자열은 search를 통해 집합 S에 포함되어 있는지 여부를 판단한다.
______
* python 시간 초과
* pypy 정답

In [1]:
class Node(object):
    def __init__(self, key, data=None):
        self.key = key
        self.data = data
        self.children = {}
        
class Trie(object):
    def __init__(self):
        self.root = Node(None)
        
    def insert(self, string):
        curr_node = self.root
        
        for s in string:
            if s not in curr_node.children:
                curr_node.children[s] = Node(s)
            curr_node = curr_node.children[s]
            
        curr_node.data = string
        
    def search(self, string):
        curr_node = self.root
        
        for s in string:
            if s in curr_node.children:
                curr_node = curr_node.children[s]
            else:
                return False
        if curr_node.data:
            return True
        return False
    

import sys
input = sys.stdin.readline

n, m = map(int, input().split())
trie = Trie()
cnt = 0
for i in range(n+m):
    string = input().rstrip()
    if i < n:
        trie.insert(string)
    else:
        if trie.search(string):
            cnt += 1

print(cnt)

5 11
baekjoononlinejudge
startlink
codeplus
sundaycoding
codingsh
baekjoon
codeplus
codeminus
startlink
starlink
sundaycoding
codingsh
codinghs
sondaycoding
startrink
icerink
4


* Trie는 Python에서 시간 초과이므로 Trie가 아닌 다른 방법으로 풀어본다.
* N과 M의 범위가 1이상 10,000이하 이므로 for문을 통해 확인한다.

In [2]:
import sys
input = sys.stdin.readline

n, m = map(int, input().split())
strings = {input().rstrip() for _ in range(n)}
cnt = 0

for j in range(m):
    string = input().rstrip()
    if string in strings:
        cnt += 1
print(cnt)

5 11
baekjoononlinejudge
startlink
codeplus
sundaycoding
codingsh
baekjoon
codeplus
codeminus
startlink
starlink
sundaycoding
codingsh
codinghs
sondaycoding
startrink
icerink
4
