In [1]:
# Knuth-Morris-Pratt string matching
# David Eppstein, UC Irvine, 1 Mar 2002

#from http://code.activestate.com/recipes/117214/
def KnuthMorrisPratt(text, pattern):
    '''Yields all starting positions of copies of the pattern in the text.
Calling conventions are similar to string.find, but its arguments can be
lists or iterators, not just strings, it returns all matches, not just
the first one, and it does not need the whole text in memory at once.
Whenever it yields, it will have read the text exactly up to and including
the match that caused the yield.

    본문에서 pattern이 시작되는 곳을 모두 찾아 yield해라.
호출하는 방식은 string.find와 비슷하지만 argument는 그냥 string이 아니라 list나
iterator일 수 있다. 처음 일치하는 부분이 아니라 모든 일치하는 부분을 찾아라.
메모리에 전체 text를 적재할 필요는 없다. text는 pattern이 일치하는 부분까지, 또는 
일치하는 부분을 포함한 부분까지 주어질 것이다.

이게 O(m + n)이라고??
'''

    # allow indexing into pattern and protect against change during yield
    pattern = list(pattern)

    # build table of shift amounts
    shifts = [1] * (len(pattern) + 1)
    shift = 1
    for pos in range(len(pattern)):
        while shift <= pos and pattern[pos] != pattern[pos-shift]:
            shift += shifts[pos-shift]
        shifts[pos+1] = shift

    # do the actual search
    startPos = 0
    matchLen = 0
    for c in text:
        while matchLen == len(pattern) or \
              matchLen >= 0 and pattern[matchLen] != c:
            startPos += shifts[matchLen]
            matchLen -= shifts[matchLen]
        matchLen += 1
        if matchLen == len(pattern):
            yield startPos