# 문자열 검색

문자열 검색이란 어떤 문자열 안에 다른 문자열이 포함되어 있는지 검사하고, 만약 포함되어 있다면 어디에 위치하는지 찾아내는 것이다.

# 브루트 포스법

브루트 포스법은 단순히 문자열을 선형 검색하는 방법이다. 문자열 A에 찾고자 하는 문자열 패턴 B가 포함되어 있는지 첫 인덱스부터 차례로 검사하는 것이다.

**[알고리즘]**
1. 문자열 A의 첫 번째 원소와 문자열 B의 첫 번째 원소를 비교한다.
2. 같다면 문자열 B의 두 번째 원소와 비교한다 ... 같은 문자열을 찾을 때까지 반복

브루트 포스는 이미 검사한 위치를 반복하여 검사하기 때문에 효율이 좋지 않은 알고리즘이다.

In [36]:
# 브루트 포스법으로 문자열 검사하기 - 내가 짠 코드 

def bf_match(txt, pat):
    nt = len(txt)
    np = len(pat)
    i = 0
    for i in range(nt):
        j = 0
        while j < np and txt[i] == pat[j]:
            i += 1
            j += 1
        if j == np:
            return i - np
        j = 0
    return 0
        
txt = 'Helwlwlwlwlsladskf' # 9, 10, 11
pat = 'adskf'
idx = bf_match(txt, pat)
print(idx)

13


In [49]:
# 브루트 포스법으로 문자열 검사하기 - 책 코드

def bf_match(txt, pat):
    pt = 0
    pp = 0
    nt = len(txt)
    np = len(pat)
    while pt < nt and pp < np:
        if txt[pt] == pat[pp]:
            pt += 1
            pp += 1
        else:
            pt = pt - pp + 1
            pp = 0
    if pp == np:
        return pt - pp
    return -1

txt = 'Helwlwlwlwlsladskf' # 9, 10, 11
pat = 'wl'
idx = bf_match(txt, pat)
print(idx)

3


## 멤버십 연산자와 표준 라이브러리를 사용한 문자열 검색

- ```ptn in txt``` : ptn이 txt에 포함되어 있나?
- ```ptn not in txt``` : ptn이 txt에 포함되어 있지 않나?

### find, index 계열 함수로 구현하기

|함수명|사용법|설명|
|:--:|:---:|:--:|
|find()|```str.find(sub[, start[, end]])```|str의 [start:end]에 sub가 포함되면 그 가운데 가장 작은 인덱스를 반환하고, 그렇지 않으면 -1을 반환한다.|
|rfind()|```str.rfind(sub[, start [, end]])```|문자열str의 [start:end]에 sub가 포함되면 그 가운데 가장 큰 인덱스를 반환하고, 그렇지 않으면 -1을 반환한다.|
|index()|```str.index(sub[, start [, end]])```|find() 함수와 같은 기능을 수행하지만 sub가 발견되지 않으면 ValueError를 내보낸다.|
|rindex()|```str.rindex(sub[, start [, end]])```|rfind() 함수와 같은 기능을 수행한다. sub가 발견되지 않으면 ValueError를 내보낸다.|

In [52]:
# find() 함수 사용법

txt = 'Helwlwlwlwlsladskf' # 9, 10, 11
pat = 'wl'

print(txt.find(pat))

3


In [53]:
# rfind() 함수 사용법
print(txt.rfind(pat))

9


In [54]:
# index() 함수 사용법
print(txt.index(pat))

3


In [55]:
# rindex() 함수 사용법
print(txt.rindex(pat))

9


### with 계열 함수로 구현

|함수명|사용법|설명|
|:--:|:---:|:--:|
|startswith()|```str.startswith(prefix[, start [, end]])```|문자열이 prefix로 시작하면 True, 그렇지 않으면 False를 반환한다.|
|endswith()|```str.endswith(suffix[, start [, end]])```|문자열이 suffix로 끝나면 True를, 그렇지 않으면 False를 반환한다.|

In [57]:
# startswith() 함수
print(txt.startswith('he'))
print(txt.startswith('He'))

True

In [59]:
# endsswith() 함수
print(txt.endswith('he'))
print(txt.endswith('f'))

False
True
