완전 탐색 

텍스트 전체를 순회하며 패턴과 일치하는 부분을 하나씩 직접 비교

**Brute Force** 방식은 텍스트의 각 위치마다 패턴과의 일치 여부를 전부 확인
시간 복잡도는 $O(N×M)$(최악의 경우)이나, 
**단순하고 직관적**으로 구현 가능한 장점이 있음


코드 구현 

- 패턴을 찾았다면 패턴이 등장하는 인덱스 반환 
- 찾지 못했다면 -1 반환 

In [1]:
# WHILE문 구현 1

# 전체 텍스트 
t = 'A pattern matching algorithm'
# 검색할 패턴 
p = 'rithm'

N = len(t) # 전체 텍스트 길이 
M = len(p) # 찾을 패턴의 길이 

def brute_force_while1(p, t):
    """
    t[i]와 p[j]가 다를 경우, 
    i를 (현재 i-j)로 되돌린 뒤 j를 -1로 만들어 재정렬하는 방식 
    음..?
    """
    i = 0 # 텍스트 t의 인덱스 
    j = 0 # 패턴 p의 인덱스 

    while i < N and j < M:
        if t[i] != p[j]:
            # 불일치 시, 비교 시작 위치를 한 칸씩 앞으로 이동 
            i = i - j 
            j = -1
        i += 1
        j += 1

    if j == M:
        return i - M
    else: 
        return -1
print(N, M)    
print(brute_force_while1(p, t))

28 5
23


In [2]:
# WHILE문 구현 2

# 전체 텍스트 
t = 'A pattern matching algorithm'
# 검색할 패턴 
p = 'rithm'

def brute_force_while2(p, t):
    i = 0 
    j = 0

    while i < N and j < M:
        if t[i] != p[j]:
            i = i - j + 1 
            j = 0 
        else:
            i += 1
            j += 1
    if j == M:
        return i - j 
    else:
        return -1
    
print(brute_force_while2(p, t))


23


In [5]:
# FOR문 구현 
t = 'A pattern matching algorithm'
p = 'rithm'

N = len(t)  # 전체 텍스트 길이
M = len(p)  # 패턴 길이

def brute_force_for(p, t):
    '''
    고지식한 알고리즘(Brute Force) - for문 구현
    텍스트를 순회하며 패턴의 각 문자와 일치 여부를 확인
    '''
    N = len(t)
    M = len(p)

    # i: 텍스트에서 패턴이 시작될 수 있는 모든 위치를 순회
    for i in range(N - M + 1):
        cnt = 0
        # j: 패턴 내부를 순회하며 매칭 확인
        for j in range(M):
            if t[i + j] == p[j]:
                cnt += 1
            else:
                # 불일치 발생 시, 내부 반복 탈출
                break

        # cnt가 M과 같다면 패턴 전체가 일치
        if cnt == M:
            return i
            
    # 패턴을 찾지 못한 경우
    return -1

print(brute_force_for(p, t))

23


In [7]:
# [응용] 패턴 등장 횟수 세기 
def brute_force_while2_count(p, t):
    '''
    고지식한 문자열 검색(Brute Force) - while문(두 번째 버전)에
    "패턴이 몇 번 등장하는지"를 세는 기능을 추가한 코드.

    - p: 패턴
    - t: 전체 텍스트
    - 반환값: p가 t 내에서 몇 번 등장하는지 나타내는 정수
    '''
    N = len(t)
    M = len(p)

    i = 0  # 텍스트 t 인덱스
    j = 0  # 패턴 p 인덱스
    count = 0  # 패턴 등장 횟수 누적

    # 텍스트 전체를 끝까지 순회
    while i < N:
        # 만약 문자가 일치하면
        if j < M and t[i] == p[j]:
            i += 1
            j += 1
            
            # 패턴 전체를 매칭한 경우 (j == M)
            if j == M:
                count += 1          # 등장 횟수 증가
                # 다음 위치로 진행 (겹치는 패턴도 검사 가능하도록)
                # 가장 간단한 방식: 패턴 재시작 (j=0), 그리고 현재 i 위치에서 계속
                j = 0  
        else:
            # 불일치 시
            i = i - j + 1  # 시작 위치를 한 칸 뒤로
            j = 0          # 패턴 인덱스 리셋

    return count


text = "ababcabcababc"
pattern = "abc"

result = brute_force_while2_count(pattern, text)
print(f"'{pattern}' 패턴은 '{text}'에서 총 {result}번 등장")

'abc' 패턴은 'ababcabcababc'에서 총 3번 등장
