# 파이썬에서 정규 표현식을 사용하는 기본적인 사용법

다양한 정규 표현식 패턴
- '^' : 이 패턴으로 시작해야 함
- '$' : 이 패턴으로 종료돼야 함
- '[문자]' : 문자 중에 하나여야 함. 가능한 문자들의 집합을 정의함
- '[^문자]' : [문자]의 반대로, 피해야할 문자들의 집합을 정의함
- '|' :두 패턴 중 하나이어야 함
- '?' :앞 패턴이 없거나 하나이어야 함
- '+' :앞 패턴이 하나 이상이어야 함
- '*' : 앞 패턴이 0개 이상이어야 함
- '패턴{n}' : 앞 패턴이 n번 반복해서 나타나는 경우
- '패턴{n, m}' : 앞 패턴이 최소 n번, 최대 m번 반복해서 나타나는 경우
- '\d' : 숫자 0~9
- '\w' : 문자
- '\s' : 화이트 스페이스(\t, \n, \r, \f)
- '.' : 뉴라인(\n)을 제외한 모든 문자

pattern 객체는 다음과 같은 4가지 메서드를 제공합니다.
- match() : 문자열의 처음부터 정규식과 매치되는지 조사한다.
- search() : 문자열 전체를 검색하여 정규식과 매치되는지 조사한다.
- findall() : 정규식과 매치되는 모든 문자열(substring)을 리스트로 돌려준다.
- finditer() : 정규식과 매치되는 모든 문자열(substring)을 반복 가능한 객체로 돌려준다.

match 객체는 다음과 같은 4가지 메서드를 제공합니다.
- group() : 매치된 문자열을 돌려준다.
- start() : 매치된 문자열의 시작 위치를 돌려준다.
- end() : 매치된 문자열의 끝 위치를 돌려준다.
- span() : 매치된 문자열의 (시작, 끝)에 해당하는 튜플을 돌려준다.

In [1]:
# 1. 모듈 임포트
import re

In [2]:
# 2. 정규 표현식 패턴 컴파일
pattern = re.compile(r'정규표현식 패턴')

In [5]:
# 3. 패턴 매칭 검사
match = pattern.match(문자열)
if match:
    # 매칭됨
else:
    # 매칭되지 않음

bad


In [None]:
# 4. 매칭된 결과 가져오기
match.group()  # 매칭된 전체 문자열 반환
match.group(n)  # n번째 그룹에 매칭된 문자열 반환 (괄호로 그룹화한 패턴에 사용)

In [8]:
# 5. 패턴으로 문자열 검색
search = pattern.search(문자열)
if search:
    # 패턴이 문자열 어디든 매칭됨
else:
    # 패턴이 문자열에 매칭되지 않음

bad


In [10]:
# 6. 패턴에 매칭되는 모든 문자열 찾기
matches = pattern.findall(문자열)

In [11]:
# 7. 패턴으로 문자열 치환
new_string = pattern.sub(치환할_문자열, 문자열)