In [6]:
# 정규 표현식 사용을 위한 모듈 import
import re
# 정규 표현식의 규칙 지정
pattern = re.compile(r'[a]')
# 정규 표현식 규칙에 문자열을 입력하여 확인
print(pattern.search(r'a'))

<re.Match object; span=(0, 1), match='a'>


In [7]:
import re
# 함수를 바로 호출하는 방식
print(re.search(r'[a]', 'a'))

<re.Match object; span=(0, 1), match='a'>


In [None]:
import re
pattern = re.compile(r'[a]')
text = 'a'
print(pattern.search(text))
# True - <re.Match object; span=(0, 1), match='a'>

text = 'ba'
print(pattern.search(text))
# True - <re.Match object; span=(1, 2), match='a'>

text = 'cd'
print(pattern.search(text))
# False - None

<re.Match object; span=(0, 1), match='a'>
<re.Match object; span=(1, 2), match='a'>
None


In [None]:
# 기호들을 사용한 예시
import re
text = "apple, ape, apricot, banana, apppple"

print(re.search(r"a.p", text)) 
# 'a' + 임의의 문자 + 'p' 
# → <re.Match object; span=(0, 3), match='app'>

print(re.search(r"a[bc]e", "ace abe ace")) 
# a 다음에 b나 c가 오고 e로 끝
# → <re.Match object; span=(0, 3), match='ace'>

print(re.search(r"ap*le", text)) 
# 'a' + 'p' 0회 이상 + 'le'
# → <re.Match object; span=(0, 5), match='apple'>

print(re.search(r"ap+le", text)) 
# 'a' + 'p' 1회 이상 + 'le'
# → <re.Match object; span=(0, 5), match='apple'>

print(re.search(r"ap{2}le", text)) 
# 'a' + 'p' 2번 + 'le'
# → <re.Match object; span=(0, 5), match='apple'>

print(re.search(r"ap?le", text)) 
# 'p'가 0번 또는 1번
# → None

<re.Match object; span=(0, 3), match='app'>
<re.Match object; span=(0, 3), match='ace'>
<re.Match object; span=(0, 5), match='apple'>
<re.Match object; span=(0, 5), match='apple'>
<re.Match object; span=(0, 5), match='apple'>
None


In [None]:
# ^ 기호 - 시작
import re
pattern = re.compile(r'^abc')
print(pattern.search('abc')) # 'a' 로 시작하고 bc
print(pattern.search('ab'))
print(pattern.search('가bc'))

<re.Match object; span=(0, 3), match='abc'>
None
None


In [None]:
# ^ 기호 - 부정
import re
pattern = re.compile('[^abc]')
print(pattern.search('a'))
print(pattern.search('b'))
print(pattern.search('c'))
print(pattern.search('가')) # 'a' 또는 'b' 또는 'c' 아님

In [10]:
# $ 기호 - 끝
import re
pattern = re.compile(r'\w+[.]$')
print(pattern.search('Hello.')) # 문자 1개 이상 + 마지막 .
print(pattern.search('Hi~'))

<re.Match object; span=(0, 6), match='Hello.'>
None


In [12]:
# | 기호 - 또는
import re
pattern = re.compile(r'^Hello|.*Bye.$|.*Good.*')
print(pattern.search('Hello~')) # 시작 Hello
print(pattern.search('Bye.')) # 마지막 Bye.
print(pattern.search('Hi~ Good End')) # Good 포함

<re.Match object; span=(0, 5), match='Hello'>
<re.Match object; span=(0, 4), match='Bye.'>
<re.Match object; span=(0, 12), match='Hi~ Good End'>


In [14]:
# () 정규식 그룹화 (index)
import re
pattern = re.compile(r'(\d{3})-(\d{4})-(\d{4})')
result = pattern.search('010-8478-8181')
print(result.group())
print(result.group(0))
print(result.group(1))
print(result.group(2))
print(result.group(3))

010-8478-8181
010-8478-8181
010
8478
8181


In [15]:
# () 정규식 그룹화 (name)
import re
pattern = re.compile(r'(?P<a>\d{3})-(?P<b>\d{4})-(?P<c>\d{4})')
result = pattern.search('010-8478-8181')
print(result.groupdict()) # Dictionary 형태로 접근 가능
print(result.group())
print(result.group(0))
print(result.group('a')) # result.group(1)
print(result.group('b')) # result.group(2)
print(result.group('c')) # result.group(3)

{'a': '010', 'b': '8478', 'c': '8181'}
010-8478-8181
010-8478-8181
010
8478
8181


In [None]:
# 긍정 전방 탐색 (?=...)
import re

text = "user@example.com user2 user3"

result = re.search(r"\w+(?=@)", text)
print(result)  # <re.Match object; span=(0, 4), match='user'>

result2 = re.search(r"\w+[^@]", text)
print(result2)  # <re.Match object; span=(0, 4), match='user'>

result3 = re.search(r"(\w+)@", text)
print(result3)  # <re.Match object; span=(0, 5), match='user@'>
print(result3.group(1))  # user

<re.Match object; span=(0, 4), match='user'>
<re.Match object; span=(0, 4), match='user'>
<re.Match object; span=(0, 5), match='user@'>
user


In [45]:
# 부정 전방 탐색 (?!...)
import re

text = "foobar fooqux"

result = re.search(r"foo(?!bar)", text)
print(result)  # <re.Match object; span=(7, 10), match='foo'>

<re.Match object; span=(7, 10), match='foo'>


In [46]:
# 긍정 후방 탐색 (?<=...)
import re

text = "user@example.com"

result = re.search(r"(?<=@)\w+", text)
print(result)  # <re.Match object; span=(5, 12), match='example'>

<re.Match object; span=(5, 12), match='example'>


In [None]:
# 부정 후방 탐색 (?<!...)
import re

text = "123 $456 789"

result = re.search(r"(?<!\$)\d+", text)
print(result)  # <re.Match object; span=(0, 3), match='123'>

<re.Match object; span=(0, 3), match='123'>


In [None]:
# 탐색 사용 예시 - ERROR 뒤의 숫자 코드만 확인
import re

text = """
INFO: 200 OK
ERROR: 404 Not Found
DEBUG: process started
ERROR: 500 Internal Server Error
"""

# 그룹 캡처 방식 → ERROR: 까지 패턴에 포함됨
pattern1 = re.compile(r'ERROR: (\d+)')
print("그룹 캡처:", pattern1.search(text))

# Lookbehind 방식 → ERROR: 는 결과에 포함되지 않음
pattern2 = re.compile(r'(?<=ERROR: )\d+')
print("탐색 사용:", pattern2.search(text))

그룹 캡처: <re.Match object; span=(14, 24), match='ERROR: 404'>
탐색 사용: <re.Match object; span=(21, 24), match='404'>
