## 정규식을 컴파일 할 때 다음 옵션을 사용할 수 있다.
* DOTALL(S) - . 이 줄바꿈 문자를 포함하여 모든 문자와 매치할 수 있도록 한다.
* IGNORECASE(I) - 대소문자에 관계없이 매치할 수 있도록 한다.
* MULTILINE(M) - 여러줄과 매치할 수 있도록 한다. (^, $ 메타문자의 사용과 관계가 있는 옵션이다)
* VERBOSE(X) - verbose 모드를 사용할 수 있도록 한다. (정규식을 보기 편하게 만들수 있고 주석등을 사용할 수 있게된다.)

### DOTALL, S

In [None]:
import re

In [None]:
original_text="""a
b"""
# original_text="a\nb"
p=re.compile("a.b") # 정규식 '.'는 원문에 \n에 대해서 기본 옵션으로 사용하면 패턴 매칭이
                     # 일어나지 않는다.
m = p.match(original_text)
print(m)

In [None]:
p=re.compile("a\nb")# 참고) 정규식에 '\n'을 사용한 경우는 기본 옵션을 사용해도 패턴 매칭
                     # 을 할 수 있다.
m = p.match(original_text)
print(m)

In [None]:
# p=re.compile("a.b", re.DOTALL)
p=re.compile("a.b", re.S)
# 원문의 줄바꿈 '\n'을 매칭 시킬 '.' 이 re.DOTALL 옵션사용시 필요하다.
m = p.match(original_text)
print(m)

### IGNORECASE, I
* re.IGNORECASE 또는 re.I 옵션은 대소문자 구별 없이 매치를 수행할 때 사용하는 옵션

In [None]:
p = re.compile('[a-z]+')
print(p.match('python'))
print(p.match('Python'))
print(p.match('PYTHON'))

In [None]:
p = re.compile('[a-z]+', re.I)
print(p.match('python'))
print(p.match('Python'))
print(p.match('PYTHON'))

### MULTILINE, M

In [None]:
p = re.compile('^impossible', re.I)
print(p.match('Impossible is nothing!'))

In [None]:
p = re.compile('impossible', re.I)
print(p.match('Nothing is impossible')) 

In [None]:
p = re.compile('impossible', re.I)
print(p.search('Impossible is impossible')) # 첫번째 impossible을 매치

In [None]:
p = re.compile('impossible$', re.I)
print(p.search('Impossible is impossible')) # 마지막이 impossible로 끝나는 문자 매치

In [22]:
data = """python one
life is too short
python two
you need python
python three"""

In [23]:
p = re.compile("^python\s\w+")
print(p.findall(data))   # 첫 번째 라인 매치 결과만 반환

['python one']


In [24]:
p = re.compile("^python\s\w+", re.MULTILINE)
print(p.findall(data))   # 모든 라인의 매치 결과만 반환

['python one', 'python two', 'python three']


## VERBOSE, X
* 한 줄로 표현하는 정규식을 여러줄로 표현 할 수 있다.

In [25]:
charref = re.compile(r'&[#](0[0-7]+|[0-9]+|x[0-9a-fA-F]+);')

* 아래에서 컴파일 옵션을 지정하지 않으면 여러줄의 정규식을 쓰면 에러발생

In [26]:
charref = re.compile(r'&[#](0[0-7]+
|[0-9]+|x[0-9a-fA-F]+);') 

SyntaxError: unterminated string literal (detected at line 1) (3720079345.py, line 1)

In [None]:
charref = re.compile(r"""
 &[#]                # Start of a numeric entity reference
 (
     0[0-7]+         # Octal form
   | [0-9]+          # Decimal form
   | x[0-9a-fA-F]+   # Hexadecimal form
 )
 ;                   # Trailing semicolon
""", re.VERBOSE) # 줄바꿈 이후의 공백문자는 컴파일시 제거된다.