## 정규식을 컴파일 할 경우 다음 옵션을 사용할 수 있다.
* DOTALL(S) - . 이 줄바꿈 문자를 포함하여 모든 문자와 매치할 수 있도록 한다.
* IGNORECASE(I) - 대소문자에 관계없이 매치할 수 있도록 한다.
* MULTILINE(M) - 여러줄과 매치할 수 있도록 한다. (^, $ 메타문자의 사용과 관계가 있는 옵션이다)
* VERBOSE(X) - verbose 모드를 사용할 수 있도록 한다. (정규식을 보기 편하게 만들수 있고 주석등을 사용할 수 있게된다.)

## DOTALL (S)

In [1]:
import re

In [2]:
original_text = """a
b"""
p = re.compile("a.b")
m = p.match(original_text)
print(m)

None


In [3]:
original_text = """a
b"""
p = re.compile("a\nb")
m = p.match(original_text)
print(m)

<re.Match object; span=(0, 3), match='a\nb'>


In [4]:
p = re.compile("a.b",re.DOTALL)
m = p.match(original_text)
print(m)

<re.Match object; span=(0, 3), match='a\nb'>


In [5]:
p = re.compile("a.b",re.S)
m = p.match(original_text)
print(m)

<re.Match object; span=(0, 3), match='a\nb'>


## IGNORECASE (I)
* 해당 옵션은 대소문자 구별없이 매치를 수행 할 때 사용하는 옵션

In [10]:
p = re.compile("[a-z]+",re.I)
print(p.match('python'))
print(p.match('Python'))
print(p.match('PYTHON'))

<re.Match object; span=(0, 6), match='python'>
<re.Match object; span=(0, 6), match='Python'>
<re.Match object; span=(0, 6), match='PYTHON'>


## MULTILINE (M)

In [11]:
data = """python one
life is too short
python two
you need python
python three"""

In [12]:
p = re.compile("^python\s\w+")
print(p.findall(data))

['python one']


#### => 위 정규식의 문제점 : findall 전체 문자열을 대상으로 검색을 하지만 default로 컴파일 시 첫째 라인의 결과만 반환한다

In [14]:
p = re.compile("^python\s\w+",re.MULTILINE)
print(p.findall(data))

['python one', 'python two', 'python three']


## VERBOSE (X)
* 정규식 가독성을 위해 한 줄로 표현하는 정규식을 여러줄로 표현할 수 있다.

In [15]:
charref = re.compile(r'&[#](0[0-7]+|[0-9]+|x[0-9a-fA-F]+);')

In [16]:
charref = re.compile(r"""
 &[#]                # Start of a numeric entity reference
 (
     0[0-7]+         # Octal form
   | [0-9]+          # Decimal form
   | x[0-9a-fA-F]+   # Hexadecimal form
 )
 ;                   # Trailing semicolon
""", re.VERBOSE) # 줄바꿈 이후의 공백문자는 컴파일시 제거된다.

## 백슬러시 (\문제)

In [18]:
p = re.compile('\section')
p.match('\section') # <= 파이썬에서 \는 escape 문자로 활용

In [21]:
# 아래와 같이 \\ 정규식이 동작하지않는 것은 파이썬에서만 발생하는 문제이다.
# 파이썬의 리터럴 규칙때문에 발생, 유닉스나 vi에서는 문제가 없음.
p = re.compile('\\section')
p.match('\\section')

In [23]:
# 파이썬 정규식 컴파일 구문에서 \\를 표현하기위해 4개가 필요하다.
p = re.compile('\\\\section') 
p.match('\\section')

<re.Match object; span=(0, 8), match='\\section'>

## r옵션 : compile 구문에서 \\\를  raw타입으로 활용하는 옵션

In [24]:
p = re.compile(r'\\section') # r옵션을 사용하면 원래의 사용했던 정규식을 사용할 수 있다
p.match('\\section')

<re.Match object; span=(0, 8), match='\\section'>

### '\\\' 문자를 검색하는 정규식을 작성할 때에는 r옵션을 사용해야함