### 想匹配或者搜索特定模式的文本
#### 匹配字面字符串
* str.startswith()
* str.endswith()
* str.find(): Search for the location of the first occurrence

In [1]:
str = 'I love python how about you'
str.find('how')

14

#### 复杂的匹配需要使用正则表达式和 re 模块。
#### 使用re模块进行匹配和搜索文本的最基本方法。 
* 核心步骤就是先使用 `re.compile()` 编译正则表达式字符串 
将正则表达式的样式编译为一个 正则表达式对象 （Pattern），可以用于匹配

* 然后使用Pattern的`match()` , `findall()` 或者 `finditer()` 等方法。

In [2]:
import re
text1 = '7/24/2019'
text2 = 'Jul 24, 2019'
# Simple matching: \d+ means match one or more digits
date_pattern = re.compile(r'\d+/\d+/\d+')
result = date_pattern.match(text1)
if result:
    print('yes')
else:
    print('no')

yes


match() 总是**从字符串开始去匹配**，如果你想查找字符串任意部分的模式出现位置， 使用 findall() 方法去代替。如果开始位置匹配不成功，返回None.

In [3]:
text3 = 'Today is 7/24/2019'
result = date_pattern.match(text3)
if result:
    print('yes')
else:
    print('no')


no


* `re.findall(pattern, string, flags=0)`:对 string 返回一个匹配列表

In [7]:
text4 = 'Today is 7/24/2019,it is 9/20/2019, 7/24/2019'
date_pattern.findall(text4)

['7/24/2019', '9/20/2019', '7/24/2019']

* `re.finditer(pattern, string, flags=0)`: pattern 在 string 里所有的非重复匹配，返回为一个迭代器 iterator 保存了 匹配对象 。 string 从左到右扫描，匹配按顺序排列。空匹配也包含在结果里。

In [8]:
date_pattern.finditer(text4)

<callable_iterator at 0x1bde48905f8>

In [9]:
[date.group() for date in date_pattern.finditer(text4)]

['7/24/2019', '9/20/2019', '7/24/2019']

#### 捕获分组
* Match.group()
    - m.group(0) # The entire match
    - m.group(1) # The first parenthesized subgroup.
    - m.group(2) # The second parenthesized subgroup.
    - m.group(1,2)  # Multiple arguments give us a tuple.
* Match.groups():返回一个元组，包含所有匹配的子组，在样式中出现的从1到任意多的组合。 
    

In [11]:
p = re.compile(r'(\d+)/(\d+)/(\d+)')
m = p.match(text1)

In [12]:
m.group()

'7/24/2019'

In [15]:
[m.group(i) for i in range(4)]

['7/24/2019', '7', '24', '2019']

In [16]:
m.groups()

('7', '24', '2019')

In [17]:
month, day, year = m.groups()

如果你想精确匹配，确保你的正则表达式以$结尾