问题：你想匹配或者搜索特定模式的文本  
解决方法：正则表达式

In [2]:
# 预编译
import re

text1 = '11/27/2012'

date_pattern = re.compile(r'\d+/\d+/\d+')

re.match(date_pattern, text1)


<_sre.SRE_Match object; span=(0, 10), match='11/27/2012'>

In [3]:
# match() 总是从字符串开始去匹配，如果你想查找字符串任意部分的模式出现位置， 使用 findall() 方法去代替。

text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
date_pattern.findall(text)


['11/27/2012', '3/13/2013']

In [10]:
# 定义正则时，会使用括号捕获分组
date_pattern_1 = re.compile(r'(\d+)/(\d+)/(\d+)')

m = date_pattern_1.match('11/27/2012')
print(m)
print(m.group(0))
print(m.group(1))
print(m.group(2))
print(m.group(3))

print(m.groups())
month, day, year = m.group()


<_sre.SRE_Match object; span=(0, 10), match='11/27/2012'>
11/27/2012
11
27
2012
('11', '27', '2012')


In [16]:
# findall() 方法会搜索文本并以列表形式返回所有的匹配。 如果你想以迭代方式返回匹配，可以使用 finditer() 方法来代替
for m in date_pattern_1.finditer('Today is 11/27/2012. PyCon starts 3/13/2013.'):
    print(m.groups())

('11', '27', '2012')
('3', '13', '2013')


综述：如果你打算做大量的匹配和搜索操作的话，最好先编译正则表达式，然后再重复使用它。 模块级别的函数会将最近编译过的模式缓存起来，因此并不会消耗太多的性能， 但是如果使用预编译模式的话，你将会减少查找和一些额外的处理损耗。