# 正则re

## 正则类及方法
|对象、方法、模式|描述|
|----|----|
|Pattern正则对象|re.compile创建正则对象，方便复用|
|Match匹配对象|该对象可以查看匹配成功后的组、正则表达式字符串等信息，如果匹配不成功则为None|
|re.split方法|类似s.split,但支持多个分隔符。例如：s = 'aa;bb cc dd', re.split(r';竖\s'),返回['aa','bb','cc','dd']|
|re.findall方法|以列表方式返回所有匹配到的字符串。例如：s = 'Aaaaa Bxxxx dfrswfgvs'，re.findall(r'A\\w+竖B\\w+',s)， 返回['Aaaaa', 'Bxxxx']|
|re.search方法|返回match对象，该对象包含大量匹配到的信息。例如：s = '2016-1-2', match = re.search(r'(\d\*)-(\d\*)-(\d\*)',s), match.group(0)等于s, match.group(1)等于'2016',match.group(2)等于'1',match.group(3)等于'2',|
|re.finditer方法|返回match对象的迭代器，其他同search函数|
|re.sub方法|替换匹配的字符串。例如：s = '2016-1-2'，re.sub(r'(\d*)-(\d*)-(\d*)', r'\g左尖括号2右尖括号/\g左尖括号3右尖括号/\g左尖括号1右尖括号',s) #1/2/2016，如果使用命名分组(?P<year>),则使用\g左尖括号year右尖括号|
|re.S单行模式|使 . 匹配包括换行在内的所有字符。例如：s = """AAA\nBBB"""，re.findall(r"""AAA.*BBB""",s, re.S)，不带re.S返回[]|
|re.M多行模式|在多行模式下，每行都有^\$,否则所有文本只有一个^\$|
|re.I大小写模式|匹配时，忽略大小写模式。例如：re.findall(r'abc', 'Abc', re.I) #['Abc']，不带re.I返回[]|
|re.X注释模式|匹配时，忽略空格符和#注释。例如：re.findall(r"""Abc                   #aaaaaa""", 'Abc', re.X)，不带re.X语法错误|

In [3]:
import re

s = 'aa;bb cc dd'
print re.split(r';|\s',s)

print '--------------'
s = 'Aaaaa Bxxxx dfrswfgvs'
print re.findall(r'A\w+|B\w+',s)

print '--------------'
s = '####2016-1-2'
match = re.search(r'(\d*)-(\d*)-(\d*)',s)
print match.string     #匹配时使用的文本
print match.re         #正则对象
print match.pos         #开始查找位置
print match.endpos      #结束查找位置
print match.lastindex   #最后一个被捕获的分组在文本中的索引，也就是group(3)的下标
print match.lastgroup   #最后一个被捕获的分组的别名。如果这个分组没有别名或者没有被捕获的分组，将为None
print match.groups()    #返回所有捕获组捕获到的信息
print match.groupdict() #返回所有有别名捕获组的信息，如果没有任何别名的捕获组，返回None
print '--------------'
print match.group(0)    #捕获组0，捕获的字符串
print match.group(1)    #捕获组1，捕获的字符串
print match.group(2)    #捕获组2，捕获的字符串
print match.group(3)    #捕获组3，捕获的字符串
print '--------------'
print match.start(0)    #捕获组0，捕获字符串开始位置
print match.start(1)    #捕获组1，捕获字符串开始位置
print match.start(2)    #捕获组2，捕获字符串开始位置
print match.start(3)    #捕获组3，捕获字符串开始位置
print '--------------'
print match.end(0)      #捕获组0，捕获字符串结束位置
print match.end(1)      #捕获组1，捕获字符串结束位置
print match.end(2)      #捕获组2，捕获字符串结束位置
print match.end(3)      #捕获组3，捕获字符串结束位置
print '--------------'
print match.span(1)     #捕获组1，(捕获字符串开始位置,捕获字符串结束位置)
print '--------------'
print match.expand(r'\g<2>/\g<3>/\g<1>')  #重组捕获组的字符串信息
print '--------------'
match = re.search(r'(?P<year>\d*)-(?P<mon>\d*)-(?P<day>\d*)',s)
print match.lastgroup
print match.groupdict()
print match.expand(r'\g<mon>/\g<day>/\g<year>')  #重组捕获组的字符串信息

print '--------------'
print re.sub(r'(?P<year>\d*)-(?P<mon>\d*)-(?P<day>\d*)', r'\g<mon>/\g<day>/\g<year>', s) #匹配后替换

print '--------------'
s = 'Abc'
print re.findall(r'abc',s)
print re.findall(r'abc',s, re.I)   #大小写模式

print '--------------'
s = '''abc
abc'''
print re.findall(r'^abc',s)
print re.findall(r'^abc',s,re.M)   #多行模式

print '--------------'
s = """AAA
BBB"""
print re.findall(r"""AAA.*BBB""",s)
print re.findall(r"""AAA.*BBB""",s, re.S) #单行模式

print '--------------'
s = """AAA
BBB"""
print re.findall(r"""AAA.*BBB       #aaaaaaaaaaaaa""",s, re.S | re.X) #注释模式

print '--------------'
s = 'CCCC2016-1-2'
print re.findall(r'(?=C)\d',s)


['aa', 'bb', 'cc', 'dd']
--------------
['Aaaaa', 'Bxxxx']
--------------
####2016-1-2
<_sre.SRE_Pattern object at 0x000000000394F4D0>
0
12
3
None
('2016', '1', '2')
{}
--------------
2016-1-2
2016
1
2
--------------
4
4
9
11
--------------
12
8
10
12
--------------
(4, 8)
--------------
1/2/2016
--------------
day
{'year': '2016', 'mon': '1', 'day': '2'}
1/2/2016
--------------
####1/2/2016
--------------
[]
['Abc']
--------------
['abc']
['abc', 'abc']
--------------
[]
['AAA\nBBB']
--------------
['AAA\nBBB']
--------------
[]
