## 字符串匹配 

In [1]:
import re

## 字符与字符类
1. 特殊字符：\.^$?+*{}[]()|以上特殊字符要想使用字面值，必须使用\进行转义  
2. 字符类  
1) 包含在[]中的一个或者多个字符被称为字符类，字符类在匹配时如果没有指定量词则只会匹配其中的一个。  
2) 字符类内可以指定范围，比如[a-zA-Z0-9]表示a到z，A到Z，0到9之间的任何一个字符  
3) 左方括号后跟随一个^，表示否定一个字符类，比如[^0-9]表示可以匹配一个任意非数字的字符。  
4) 字符类内部，除了\之外，其他特殊字符不再具备特殊意义，都表示字面值。^放在第一个位置表示否定，放在其他位置表示^本身，-放在中间表示范围，放在字符类中的第一个字符，则表示-本身。  
5) 字符类内部可以使用速记法，比如\d \s \w  
3. 速记法
. 可以匹配除换行符之外的任何字符，如果有re.DOTALL标志，则匹配任意字符包括换行  
\d	匹配一个Unicode数字，如果带re.ASCII，则匹配0-9  
\D 匹配Unicode非数字  
\s	匹配Unicode空白，如果带有re.ASCII，则匹配\t\n\r\f\v中的一个  
\S 匹配Unicode非空白  
\w	匹配Unicode单词字符，如果带有re.ascii,则匹配[a-zA-Z0-9_]中的一个  
\W 匹配Unicode非单子字符  

## 量词 
1. ?	匹配前面的字符0次或1次
2. *	匹配前面的字符0次或多次
3. +	匹配前面的字符1次或者多次
4. {m}	匹配前面表达式m次
5. {m,}	匹配前面表达式至少m次
6. {,n}	匹配前面的正则表达式最多n次
7. {m,n}	匹配前面的正则表达式至少m次，最多n次

## 举例

1.完全匹配5个数字

In [56]:
s = ["pya", "1", "17645"]
pattern = re.compile("\d{5}")

In [57]:
for x in s:
    m = pattern.fullmatch(x)
    if m:
        print(m.string)

17645


2.前三个字符是数字

In [78]:
s = ["pya12", "12345a", "176ab"]
pattern = re.compile("\d{3}")

In [79]:
for x in s:
    m = pattern.match(x)
    if m:
        print(m.string)

12345a
176ab


3.开头是数字

In [64]:
s = ["pya12", "1a", "176ab"]
pattern = re.compile("\d+")

In [65]:
for x in s:
    m = pattern.match(x)
    if m:
        print(m.string)

1a
176ab


4.开头有且仅有三个数字

In [109]:
s = ["pya12", "1a", "176ab1", "12456a", "323"]
pattern = re.compile("\d{3}(\D|$)")

In [107]:
for x in s:
    m = pattern.match(x)
    if m:
        print(m.string)

176ab1
323


5.包含数字字符串的长度为三

In [119]:
s = ["pya12", "1a", "a176ab1", "12456a", "323"]
pattern = re.compile("\d{3}")

In [120]:
for x in s:
    m = pattern.search(x)
    if m:
        print(m.string)

a176ab1
12456a
323


6.包含数字字符串的最大长度为三

In [123]:
s = ["pya12", "1a", "a176ab1", "12456a", "323"]
pattern = re.compile("(^|\D)\d{3}($|\D)")

In [124]:
for x in s:
    m = pattern.match(x)
    if m:
        print(m.string)

a176ab1
323


7.正则返回字典

In [14]:
s = "name:lilei,gender:male"
pattern = re.compile("name:(?P<name>.*),gender:(?P<gender>.*)")
m = pattern.match(s)
m.groupdict()

{'gender': 'male', 'name': 'lilei'}